Corso Big Data Cloudera

Name: Corso Big Data Cloudera
Brand: First Consulting

First Consulting

Corso

A Milano

1001-2000 €

Chiama il centro

02 4539 0100

Hai bisogno di un coach per la formazione?

Ti aiuterà a confrontare vari corsi e trovare l'offerta formativa più conveniente.

Descrizione

Tipologia

Corso
Livello

Livello avanzato
Luogo

Milano

Ore di lezione

40h
Durata

5 Giorni
Inizio

Scegli data

Cloudera Inc. è una società di software statunitense che fornisce software basato su Apache Hadoop con relativo supporto e servizi correlati, e corsi per clienti commerciali.

Sedi e date

Milano

Visualizza mappa

Via dei Valtorta 48, 20127

Inizio del corso

Scegli dataIscrizioni aperte

Profilo del corso

Quali sono gli obiettivi del corso?

Obiettivo del corso è quello di formare lo studente con conoscenze basi e tecniche per lo sviluppo di progetti di importazione dati (Big Data) nel cluster Apache Hadoop e come processarli nell’ecosistema con gli appositi strumenti (Spark, Impala, Hide, Flume e Sqoop).

A chi è diretto?

Programmatori, laureati o diplomati in informatica con nozioni base di programmazione in Java.

Requisiti

Consigliabile ma non indispensabile avere basi di Python e Scala.

Domande e risposte

Aggiungi la tua domanda

I nostri consulenti e altri utenti potranno risponderti

Chi vuoi che ti risponda?

Tutti
Alunni
Centro

Inserisci i tuoi dati per ricevere una risposta

Accetto la Normativa della Privacy e Condizioni.

Pubblicheremo solo il tuo nome e la domanda

Emagister S.L. (Titolare del trattamento dati) utilizzerà i tuoi dati per svolgere attività promozionali (via email e/o telefono), pubblicare recensioni o gestire eventuali segnalazioni. Nella politica sulla privacy potrai conoscere i tuoi diritti e gestire la cancellazione.

Opinioni

Materie

Hadoop
Spark
Pig
Hive
Impala
Yarn
Sqoop
HDFS
Database relazionale
Data management

Professori

First FirstConsulting

Docenti

Programma

Introduction

Hadoop Fundamentals

The Motivation for Hadoop
Hadoop Overview
Data Storage: HDFS
Distributed Data Processing: YARN, MapReduce, and Spark
Data Processing and Analysis: Pig, Hive, and Impala
Database Integration: Sqoop
Other Hadoop Data Tools
Exercise Scenarios

Introduction to Pig

What is Pig?
Pig’s Features
Pig Use Cases
Interacting with Pig

Basic Data Analysis with Pig

Pig Latin Syntax
Loading Data
Simple Data Types
Field Definitions
Data Output
Viewing the Schema
Filtering and Sorting Data
Commonly Used Functions

Processing Complex Data with Pig

Storage Formats
Complex/Nested Data Types
Grouping
Built-In Functions for Complex Data
Iterating Grouped Data

Multi-Dataset Operations with Pig

Techniques for Combining Datasets
Joining Datasets in Pig
Set Operations
Splitting Datasets

Pig Troubleshooting and Optimization

Troubleshooting Pig
Logging
Using Hadoop’s Web UI
Data Sampling and Debugging
Performance Overview
Understanding the Execution Plan
Tips for Improving the Performance of Pig Jobs

Introduction to Hive and Impala

What is Hive?
What is Impala?
Why Use Hive and Impala?
Schema and Data Storage
Comparing Hive and Impala to Traditional Databases
Use Cases

Querying with Hive and Impala

Databases and Tables
Basic Hive and Impala Query Language Syntax
Data Types
Using Hue to Execute Queries
Using Beeline (Hive’s Shell)
Using the Impala Shell

Hive and Impala Data Management

Data Storage
Creating Databases and Tables
Loading Data
Altering Databases and Tables
Simplifying Queries with Views
Storing Query Results
Data Storage and Performance

Relational Data Analysis with Hive and Impala

Joining Datasets
Common Built-In Functions • Aggregation and Windowing

Complex Data with Hive and Impala

Complex Data with Hive
Complex Data with Impala
Analyzing Text with Hive and Impala

Using Regular Expressions with Hive and Impala
Processing Text Data with SerDes in Hive
Sentiment Analysis and n-grams

Hive Optimization

Understanding Query Performance • Bucketing
Indexing Data
Hive on Spark

Impala Optimization

How Impala Executes Queries
Improving Impala Performance

Extending Hive and Impala

Custom SerDes and File Formats in Hive
Data Transformation with Custom Scripts in Hive
User-Defined Functions
Parameterized Queries

Choosing the Best Tool for the Job

Comparing Pig, Hive, Impala, and Relational Databases
Which to Choose?

Conclusion

Chiama il centro

02 4539 0100

Hai bisogno di un coach per la formazione?

Ti aiuterà a confrontare vari corsi e trovare l'offerta formativa più conveniente.

Corso Big Data Cloudera

1001-2000 €

Corso Big Data Cloudera

Domande e risposte

Opinioni

Materie

Programma

Aggiungi corsi similie confrontali per aiutarti a scegliere.

Aggiungi corsi simili
e confrontali per aiutarti a scegliere.