Cloudera Data Developer
Corso
Online
Hai bisogno di un coach per la formazione?
Ti aiuterà a confrontare vari corsi e trovare l'offerta formativa più conveniente.
Descrizione
-
Tipologia
Corso intensivo
-
Metodologia
Online
-
Lingue
Italiano
-
Durata
5 Giorni
-
Inizio
Scegli data
Il centro Personal Computing Studio S.r.l. presenta sul portale di Emagister il corso Cloudera II - Spark and Hadoop Developer.
Al termine del corso gli allievi avranno acquisito tutti gli elementi necessari all'implementazione di piattaforme Big Data per l’analisi ed il processamento dei dati.
Sedi e date
Luogo
Inizio del corso
Inizio del corso
Profilo del corso
Sviluppatore
Buona conoscenza della programmazione strutturata derivata dall’uso di un qualsiasi linguaggio di programmazione
Buona conoscenza dei database e del SQL
Buona conoscenza del sistema operativo Linux
Opinioni
Successi del Centro
Tutti i corsi devono essere aggiornati
La media delle valutazioni dev'essere superiore a 3,7
Più di 50 opinioni degli ultimi 12 mesi
6 anni del centro in Emagister.
Materie
- MySQL
- Informatica
- Computer
- Data
- Hadoop
- Spark
- Sqoop
- Sviluppatori web
- Cloudera
- Hadoop developper
Professori
Docente Senior (min. 5 anni)
Docente Senior (min. 5 anni)
Programma
Data Ingestion
- Essere in grado di trasferire i dati tra sistemi esterni ed il tuo cluster
- Importare dati da Mysql dentro HDFS usando Sqoop
- Esporta i dati su database Mysql usando Sqoop
- Cambiare le strutture dei file durante gli import usando Sqoop
- Fare ingestion dei dati dentro HDFS con streaming real-time e near real time
- Processare streaming di dati come questi vengono caricati sul cluster
- Caricare i dati dentro e fuori hdfs usando i comandi shell
Trasformare, memorizzare e strutturare i dati
- Convertire un set di dati in un dato formato memorizzato in hdfs dentro un nuovo formato e scriverlo sempre in hdfs
- Caricare i dati RDD da hdfs usando Spark
- Scrivere i dati RDD in hdfs usando Spark
Leggere e scrivere file in vari modi
- Performare flussi di estrazioni, trasformazioni e caricamento sui dati per fare Data Analysis
- Usare SparkSQL per interagire con il metastore programmativamente nelle tue applicazioni
- Capire i fondamenti di interrogare i dataset con Spark
- Filtrare i dati usando Spark
- Scrivere interrogazioni che creano statistiche di dati aggregati
- Incrociare tipologie di database differenti usando Spark
- Produrre dati ordinati e classificati
Configurazione
- Usare opzioni su linea di comando per cambiare la tua configurazione
- Come incrementare la memoria disponibile
Differenze tra Spark1 e Spark2
Ulteriori informazioni
Natura del corso: Operativo (previsti lab su PC).
Hai bisogno di un coach per la formazione?
Ti aiuterà a confrontare vari corsi e trovare l'offerta formativa più conveniente.
Cloudera Data Developer