Cloudera Data Developer

Corso

Online

2.220 € +IVA

Chiama il centro

Hai bisogno di un coach per la formazione?

Ti aiuterà a confrontare vari corsi e trovare l'offerta formativa più conveniente.

Descrizione

  • Tipologia

    Corso intensivo

  • Metodologia

    Online

  • Lingue

    Italiano

  • Durata

    5 Giorni

  • Inizio

    Scegli data

Il centro Personal Computing Studio S.r.l. presenta sul portale di Emagister il corso Cloudera II - Spark and Hadoop Developer.

Al termine del corso gli allievi avranno acquisito tutti gli elementi necessari all'implementazione di piattaforme Big Data per l’analisi ed il processamento dei dati.

Sedi e date

Luogo

Inizio del corso

Online

Inizio del corso

Scegli dataIscrizioni aperte

Profilo del corso

Sviluppatore

Buona conoscenza della programmazione strutturata derivata dall’uso di un qualsiasi linguaggio di programmazione
Buona conoscenza dei database e del SQL
Buona conoscenza del sistema operativo Linux

Domande e risposte

Aggiungi la tua domanda

I nostri consulenti e altri utenti potranno risponderti

Chi vuoi che ti risponda?

Inserisci i tuoi dati per ricevere una risposta

Pubblicheremo solo il tuo nome e la domanda

Opinioni

Successi del Centro

2023
2022
2021
2020
2019
2018

Tutti i corsi devono essere aggiornati

La media delle valutazioni dev'essere superiore a 3,7

Più di 50 opinioni degli ultimi 12 mesi

6 anni del centro in Emagister.

Materie

  • MySQL
  • Informatica
  • Computer
  • Data
  • Hadoop
  • Spark
  • Sqoop
  • Sviluppatori web
  • Cloudera
  • Hadoop developper

Professori

Docente Senior (min. 5 anni)

Docente Senior (min. 5 anni)

Docente Senior (min. 5 anni)

Programma

Data Ingestion

  • Essere in grado di trasferire i dati tra sistemi esterni ed il tuo cluster
  • Importare dati da Mysql dentro HDFS usando Sqoop
  • Esporta i dati su database Mysql usando Sqoop
  • Cambiare le strutture dei file durante gli import usando Sqoop
  • Fare ingestion dei dati dentro HDFS con streaming real-time e near real time
  • Processare streaming di dati come questi vengono caricati sul cluster
  • Caricare i dati dentro e fuori hdfs usando i comandi shell

Trasformare, memorizzare e strutturare i dati

  • Convertire un set di dati in un dato formato memorizzato in hdfs dentro un nuovo formato e scriverlo sempre in hdfs
  • Caricare i dati RDD da hdfs usando Spark
  • Scrivere i dati RDD in hdfs usando Spark

Leggere e scrivere file in vari modi

  • Performare flussi di estrazioni, trasformazioni e caricamento sui dati per fare Data Analysis
  • Usare SparkSQL per interagire con il metastore programmativamente nelle tue applicazioni
  • Capire i fondamenti di interrogare i dataset con Spark
  • Filtrare i dati usando Spark
  • Scrivere interrogazioni che creano statistiche di dati aggregati
  • Incrociare tipologie di database differenti usando Spark
  • Produrre dati ordinati e classificati

Configurazione

  • Usare opzioni su linea di comando per cambiare la tua configurazione
  • Come incrementare la memoria disponibile

Differenze tra Spark1 e Spark2

Ulteriori informazioni

Materiale didattico e relativo prezzo da concordare.

Natura del corso: Operativo (previsti lab su PC).

Chiama il centro

Hai bisogno di un coach per la formazione?

Ti aiuterà a confrontare vari corsi e trovare l'offerta formativa più conveniente.

Cloudera Data Developer

2.220 € +IVA