Apache Arrow for Data Analysis across Disparate Data Sources
Corso
A Milano
Hai bisogno di un coach per la formazione?
Ti aiuterà a confrontare vari corsi e trovare l'offerta formativa più conveniente.
Descrizione
-
Tipologia
Corso
-
Luogo
Milano
Apache Arrow è un framework di elaborazione dati inmemorabile opensource Viene spesso utilizzato insieme ad altri strumenti di scienza dei dati per accedere a diversi archivi di dati per l'analisi Si integra bene con altre tecnologie come database GPU, librerie e strumenti di apprendimento automatico, motori di esecuzione e framework di visualizzazione dei dati In questo corso di formazione in diretta con istruttore, i partecipanti impareranno ad integrare Apache Arrow con vari framework Data Science per accedere ai dati da fonti di dati disparate Alla fine di questa formazione, i partecipanti saranno in grado di: Installa e configura Apache Arrow in un ambiente distribuito in cluster Utilizzare Apache Arrow per accedere ai dati da diverse fonti di dati Usa Apache Arrow per bypassare la necessità di costruire e mantenere pipeline ETL complesse Analizza i dati su diverse fonti di dati senza doverli consolidare in un repository centralizzato Pubblico Scienziati di dati Ingegneri dei dati Formato del corso Lezione di parte, discussione parziale, esercitazioni e pratica intensiva Nota Per richiedere una formazione personalizzata per questo corso, vi preghiamo di contattarci per organizzare .
Machine Translated
Sedi e date
Luogo
Inizio del corso
Inizio del corso
Profilo del corso
A basic undersanding of SQL
Familiarity with Python or R
Some familiarity with Apache Spark
Opinioni
Materie
- Framework
- Apache
Programma
Introduction
- Apache Arrow vs Parquet
Installing and Configuring Apache Arrow
Overview of Apache Arrow Features and Architecture
Exploring Data with Pandas and Apache Arrow
Exploring Data with Spark and Apache Arrow
Exploring Data with R and Apache Arrow
Exploring Data with MapD and Apache Arrow
Other Data Analysis Integrations
- PySpark, Parquet files on S3, and Oracle tables and Elasticsearch indices
Troubleshooting
Summary and Conclusion
Hai bisogno di un coach per la formazione?
Ti aiuterà a confrontare vari corsi e trovare l'offerta formativa più conveniente.
Apache Arrow for Data Analysis across Disparate Data Sources