Hadoop for Business Analysts
Corso
A Milano
Hai bisogno di un coach per la formazione?
Ti aiuterà a confrontare vari corsi e trovare l'offerta formativa più conveniente.
Descrizione
-
Tipologia
Corso
-
Luogo
Milano
Apache Hadoop è il framework più popolare per l'elaborazione di Big Data Hadoop offre capacità di analisi approfondite e approfondite e sta facendo breccia nel mondo dell'analisi BI tradizionale Questo corso introdurrà un analista ai componenti principali del sistema eco Hadoop e alle sue analisi Pubblico Analisti aziendali Durata tre giorni Formato Lezioni frontali e lezioni in laboratorio .
Machine Translated
Sedi e date
Luogo
Inizio del corso
Inizio del corso
Profilo del corso
programming background with databases / SQL
basic knowledge of Linux (be able to navigate Linux command line, editing files with vi / nano)
Lab environment
Zero Install : There is no need to install hadoop software on students’ machines! A working Hadoop cluster will be provided for students.
Students will need the following
an SSH client (Linux and Mac already have ssh clients, for Windows Putty is recommended)
a browser to access the cluster. We recommend Firefox browser with FoxyProxy extension installed
Opinioni
Materie
- E-business
Programma
- Section 1: Introduction to Hadoop
- hadoop history, concepts
- eco system
- distributions
- high level architecture
- hadoop myths
- hadoop challenges
- hardware / software
- Labs : first look at Hadoop
- Section 2: HDFS Overview
- concepts (horizontal scaling, replication, data locality, rack awareness)
- architecture (Namenode, Secondary namenode, Data node)
- data integrity
- future of HDFS : Namenode HA, Federation
- labs : Interacting with HDFS
- Section 3 : Map Reduce Overview
- mapreduce concepts
- daemons : jobtracker / tasktracker
- phases : driver, mapper, shuffle/sort, reducer
- Thinking in map reduce
- Future of mapreduce (yarn)
- labs : Running a Map Reduce program
- Section 4 : Pig
- pig vs java map reduce
- pig latin language
- user defined functions
- understanding pig job flow
- basic data analysis with Pig
- complex data analysis with Pig
- multi datasets with Pig
- advanced concepts
- lab : writing pig scripts to analyze / transform data
- Section 5: Hive
- hive concepts
- architecture
- SQL support in Hive
- data types
- table creation and queries
- Hive data management
- partitions & joins
- text analytics
- labs (multiple) : creating Hive tables and running queries, joins , using partitions, using text analytics functions
- Section 6: BI Tools for Hadoop
- BI tools and Hadoop
- Overview of current BI tools landscape
- Choosing the best tool for the job
Hai bisogno di un coach per la formazione?
Ti aiuterà a confrontare vari corsi e trovare l'offerta formativa più conveniente.
Hadoop for Business Analysts