Guida ai Big Data con Spark 2. 0 e R

5.0
1 opinione
  • Avevo bisogno di un corso sui Big Data. Unica pecca: avrei preferito Py Spark e per questo non do il massimo dei voti.
    |

Corso

Online

RISPARMIA 88%
20 € IVA inc.

Hai bisogno di un coach per la formazione?

Ti aiuterà a confrontare vari corsi e trovare l'offerta formativa più conveniente.

Descrizione

  • Tipologia

    Corso

  • Metodologia

    Online

  • Ore di lezione

    8h

  • Inizio

    Scegli data

  • Invio di materiale didattico

  • Servizio di consultazione

  • Tutoraggio personalizzato

  • Lezioni virtuali

Se l’analisi di grossi quantitativi di dati sta diventando sempre di più una necessità, non solo nel campo del marketing, ma anche di settori come la medicina e la diagnostica, da alcuni anni ci si sta ponendo il problema di quali siano le metodologie migliori per trarre quanta più informazione utile possibile dai grandi dataset che possono essere reperiti in vari modi su internet (ad esempio nel caso di analisi di social media) o fanno parte del patrimonio di un’azienda.
Viviamo infatti nell’era dei cosiddetti “Big Data”. Questo termine, coniato attorno al 2001, nasce per indicare enormi dataset che possono essere analizzati per estrarre informazione finora difficilmente accessibile e difficilmente processabile da un solo computer, per quanto potente, ma per analizzare i quali è necessario utilizzare più computer connessi in qualche modo tra loro in maniera coordinata.
Di conseguenza, anche dal lato dell'organizzazione dei dati sono nati dei framework particolari per la gestione di queste grosse quantità di dati, il più recente dei quali è Spark.
Spark, come vedremo, può essere utilizzato con molti linguaggi di programmazione, dei quali R è il più recente. Per questa ragione non tutte le possibili analisi dati possono venire implementate tramite i due pacchetti per la gestione di Spark in linguaggio R, che sono SparkR e sparklyr.
Dopo una parte introduttiva sui Big Data e sui framework che sono stati nel corso degli ultimi anni per gestirli, ci occuperemo quindi di vari argomenti e implementazione di esempi di codice per ognuna di queste due librerie. In particolare vedremo come implementare i più comuni algoritmi di machine learning: regressione, Support Vector Machines, Alberi di decisione, metodi Ensemble e Kmeans, oltre alla manipolazione dati e al calcolo delle statistiche di base

Sedi e date

Luogo

Inizio del corso

Online

Inizio del corso

Scegli dataIscrizioni aperte

Profilo del corso


L'obiettivo finale è riuscire ad analizzare i Big Data tramite SparkR,Capire la nascita e l'evoluzione dei Big Data, a partire da Hadoop,Avere un panorama completo dei framework per i Big Data e della loro evoluzione,Capire l'evoluzione del framework Spark e dei suoi moduli,Impostare un ambiente di lavoro in locale e su Databricks,Importare e analizzare i dati tramite SparkR,Manipolazione dati e machine learning con SparkR,Cenni di database SQL e NoSQL,Manipolazione dati e machine learning con sparklyr,Cenni di Spark Streaming

Conoscere le basi di R e dell'analisi dati

Guida ai Big Data con Spark 2. 0 e R

Domande e risposte

Aggiungi la tua domanda

I nostri consulenti e altri utenti potranno risponderti

Chi vuoi che ti risponda?

Inserisci i tuoi dati per ricevere una risposta

Pubblicheremo solo il tuo nome e la domanda

Opinioni

5.0
  • Avevo bisogno di un corso sui Big Data. Unica pecca: avrei preferito Py Spark e per questo non do il massimo dei voti.
    |
100%
4.8
eccellente

Valutazione del corso

Lo consiglia

Valutazione del Centro

Matteo

5.0
29/01/2020
Sul corso: Avevo bisogno di un corso sui Big Data. Unica pecca: avrei preferito Py Spark e per questo non do il massimo dei voti.
Consiglieresti questo corso?:
*Tutte le opinioni raccolte da Emagister & iAgora sono state verificate

Successi del Centro

2019

Tutti i corsi devono essere aggiornati

La media delle valutazioni dev'essere superiore a 3,7

Più di 50 opinioni degli ultimi 12 mesi

4 anni del centro in Emagister.

Materie

  • SQL
  • Framework
  • Streaming
  • E-learning

Programma

Contenido del curso
Introduzione al corso
Come affrontare e risolvere i problemi più comuni
Come ottenere il rimborso del corso in caso di problemi
CODICE
Introduzione ai Big Data
Le 3 V
Hadoop e il suo ecosistema
Fasi dell'analisi e relative tecnologie
MapReduce vsSpark
Spark vs Hadoop
Introduzione a Spark
La transizione da Spark 1.0 a 2.0
Approfondimento sugli RDD
Modalità di esecuzione di Spark
Il local mode in R
L'utilizzo dei sistemi distribuiti
Utilizzare Spark con Databricks
Strutture dati e astrazioni in Spark per R
Primi passi con SparkR
Formati dati per il data mining in R
Importazione file in R
Spark SQL
Operazioni sui DataFrame
Operazioni sui DataFrame - seconda parte
Statistiche di base con SparkR
Data cleaning con SparkR
I database SQL
I database NoSQL
Il linguaggio SQL in SparkR
Introduzione al machine learning
Machine learning con Spark e R
Metodi supervisionati
Metodi di regressione
Regressione lineare
Esempio di regressione lineare con SparkR
Regressione logistica
Esempio di regressione logistica con SparkR
Support Vector Machines
Esempio di SVM con SparkR
Decision Trees
Esempio di Decision Trees con SparkR
Metodi ensemble
Esempi di metodi ensemble con SparkR
Probabilità e metodi bayesiani
Esempio di Naive Bayes con SparkR
Metodi non supervisionati
Kmeans
Esempi di kmeans con SparkR
Primi passi con sparklyr
Manipolazione dati con sparklyr
sparklyr e il linguaggio SQL
Machine learning con sparklyr
Esempi di regressione lineare con sparklyr
Esempi di regressione logistica con sparklyr
Esempi di Decision Trees con sparklyr
Esempi di metodi ensemble con sparklyr
Esempi di Naive Bayes con sparklyr
LDA
Esempi di LDA con sparklyr
Introduzione alla Social Network Analysis
Le librerie per l'analisi dei grafi
Spark Streaming
Spark Streaming con SparkR
Spark Streaming con sparklyr
Dataset per le esercitazioni con i Big Data

Ulteriori informazioni

A chi è rivolto: Chi ha già conoscenze pregresse di analisi dati con R e si trova ad analizzare dataset più grandi,Chi ha qualche conoscenza delle basi del machine learning
Cosa include il prezzo totale del corso?
Comunicazione diretta col docente, accesso a vita, ampliamenti e aggiornamenti inclusi, rimborso entro 30 giorni.

Hai bisogno di un coach per la formazione?

Ti aiuterà a confrontare vari corsi e trovare l'offerta formativa più conveniente.

Guida ai Big Data con Spark 2. 0 e R

20 € IVA inc.