Corso di Data Wrangling e Preparazione dei Dati

Corso

Online

250 € IVA inc.

Chiama il centro

Hai bisogno di un coach per la formazione?

Ti aiuterà a confrontare vari corsi e trovare l'offerta formativa più conveniente.

Descrizione

  • Tipologia

    Corso

  • Metodologia

    Online

  • Inizio

    Scegli data

La figura del ”data scientist” è un professionista che analizza e interpreta grandi quantità di dati per estrarre informazioni utili e supportare decisioni strategiche. Il suo lavoro combina competenze in statistica, matematica, programmazione e conoscenza dei business o dei settori specifici. I data scientist utilizzano strumenti avanzati, come machine learning e intelligenza artificiale, per costruire modelli predittivi e risolvere problemi complessi. La loro attività può spaziare dall'analisi dei dati aziendali per migliorare l'efficienza operativa, alla creazione di algoritmi per migliorare i prodotti o i servizi offerti da un'azienda

Sedi e date

Luogo

Inizio del corso

Online

Inizio del corso

Scegli dataIscrizioni aperte

Domande e risposte

Aggiungi la tua domanda

I nostri consulenti e altri utenti potranno risponderti

Chi vuoi che ti risponda?

Inserisci i tuoi dati per ricevere una risposta

Pubblicheremo solo il tuo nome e la domanda

Emagister S.L. (Titolare del trattamento dati) utilizzerà i tuoi dati per svolgere attività promozionali (via email e/o telefono), pubblicare recensioni o gestire eventuali segnalazioni. Nella politica sulla privacy potrai conoscere i tuoi diritti e gestire la cancellazione.

Opinioni

Successi del Centro

2023
2022
2020

Tutti i corsi devono essere aggiornati

La media delle valutazioni dev'essere superiore a 3,7

Più di 50 opinioni degli ultimi 12 mesi

6 anni del centro in Emagister.

Materie

  • E-learning
  • Programmazione
  • Analisi dati
  • SQL
  • E-business

Programma

Modulo 1: Data Wrangling Cos’è il Data Wrangling e perché è cruciale per l'analisi dei dati Il ciclo di vita dei dati: dalla raccolta alla preparazione Sfide comuni nel data wrangling Modulo 2: Tipi di Dati e Strutture Tipi di dati: numerici, categorici, date e stringhe Strutture dei dati: tabelle, serie temporali, grafi Differenza tra dati strutturati, semi-strutturati e non strutturati Modulo 3: Raccolta e Importazione dei Dati Fonti di dati: database, API, file CSV, Excel, JSON, ecc. Tecniche di importazione dei dati in diversi formati Preparazione dei dati per l'importazione (pulizia preliminare) Modulo 4: Pulizia dei Dati - Gestione dei Valori Mancanti Rilevamento di valori mancanti nei dataset Tecniche di gestione dei dati mancanti: imputazione, rimozione, sostituzione Analisi dell’impatto dei valori mancanti sull’analisi dei dati Modulo 5: Rimozione e Gestione dei Duplicati Come rilevare i duplicati nei dati Tecniche per rimuovere o aggregare i duplicati Implicazioni dei duplicati nell’analisi Modulo 6: Correzione degli Errori nei Dati Identificazione di errori comuni nei dati (formati errati, incongruenze) Strategie di correzione automatica e manuale degli errori Validazione dei dati per garantire qualità e coerenza Modulo 7: Trasformazione dei Dati Normalizzazione e standardizzazione dei dati Conversione tra unità di misura e formati Creazione di nuove variabili (es. variabili derivate, aggregazioni) Modulo 8: Codifica e Trasformazione delle Variabili Categoriche Tecniche di codifica delle variabili categoriche: one-hot encoding, label encoding Problemi legati alle variabili categoriche nelle analisi statistiche Gestione delle variabili ordinali e nominali Modulo 9: Gestione delle Variabili Temporali Trattamento dei dati temporali (date e orari) Parsing e formattazione delle date Estrazione di caratteristiche temporali (giorno, mese, anno, week number, festività) Modulo 10: Filtraggio e Selezione dei Dati Filtrare i dati in base a condizioni specifiche Selezionare sottogruppi significativi di dati per analisi mirate L’uso di ragionamento logico nella selezione dei dati Modulo 11: Aggregazione e Raggruppamento dei Dati Tecniche di aggregazione: somma, media, conteggio, mediana Raggruppamento dei dati per categorie o periodi temporali Creazione di report aggregati e di riepilogo Modulo 12: Unione e Fusione dei Dati Tecniche di unione di dataset: join, merge, concat Differenza tra inner join, left join, right join e outer join Gestione delle chiavi primarie e delle chiavi esterne nei dati Modulo 13: Riduzione della Dimensione dei Dati Tecniche di riduzione della dimensione: PCA (Principal Component Analysis), selezione delle caratteristiche Quando e perché ridurre la dimensione dei dati Implicazioni della riduzione dei dati per le analisi e i modelli Modulo 14: Visualizzazione dei Dati per la Pulizia Tecniche di visualizzazione per rilevare anomalie nei dati (grafici a dispersione, box plot) Usare la visualizzazione per facilitare il processo di pulizia Strumenti e librerie per la visualizzazione dei dati (teoria, senza riferimenti a software specifici) Modulo 15: Introduzione agli Strumenti di Data Wrangling Panoramica degli strumenti e delle librerie comuni per il data wrangling (es. Pandas, R, SQL) Considerazioni sull’automazione del data wrangling Best practices e approcci per mantenere i dati puliti e gestibili nel tempo

Chiama il centro

Hai bisogno di un coach per la formazione?

Ti aiuterà a confrontare vari corsi e trovare l'offerta formativa più conveniente.

Corso di Data Wrangling e Preparazione dei Dati

250 € IVA inc.