Ti aiuterà a confrontare vari corsi e trovare l'offerta formativa più conveniente.
Descrizione
Tipologia
Corso
Metodologia
Online
Inizio
Scegli data
Descrizione
La figura del ”data scientist” è un professionista che analizza e interpreta grandi quantità di dati per estrarre informazioni utili e supportare decisioni strategiche. Il suo lavoro combina competenze in statistica, matematica, programmazione e conoscenza dei business o dei settori specifici. I data scientist utilizzano strumenti avanzati, come machine learning e intelligenza artificiale, per costruire modelli predittivi e risolvere problemi complessi. La loro attività può spaziare dall'analisi dei dati aziendali per migliorare l'efficienza operativa, alla creazione di algoritmi per migliorare i prodotti o i servizi offerti da un'azienda
Sedi e date
Luogo
Inizio del corso
Online
Inizio del corso
Scegli dataIscrizioni aperte
Domande e risposte
Aggiungi la tua domanda
I nostri consulenti e altri utenti potranno risponderti
Stiamo controllando la tua domanda per verificare che sia conforme con gli standard di pubblicazione. A parte questo, abbiamo rilevato dalle tue risposte che potresti non essere in grado di immatricolarti a questa formazione. Questo potrebbe essere dovuto al titolo di studio che possiedi, al luogo in cui vivi, ecc. In ogni caso ti consigliamo di verificare contattando il centro di formazione.
Grazie mille!
Stiamo verificando la tua domanda. A breve sarà pubblicata
Preferisci essere contattato dal centro?
Opinioni
Hai seguito questo corso? Condividi la tua opinione
Successi del Centro
2023
2022
2020
Tutti i corsi devono essere aggiornati
La media delle valutazioni dev'essere superiore a 3,7
Più di 50 opinioni degli ultimi 12 mesi
6 anni del centro in Emagister.
Materie
E-learning
Pipeline
Programmazione
Windows
E-business
Programma
Modulo 1: Feature Engineering
Cos'è il Feature Engineering e perché è fondamentale per migliorare le performance dei modelli.
Obiettivi e metodi: dalla raccolta dei dati alla loro trasformazione.
L'importanza di una buona comprensione del dominio dei dati.
Modulo 2: Preparazione dei Dati
Gestione dei dati mancanti e delle anomalie.
Tecniche di imputazione e loro impatti sui modelli.
Normalizzazione e standardizzazione dei dati.
Rimozione dei valori anomali (outliers).
Modulo 3: Preprocessing delle Variabili Categoriali
Encoding delle variabili categoriali: One-Hot Encoding, Label Encoding, e altre tecniche.
Trattamento delle variabili ordinali e nominali.
Utilizzo di tecniche come Target Encoding e Feature Hashing.
Modulo 4: Feature Engineering per Dati Temporali
Rilevamento e creazione di features temporali (giorno della settimana, mese, festività, ecc.).
Tecniche avanzate di estrazione di caratteristiche temporali da serie storiche.
Cicli stagionali e trend nei dati temporali.
Modulo 5: Gestione delle Variabili Testuali
Tecniche di trasformazione del testo: TF-IDF, Word2Vec, GloVe.
Estrazione di informazioni rilevanti dalle descrizioni testuali (entità, relazioni, sentiment).
Creazione di nuove features basate su metadati testuali (lunghezza, conteggio parole, frequenze).
Modulo 6: Feature Engineering per Dati Immagine
Trattamento delle immagini come dati numerici (pixel, colori, risoluzioni).
Utilizzo delle tecniche di deep learning (es. convoluzioni) per estrarre caratteristiche complesse.
Rappresentazione di immagini tramite tecniche di riduzione dimensionale.
Modulo 7: Feature Interaction e Creazione di Nuove Variabili
Creazione di variabili interazioni tra features esistenti (prodotti, somme, differenze).
Tecniche di polinomializzazione e trasformazioni non lineari.
Strategie per scoprire nuove relazioni tra variabili attraverso l'analisi dei dati.
Modulo 8: Riduzione della Dimensionalità
Tecniche di riduzione della dimensionalità: PCA, LDA, t-SNE.
Selezione delle variabili più rilevanti attraverso approcci statistici (ANOVA, Correlazione, etc.).
Approccio alla selezione automatica delle features più significative tramite metodi di albero (Random Forest, XGBoost).
Modulo 9: Feature Engineering per Dati Multivariati
Gestione delle variabili correlate e l'approccio multivariato.
Creazione di features composte da combinazioni lineari e non lineari di variabili.
Tecniche avanzate di selezione e combinazione delle features.
Modulo 10: Approccio Alle Variabili Temporali Complesse
Sfruttamento delle variabili di tipo time series per il rilevamento di pattern complessi.
Creazione di features basate su lags, rolling windows, differenze temporali.
Tecniche di smoothing e aggregazione per ridurre il rumore.
Modulo 11: Feature Engineering per Dati Geospaziali
Creazione di variabili geospaziali: distanza, aree, confini, mappatura.
Uso delle coordinate geografiche per l’analisi spaziale.
Tecniche avanzate di clustering spaziale e analisi dei dati geolocalizzati.
Modulo 12: Feature Scaling e Trasformazioni Avanzate
Approfondimento delle tecniche di scaling avanzate: robust scaling, min-max, log transformation.
Tecniche di trasformazione per la gestione di distribuzioni non normali.
La scelta del miglior tipo di scaling in base al modello di machine learning utilizzato.
Modulo 13: Creazione di Features per Modelli Non Lineari
Come trattare i dati per modelli come le reti neurali e le SVM.
Introduzione a tecniche di feature selection per modelli non lineari.
L’impatto delle funzioni di attivazione (ReLU, Sigmoid) sulla creazione delle variabili.
Modulo 14: L’importanza della Feature Selection
Tecniche di selezione delle caratteristiche: metodi wrapper vs metodi filter.
Algoritmi di selezione delle caratteristiche (Sequential Forward Selection, Recursive Feature Elimination).
Metodi di valutazione dell'importanza delle variabili nei modelli (SHAP, LIME).
Modulo 15: Creazione di Features per Modelli Ensemble
Utilizzo di ensemble methods (Random Forest, Gradient Boosting) per la creazione di nuove variabili.
Come le tecniche di bagging e boosting influiscono sulle scelte delle features.
Approcci avanzati per combinare modelli e features in un'unica pipeline di elaborazione.