Ti aiuterà a confrontare vari corsi e trovare l'offerta formativa più conveniente.
Descrizione
Tipologia
Corso
Metodologia
Online
Inizio
Scegli data
Descrizione
La figura del ”data scientist” è un professionista che analizza e interpreta grandi quantità di dati per estrarre informazioni utili e supportare decisioni strategiche. Il suo lavoro combina competenze in statistica, matematica, programmazione e conoscenza dei business o dei settori specifici. I data scientist utilizzano strumenti avanzati, come machine learning e intelligenza artificiale, per costruire modelli predittivi e risolvere problemi complessi. La loro attività può spaziare dall'analisi dei dati aziendali per migliorare l'efficienza operativa, alla creazione di algoritmi per migliorare i prodotti o i servizi offerti da un'azienda
Sedi e date
Luogo
Inizio del corso
Online
Inizio del corso
Scegli dataIscrizioni aperte
Domande e risposte
Aggiungi la tua domanda
I nostri consulenti e altri utenti potranno risponderti
Stiamo controllando la tua domanda per verificare che sia conforme con gli standard di pubblicazione. A parte questo, abbiamo rilevato dalle tue risposte che potresti non essere in grado di immatricolarti a questa formazione. Questo potrebbe essere dovuto al titolo di studio che possiedi, al luogo in cui vivi, ecc. In ogni caso ti consigliamo di verificare contattando il centro di formazione.
Grazie mille!
Stiamo verificando la tua domanda. A breve sarà pubblicata
Preferisci essere contattato dal centro?
Opinioni
Hai seguito questo corso? Condividi la tua opinione
Successi del Centro
2023
2022
2020
Tutti i corsi devono essere aggiornati
La media delle valutazioni dev'essere superiore a 3,7
Più di 50 opinioni degli ultimi 12 mesi
6 anni del centro in Emagister.
Materie
E-learning
Programmazione
Servizi
Statistica
E-business
Programma
Modulo 1: la Classificazione
Contenuti:
Cos'è un problema di classificazione?
Differenza tra classificazione binaria e multi-classe.
Obiettivi degli algoritmi di classificazione.
Panoramica dei principali algoritmi di classificazione.
Modulo 2: Preparazione dei Dati per la Classificazione
Contenuti:
Raccolta e pre-elaborazione dei dati per problemi di classificazione.
Normalizzazione e standardizzazione dei dati.
Gestione dei dati mancanti e codifica delle variabili categoriche.
Suddivisione del dataset in set di addestramento e di test.
Modulo 3: Valutazione delle Prestazioni degli Algoritmi di Classificazione
Contenuti:
le metriche di valutazione: accuratezza, precisione, richiamo, F1-score.
Matrice di confusione.
ROC curve e AUC (Area Under the Curve).
Validazione incrociata (cross-validation) e overfitting.
Modulo 4: la Regressione Logistica
Contenuti:
Cos'è la regressione logistica e come funziona.
Funzione logistica (sigmoide) e probabilità predetta.
Modello di regressione logistica per classificazione binaria.
Interpretazione dei coefficienti del modello.
Modulo 5: Addestramento e Ottimizzazione della Regressione Logistica
Contenuti:
Funzione di perdita della regressione logistica.
Algoritmo di ottimizzazione: discesa del gradiente.
Interpretazione dei parametri: odds ratio e probabilità.
Estensione della regressione logistica a problemi multi-classe (One-vs-Rest).
Modulo 6: Support Vector Machines (SVM)
Contenuti:
Introduzione a SVM: separazione lineare e non lineare.
Concetto di margine e support vectors.
Funzione di costo e obiettivo di massimizzare il margine.
kernel trick per separazioni non lineari.
Modulo 7: Ottimizzazione di una Support Vector Machine
Contenuti:
Funzione di perdita in SVM e ruolo del parametro C.
Uso dei kernel lineari e non lineari (polinomiale, RBF).
SVM per classificazione binaria e multi-classe.
Scelta dei parametri di un SVM: tuning di C e gamma.
Modulo 8: K-Nearest Neighbors (KNN)
Contenuti:
Cos'è KNN e come funziona.
Calcolo della distanza tra i punti (euclidea, Manhattan, etc.).
Funzione di predizione basata sui vicini più prossimi.
KNN per classificazione binaria e multi-classe.
Modulo 9: Ottimizzazione del Modello KNN
Contenuti:
Scelta del parametro K (numero di vicini).
Normalizzazione delle caratteristiche per KNN.
Vantaggi e svantaggi di KNN.
Densità dei dati e impostazioni ottimali di K.
Modulo 10: Confronto tra Regressione Logistica, SVM e KNN
Contenuti:
Analisi comparativa dei tre algoritmi di classificazione.
Pro e contro di ogni algoritmo: complessità computazionale, interpretabilità, adattabilità a problemi non lineari.
Caso di studio su quali algoritmi scegliere in base al tipo di problema.
Modulo 11: Tecniche Avanzate di SVM
Contenuti:
SVM con margine morbido e rigido.
Problemi di classificazione complessi con SVM.
SVM per dati sbilanciati: pesi associati agli errori.
Estensione a classificazione multi-classe con SVM.
Modulo 12: Riduzione della Complessità Computazionale degli Algoritmi
Contenuti:
Tecniche per migliorare l'efficienza computazionale: riduzione dimensionale, selezione delle caratteristiche.
l'algoritmo Principal Component Analysis (PCA).
Riduzione dimensionale per KNN, SVM e regressione logistica.
Modulo 13: Classificazione su Dati sbilanciati
Contenuti:
Problemi di classificazione su dataset sbilanciati.
Tecniche per affrontare il bilanciamento: oversampling, undersampling.
Modifiche nei modelli: cost-sensitive learning e modifiche nelle funzioni di perdita.
Utilizzo delle metriche (Precision, Recall, F1-score) per valutare i modelli su dati sbilanciati.
Modulo 14: Insiemi di Modelli e Random Forests
Contenuti:
Cos'è un ensemble learning.
Random Forests: cos'è, come funziona e quando usarlo.
Combinazione dei risultati da più modelli (bagging).
Vantaggi e svantaggi delle Random Forests rispetto a SVM, KNN e regressione logistica.
Modulo 15: Considerazioni Finali e Sviluppo di Modelli in un Workflow Completo
Contenuti:
Costruzione di un pipeline di machine learning.
Preprocessing dei dati, addestramento e test dei modelli.
Ottimizzazione e tuning dei modelli.
Uso di librerie come Scikit-learn per implementare algoritmi di classificazione.