Ti aiuterà a confrontare vari corsi e trovare l'offerta formativa più conveniente.
Descrizione
Tipologia
Corso
Metodologia
Online
Inizio
Scegli data
Descrizione
la figura del Data Analyst è un professionista che si occupa di raccogliere, elaborare e analizzare i dati per fornire informazioni utili a supportare le decisioni aziendali. Utilizza strumenti e tecniche statistiche per interpretare grandi quantità di dati, identificare tendenze, pattern e anomalie, e presentare i risultati in modo chiaro e comprensibile. Il suo lavoro aiuta le organizzazioni a ottimizzare i processi, migliorare le performance e prendere decisioni basate su evidenze quantitative.
Sedi e date
Luogo
Inizio del corso
Online
Inizio del corso
Scegli dataIscrizioni aperte
Domande e risposte
Aggiungi la tua domanda
I nostri consulenti e altri utenti potranno risponderti
Stiamo controllando la tua domanda per verificare che sia conforme con gli standard di pubblicazione. A parte questo, abbiamo rilevato dalle tue risposte che potresti non essere in grado di immatricolarti a questa formazione. Questo potrebbe essere dovuto al titolo di studio che possiedi, al luogo in cui vivi, ecc. In ogni caso ti consigliamo di verificare contattando il centro di formazione.
Grazie mille!
Stiamo verificando la tua domanda. A breve sarà pubblicata
Preferisci essere contattato dal centro?
Opinioni
Hai seguito questo corso? Condividi la tua opinione
Successi del Centro
2023
2022
2020
Tutti i corsi devono essere aggiornati
La media delle valutazioni dev'essere superiore a 3,7
Più di 50 opinioni degli ultimi 12 mesi
6 anni del centro in Emagister.
Materie
E-learning
Clustering
Python
Analisi dati
Statistica
Programma
Modulo 1: la Data Science per l'IT
Cos'è la Data Science e come si integra nel mondo IT.
Il ciclo di vita dei dati: raccolta, pulizia, analisi e visualizzazione.
Tecniche di analisi dei dati per supportare le decisioni aziendali.
Ruolo di Data Scientist vs Data Analyst e altre figure nel team di Data Science.
Modulo 2: Fondamenti di Statistica per l'IT
Concetti di base della statistica: popolazione, campione, variabili e distribuzioni.
Statistiche descrittive: media, mediana, moda, deviazione standard.
Probabilità e distribuzioni di probabilità: normale, binomiale, Poisson.
Introduzione ai test di ipotesi e ai concetti di significatività statistica.
Modulo 3: Raccolta e Preparazione dei Dati
Tipi di dati: strutturati, non strutturati, semi-strutturati.
Metodi di raccolta dei dati (database, API, scraping, sensori).
Tecniche di pulizia dei dati: rimozione dei valori mancanti, gestione dei duplicati, outlier.
Trasformazioni dei dati: normalizzazione, scaling, encoding.
Modulo 4: Analisi Esplorativa dei Dati (EDA)
Cos'è l'analisi esplorativa dei dati (EDA) e perché è fondamentale.
Tecniche di visualizzazione dei dati: istogrammi, boxplot, heatmap.
Analisi delle correlazioni tra variabili.
Identificazione di pattern e tendenze nei dati.
Modulo 5: Fondamenti di Programmazione per la Data Science (Python/R)
Introduzione ai linguaggi di programmazione utilizzati in Data Science: Python e R.
Fondamenti di Python/R per la manipolazione dei dati (pandas, numpy, dplyr).
Creazione di script per la preparazione e analisi dei dati.
Visualizzazione dei dati con librerie come matplotlib (Python) o ggplot2 (R).
Modulo 6: Statistiche Inferenziali per l'IT
Differenza tra statistica descrittiva e inferenziale.
Teoria dei test di ipotesi: test t, test Z, test chi-quadrato.
Intervalli di confidenza e significatività statistica.
Applicazione delle inferenze statistiche in ambito IT e aziendale.
Modulo 7: Regressione Lineare e Modelli Predittivi
Cos'è la regressione lineare e come applicarla.
Interpretazione dei coefficienti della regressione.
Valutazione delle performance del modello: R², errori quadrati medi (MSE).
Costruzione di modelli predittivi con variabili continue.
Modulo 8: Regressione Logistica e Classificazione
Cos'è la regressione logistica e come viene usata per la classificazione.
Funzione di attivazione sigmoide e probabilità.
Valutazione del modello di classificazione: matrice di confusione, accuratezza, precisione, recall, AUC-ROC.
Applicazioni pratiche della regressione logistica in IT, come la previsione di abbandono (churn prediction).
Modulo 9: Clustering e Segmentazione dei Dati
Cos'è il clustering e le sue applicazioni pratiche.
Algoritmi di clustering: k-means, DBSCAN, gerarchico.
Valutazione dei risultati del clustering: silhouette score, errore quadratico medio.
Segmentazione dei clienti o utenti basata sui dati comportamentali.
Modulo 10: Tecniche di Machine Learning Supervisionato
Cos'è il machine learning supervisionato e come applicarlo.
Algoritmi comuni di machine learning supervisionato: decision tree, random forest, SVM, KNN.
Overfitting vs underfitting: come evitarli.
Validazione dei modelli: cross-validation, grid search.
Modulo 11: Tecniche di Machine Learning Non Supervisionato
Cos'è il machine learning non supervisionato e come applicarlo.
Algoritmi di machine learning non supervisionato: clustering, PCA (Principal Component Analysis).
Applicazioni pratiche del machine learning non supervisionato nell'analisi dei dati IT.
Riduzione della dimensionalità e visualizzazione dei dati.
Modulo 12: Analisi delle Serie Temporali
Cos’è l’analisi delle serie temporali e le sue applicazioni.
Tecniche di decomposizione delle serie temporali: trend, stagionalità, ciclicità.
Modelli di previsione delle serie temporali: ARIMA, Exponential Smoothing.
Applicazioni delle serie temporali nell'IT: previsione dei carichi di sistema, analisi delle tendenze del traffico web.
Modulo 13: Big Data e Tecniche di Analisi Scalabile
Cos’è il Big Data e come si differenzia dai dati tradizionali.
Architettura dei Big Data: Hadoop, Spark, NoSQL.
Tecniche di analisi scalabili e distribuite per grandi volumi di dati.
Utilizzo di Spark e MapReduce per l’analisi di Big Data.
Modulo 14: Data Visualization e Reportistica
Importanza della visualizzazione dei dati nella comunicazione dei risultati.
Creazione di dashboard interattive e report (Tableau, Power BI).
Tecniche avanzate di visualizzazione: grafici a dispersione, heatmaps, diagrammi di Sankey.
Best practices per la visualizzazione dei dati a supporto delle decisioni aziendali.
Modulo 15: Etica e Privacy nell'Analisi dei Dati
Considerazioni etiche nell'uso dei dati: bias, fairness e privacy.
Leggi e normative sulla privacy: GDPR, CCPA, ecc.
Come proteggere i dati sensibili durante l’analisi e l'archiviazione.
Responsabilità dei Data Scientist nella gestione dei dati personali.