Apache Spark MLlib
Corso
A Milano
Hai bisogno di un coach per la formazione?
Ti aiuterà a confrontare vari corsi e trovare l'offerta formativa più conveniente.
Descrizione
-
Tipologia
Corso
-
Luogo
Milano
MLlib è la libreria di machine learning (ML) di Spark Il suo obiettivo è rendere l'apprendimento della macchina pratico scalabile e facile Consiste in algoritmi e utilità di apprendimento comuni, tra cui classificazione, regressione, clustering, filtraggio collaborativo, riduzione della dimensionalità, primitive di ottimizzazione di livello inferiore e API di pipeline più elevate Si divide in due pacchetti: sparkmllib contiene l'API originale costruita su RDD sparkml fornisce API higherlevel basate su DataFrames per la costruzione di pipeline ML Pubblico Questo corso è rivolto a ingegneri e sviluppatori che desiderano utilizzare una libreria macchina integrata per Apache Spark .
Machine Translated
Sedi e date
Luogo
Inizio del corso
Inizio del corso
Profilo del corso
Knowledge of one of the following:
Java
Scala
Python
SparkR.
Opinioni
Materie
- Clustering
- Librería
- Api
- Apprendimento
- Pipeline
- Apache
Programma
spark.mllib: data types, algorithms, and utilities
- Data types
- Basic statistics
- summary statistics
- correlations
- stratified sampling
- hypothesis testing
- streaming significance testing
- random data generation
- Classification and regression
- linear models (SVMs, logistic regression, linear regression)
- naive Bayes
- decision trees
- ensembles of trees (Random Forests and Gradient-Boosted Trees)
- isotonic regression
- Collaborative filtering
- alternating least squares (ALS)
- Clustering
- k-means
- Gaussian mixture
- power iteration clustering (PIC)
- latent Dirichlet allocation (LDA)
- bisecting k-means
- streaming k-means
- Dimensionality reduction
- singular value decomposition (SVD)
- principal component analysis (PCA)
- Feature extraction and transformation
- Frequent pattern mining
- FP-growth
- association rules
- PrefixSpan
- Evaluation metrics
- PMML model export
- Optimization (developer)
- stochastic gradient descent
- limited-memory BFGS (L-BFGS)
- Overview: estimators, transformers and pipelines
- Extracting, transforming and selecting features
- Classification and regression
- Clustering
- Advanced topics
Hai bisogno di un coach per la formazione?
Ti aiuterà a confrontare vari corsi e trovare l'offerta formativa più conveniente.
Apache Spark MLlib
