Upload
guilherme-peixoto
View
45
Download
3
Embed Size (px)
Citation preview
Agenda
● O quê: Spark● O quê: MLlib● Exemplo KMeans em "Toy Dataset" ● DataFrames● Classificação de Spam em Produção● Por quê?
● Clustering [KMeans, LDA]● Classificação [SVM, Naïve Bayes, Random Forests]● Regressão● Extração de características● Recomendação, timização de parâmetros, avaliação de
modelos...
Algoritmos
Pipelines
● Transformer○ Gera um DF a partir de outro DF
● Estimator○ Abstrai o conceito de um algoritmo que é treinado sob um
conjunto