52
Aprendizado de Máquina e Grandes Conjuntos de Dados Thomas de Araujo Buck

Aprendizado de Máquina e Grandes Conjuntos de Dados

Embed Size (px)

DESCRIPTION

Pequena introdução às áreas de Machine Learning (ML) e big data

Citation preview

Page 1: Aprendizado de Máquina e Grandes Conjuntos de Dados

Aprendizado de Máquinae

Grandes Conjuntos de Dados

Thomas de Araujo Buck

Page 2: Aprendizado de Máquina e Grandes Conjuntos de Dados

Tipos de algoritmos● Determinísticos (ou clássicos, convencionais)● Adaptativos (ou estocásticos, "avançados")

Page 3: Aprendizado de Máquina e Grandes Conjuntos de Dados

Algoritmos determinísticos● Detecção de colisão● Fatoração de números primos● Inversão de matrizes (esparsas)● Ordenação (quicksort, mergesort)● Page Rank● Um pouco mais avançados

● A*● Árvore de jogos

Page 4: Aprendizado de Máquina e Grandes Conjuntos de Dados

Árvore de jogos● Jogo da velha

Page 5: Aprendizado de Máquina e Grandes Conjuntos de Dados

● Qual a quantidade total de possibilidades?● 9 * 8 * … * 2 * 1 = 9! = 362.880

● Para pensar!● Jogo de damas● Batalha Naval● Reversi

Page 6: Aprendizado de Máquina e Grandes Conjuntos de Dados

Xadrez

Page 7: Aprendizado de Máquina e Grandes Conjuntos de Dados
Page 8: Aprendizado de Máquina e Grandes Conjuntos de Dados

● Quem se lembra da disputa homem (Garry Kasparov) contra máquina (IBM Deep Blue) ?

● Mais uma pergunta: xadrez é, neste sentido, o jogo mais "difícil" já criado pelo homem?

Page 9: Aprendizado de Máquina e Grandes Conjuntos de Dados

● Go

Page 10: Aprendizado de Máquina e Grandes Conjuntos de Dados

● Há sinais de esperança

Page 11: Aprendizado de Máquina e Grandes Conjuntos de Dados

A faxineira eletrônica● O equipamento

Page 12: Aprendizado de Máquina e Grandes Conjuntos de Dados

● Exemplos de recintos●

● Qual o algoritmo que garanta a limpeza?

Page 13: Aprendizado de Máquina e Grandes Conjuntos de Dados
Page 14: Aprendizado de Máquina e Grandes Conjuntos de Dados

Algoritmos adaptativos● O que é um programa "inteligente"?● É um programa "que aprende"?● Seguem alguns exemplos

Page 15: Aprendizado de Máquina e Grandes Conjuntos de Dados

● Análise de crédito● Navegação autônoma● Reconhecimento de faces

Page 16: Aprendizado de Máquina e Grandes Conjuntos de Dados

● Diagnóstico médico● Projeção financeira (prognóstico)● Sistemas de recomendação● Logística

Page 17: Aprendizado de Máquina e Grandes Conjuntos de Dados

● Text processing● Spam● News● Plágio

Page 18: Aprendizado de Máquina e Grandes Conjuntos de Dados

Aprendizado de máquina● Supervisionado (aprende com exemplos), que

possui 2 fases: treinamento e operação● NN● Classificação (Discriminante Linear - DL)● Regressão

● Não supervisionado (aprende sozinho), que só possui a fase de operação● Análise de aglomeração (K-means clustering)

Page 19: Aprendizado de Máquina e Grandes Conjuntos de Dados

Exemplos de algoritmos● NN● k-NN● Dimensão do vetor de características: 2● Quantidade de classes: 2

Page 20: Aprendizado de Máquina e Grandes Conjuntos de Dados

Dados (qualidade boa)

Page 21: Aprendizado de Máquina e Grandes Conjuntos de Dados

Dados (qualidade ruim)

Page 22: Aprendizado de Máquina e Grandes Conjuntos de Dados

A enorme avalanche de dados● Matéria da revista The Economist

Page 23: Aprendizado de Máquina e Grandes Conjuntos de Dados

Data centers

● Google

Page 24: Aprendizado de Máquina e Grandes Conjuntos de Dados

● Facebook

Page 25: Aprendizado de Máquina e Grandes Conjuntos de Dados

Tratamento dos dados● O que fazer com esses dados? Apenas

armazenar? Indexar?● Ou deve-se extrair informação útil? Como?

Manualmente?

Page 26: Aprendizado de Máquina e Grandes Conjuntos de Dados

Problemas muito difíceis para serem programados

Page 27: Aprendizado de Máquina e Grandes Conjuntos de Dados

● A competição DARPA Grand Challenge●

● Urban Challenge

Page 28: Aprendizado de Máquina e Grandes Conjuntos de Dados

● A experiência Google Car

Page 29: Aprendizado de Máquina e Grandes Conjuntos de Dados

● Mais alguns detalhes

Page 30: Aprendizado de Máquina e Grandes Conjuntos de Dados

● Oooops: um pequeno problema

Page 31: Aprendizado de Máquina e Grandes Conjuntos de Dados
Page 32: Aprendizado de Máquina e Grandes Conjuntos de Dados
Page 33: Aprendizado de Máquina e Grandes Conjuntos de Dados

Grandes conjuntos de dados● Análise de dados

● Manual● Automática

Page 34: Aprendizado de Máquina e Grandes Conjuntos de Dados

KDD

Page 35: Aprendizado de Máquina e Grandes Conjuntos de Dados

Imagens● Acesso por conteúdo

Page 36: Aprendizado de Máquina e Grandes Conjuntos de Dados

● PhotoLib

Page 37: Aprendizado de Máquina e Grandes Conjuntos de Dados

● Games with a purpose (GWAP)

Page 38: Aprendizado de Máquina e Grandes Conjuntos de Dados

● Pixazza - Luminate● Semantics● Learning

Page 39: Aprendizado de Máquina e Grandes Conjuntos de Dados

Área médica● Mamografia● Colonoscopia

● As gerações dos equipamentos de tomografia computadorizada

Page 40: Aprendizado de Máquina e Grandes Conjuntos de Dados
Page 41: Aprendizado de Máquina e Grandes Conjuntos de Dados
Page 42: Aprendizado de Máquina e Grandes Conjuntos de Dados
Page 43: Aprendizado de Máquina e Grandes Conjuntos de Dados

Big Data tem valor de negócio

Page 44: Aprendizado de Máquina e Grandes Conjuntos de Dados

US Economy

Page 45: Aprendizado de Máquina e Grandes Conjuntos de Dados

Um experimento recente● IBM Watson

Page 46: Aprendizado de Máquina e Grandes Conjuntos de Dados

Como ter certeza?

Page 47: Aprendizado de Máquina e Grandes Conjuntos de Dados
Page 48: Aprendizado de Máquina e Grandes Conjuntos de Dados

Smarter Planet + Big Data + Cloud = Analytics

Page 49: Aprendizado de Máquina e Grandes Conjuntos de Dados

Uma outra oportunidade tem início● Dados públicos: New York, Chicago, ...● Rio de Janeiro (?)

Page 50: Aprendizado de Máquina e Grandes Conjuntos de Dados

Conclusões● Tratamento computacional de grandes

quantidades de dados é uma oportunidade, segundo a consultoria McKinsey

Page 51: Aprendizado de Máquina e Grandes Conjuntos de Dados

Para reflexão

Page 52: Aprendizado de Máquina e Grandes Conjuntos de Dados

ObrigadoThomas de Araujo [email protected]

www.facebook.com/ThomasABuck@ThomasABuck