57
Seres Humanos e Padr˜oes Conceito Intuitivo Formalizando Na Pr´ atica Distˆ ancias Classificadores Elementares Contatos Introdu¸c˜ ao ao Reconhecimento de Padr˜ oes (Aprendizagem de M´ aquina / Data Mining) Exemplos em Python Prof. Ronaldo F. Ramos, Dr 1 de junho de 2014 Prof. Ronaldo F. Ramos, Dr Introdu¸c˜ ao ao Reconhecimento de Padr˜oes (Aprendizagem de M´ aquina / Data Mining)

Inteligência Artificial - Data Mining

Embed Size (px)

DESCRIPTION

Curso IA - Datamining

Citation preview

Page 1: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Introducao ao Reconhecimento de Padroes(Aprendizagem de Maquina / Data Mining)

Exemplos em Python

Prof. Ronaldo F. Ramos, Dr

1 de junho de 2014

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 2: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Roteiro

1 Seres Humanos e Padroes

2 Conceito Intuitivo

3 Formalizando

4 Na Pratica

5 Distancias

6 Classificadores Elementares

7 Contatos

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 3: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Seres Humanos e Padroes

Os sentidos humanos enviam informacoes ao cerebro quereconhece alguns aspectos da realidade.

Sons

Imagens

Sensacao Tatil

Odores

Permitem tambem a identificacao de padroes logico-matematicos(o que exige um pouco mais do cerebro ;-) ).

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 4: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Conceito de Reconhecimento de Padroes

Reconhecer um padrao equivale a classificar um objeto fısico oulogico como pertencente ou nao a uma predeterminada categoria.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 5: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Conceito Intuitivo

Dadas as categorias abaixo:

(a) Laranjas (b) Macas

A qual delas pertencem os objetos abaixo?

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 6: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Conceito Intuitivo - Novo Grupo

(c) Laranjas (d) Macas (e) Tangerinas

A qual delas pertence o objeto abaixo?

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 7: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Similaridade

Seu cerebro fez uma analise de

similaridade.

Pode-se fazer esta mesma analise no

computador?O que precisaremos para tal?

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 8: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Uma definicao quase formal de RP

Um problema de RP e composto de ...

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 9: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Um Conjunto de K Classes

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 10: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Um Conjunto de objetos Ni por Classes Ki

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 11: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Um Conjunto de atributos nj por objeto Ni

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 12: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Mecanismo de Memoria e Aprendizagem

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 13: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Regra de Decisao para Calcular Novos Objetos

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 14: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Criterios de Avaliacao do Classificador

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 15: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Que atributos descrevem bem uma tangerina?

Formato

Esferico ou Oval? Esferico

Fruta Cıtrica

Sim/Nao Sim

Cor

Laranja????Alaranjado

Rugosidade da Casca

Lisa ou Rugosa?Rugosa

Cheiro

Ativo/Fraco? Ativo

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 16: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Que atributos descrevem bem uma tangerina?

Formato

Esferico ou Oval? Esferico

Fruta Cıtrica

Sim/Nao Sim

Cor

Laranja????Alaranjado

Rugosidade da Casca

Lisa ou Rugosa?Rugosa

Cheiro

Ativo/Fraco? Ativo

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 17: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Que atributos descrevem bem uma tangerina?

Formato

Esferico ou Oval? Esferico

Fruta Cıtrica

Sim/Nao Sim

Cor

Laranja????Alaranjado

Rugosidade da Casca

Lisa ou Rugosa?Rugosa

Cheiro

Ativo/Fraco? Ativo

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 18: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Que atributos descrevem bem uma tangerina?

Formato

Esferico ou Oval? Esferico

Fruta Cıtrica

Sim/Nao Sim

Cor

Laranja????Alaranjado

Rugosidade da Casca

Lisa ou Rugosa?Rugosa

Cheiro

Ativo/Fraco? Ativo

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 19: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Que atributos descrevem bem uma tangerina?

Formato

Esferico ou Oval? Esferico

Fruta Cıtrica

Sim/Nao Sim

Cor

Laranja????Alaranjado

Rugosidade da Casca

Lisa ou Rugosa?Rugosa

Cheiro

Ativo/Fraco? AtivoProf. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 20: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Sobre os Atributos

Os atributos sao igualmente importantes?

E facil definir os atributos de um objeto?

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 21: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Sobre os Atributos

Nem sempre.

Nem sempre.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 22: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Transformacao de Atributos

Atributos devem ser expressos na forma de numeros.Desta forma o conjunto de atributos da tangerina [Formato, FrutaCıtrica, Cor, Rugosidade da Casca, Cheiro] devem ser expressoscomo um vetor de atributos tais como:X = [0, 1, 2, 1, 1] 1

1A forma de numeralizar pode fazer muita diferenca no uso do modeloProf. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 23: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Adotando as seguintes convencoes:

Atributo Valores Textuais Numericos

Formato Esferico,Oval,Alongado 0,1,2

Fruta Cıtrica Nao,Sim 0,1

Cor Amarelo,Vermelho,Alaranjado,Verde 0,1,2,3

Rugosidade lisa,rugosa 0,1

Cheiro Nao,Sim 0,1

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 24: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Terıamos as seguintes representacoes para as frutas

Objeto Laranja (X) [0, 1, 2, 1, 0]

Objeto Maca (Y) [0, 0, 1, 0, 0]

Objeto Tangerina (Z)[0, 1, 2, 1, 1]

O Objeto tangerina (Z) se assemelha mais alaranja(X) ou a Maca(Y)?

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 25: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Conceito de Distancia

Uma forma de medir a similaridade entre dois padroes ecalcular a distancia entre eles.

Distancia city-block, quarteirao ou manhattan.Dq(X,Y) = |X1 − Y1|+ |X2 − Y2|+ ... + |Xn − Yn|Distancia Euclidiana.De(X,Y) =

√(X1 − Y1)2 + (X2 − Y2)2 + ... + (Xn − Yn)2

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 26: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Comparacao entre Euclidiana e Quarteirao

ZZZZZZ

ZZZZZZ

C B

A

53

4

Dq(A,B) = 3 + 4 = 7De(A,B) =

√32 + 42 = 5

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 27: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Agora e so fazer as contas

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 28: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Classificadores Elementares

Agora voce sabe que uma tangerina e mais parecida com umalaranja do que com uma maca..;-).

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 29: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Classificadores Elementares

Agora vamos estudar as flores....

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 30: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Morfologia das Flores

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 31: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Iris (Flor-de-lis)

Valei-me Deus e o fim do nosso amor .....

Iris Setosa Iris Virgınica Iris Versicolor

Estudo feito por Sir Ronald Fischer em 1936(Analise Discriminante).

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 32: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Base de Dados de Iris I

Na WIKIPEDIA e em outros lugares encontraremos a base dedados de Fischer.SL=Comprimento da Sepala SW=Largura da SepalaPL=Comprimento da Petala PW = Largura da Petala

SL SW PL PW Species5.1 3.5 1.4 0.2 setosa4.9 3.0 1.4 0.2 setosa4.7 3.2 1.3 0.2 setosa4.6 3.1 1.5 0.2 setosa5.0 3.6 1.4 0.2 setosa5.4 3.9 1.7 0.4 setosa4.6 3.4 1.4 0.3 setosa5.0 3.4 1.5 0.2 setosa

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 33: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Base de Dados de Iris II

4.4 2.9 1.4 0.2 setosa4.9 3.1 1.5 0.1 setosa5.4 3.7 1.5 0.2 setosa4.8 3.4 1.6 0.2 setosa4.8 3.0 1.4 0.1 setosa4.3 3.0 1.1 0.1 setosa5.8 4.0 1.2 0.2 setosa5.7 4.4 1.5 0.4 setosa5.4 3.9 1.3 0.4 setosa5.1 3.5 1.4 0.3 setosa5.7 3.8 1.7 0.3 setosa5.1 3.8 1.5 0.3 setosa5.4 3.4 1.7 0.2 setosa

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 34: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Base de Dados de Iris III

5.1 3.7 1.5 0.4 setosa4.6 3.6 1.0 0.2 setosa5.1 3.3 1.7 0.5 setosa4.8 3.4 1.9 0.2 setosa5.0 3.0 1.6 0.2 setosa5.0 3.4 1.6 0.4 setosa5.2 3.5 1.5 0.2 setosa5.2 3.4 1.4 0.2 setosa4.7 3.2 1.6 0.2 setosa4.8 3.1 1.6 0.2 setosa5.4 3.4 1.5 0.4 setosa5.2 4.1 1.5 0.1 setosa5.5 4.2 1.4 0.2 setosa

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 35: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Base de Dados de Iris IV

4.9 3.1 1.5 0.2 setosa5.0 3.2 1.2 0.2 setosa5.5 3.5 1.3 0.2 setosa4.9 3.6 1.4 0.1 setosa4.4 3.0 1.3 0.2 setosa5.1 3.4 1.5 0.2 setosa5.0 3.5 1.3 0.3 setosa4.5 2.3 1.3 0.3 setosa4.4 3.2 1.3 0.2 setosa5.0 3.5 1.6 0.6 setosa5.1 3.8 1.9 0.4 setosa4.8 3.0 1.4 0.3 setosa5.1 3.8 1.6 0.2 setosa

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 36: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Base de Dados de Iris V

4.6 3.2 1.4 0.2 setosa5.3 3.7 1.5 0.2 setosa5.0 3.3 1.4 0.2 setosa7.0 3.2 4.7 1.4 versicolor6.4 3.2 4.5 1.5 versicolor6.9 3.1 4.9 1.5 versicolor5.5 2.3 4.0 1.3 versicolor6.5 2.8 4.6 1.5 versicolor5.7 2.8 4.5 1.3 versicolor6.3 3.3 4.7 1.6 versicolor4.9 2.4 3.3 1.0 versicolor6.6 2.9 4.6 1.3 versicolor5.2 2.7 3.9 1.4 versicolor

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 37: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Base de Dados de Iris VI

5.0 2.0 3.5 1.0 versicolor5.9 3.0 4.2 1.5 versicolor6.0 2.2 4.0 1.0 versicolor6.1 2.9 4.7 1.4 versicolor5.6 2.9 3.6 1.3 versicolor6.7 3.1 4.4 1.4 versicolor5.6 3.0 4.5 1.5 versicolor5.8 2.7 4.1 1.0 versicolor6.2 2.2 4.5 1.5 versicolor5.6 2.5 3.9 1.1 versicolor5.9 3.2 4.8 1.8 versicolor6.1 2.8 4.0 1.3 versicolor6.3 2.5 4.9 1.5 versicolor

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 38: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Base de Dados de Iris VII

6.1 2.8 4.7 1.2 versicolor6.4 2.9 4.3 1.3 versicolor6.6 3.0 4.4 1.4 versicolor6.8 2.8 4.8 1.4 versicolor6.7 3.0 5.0 1.7 versicolor6.0 2.9 4.5 1.5 versicolor5.7 2.6 3.5 1.0 versicolor5.5 2.4 3.8 1.1 versicolor5.5 2.4 3.7 1.0 versicolor5.8 2.7 3.9 1.2 versicolor6.0 2.7 5.1 1.6 versicolor5.4 3.0 4.5 1.5 versicolor6.0 3.4 4.5 1.6 versicolor

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 39: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Base de Dados de Iris VIII

6.7 3.1 4.7 1.5 versicolor6.3 2.3 4.4 1.3 versicolor5.6 3.0 4.1 1.3 versicolor5.5 2.5 4.0 1.3 versicolor5.5 2.6 4.4 1.2 versicolor6.1 3.0 4.6 1.4 versicolor5.8 2.6 4.0 1.2 versicolor5.0 2.3 3.3 1.0 versicolor5.6 2.7 4.2 1.3 versicolor5.7 3.0 4.2 1.2 versicolor5.7 2.9 4.2 1.3 versicolor6.2 2.9 4.3 1.3 versicolor5.1 2.5 3.0 1.1 versicolor

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 40: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Base de Dados de Iris IX

5.7 2.8 4.1 1.3 versicolor6.3 3.3 6.0 2.5 virginica5.8 2.7 5.1 1.9 virginica7.1 3.0 5.9 2.1 virginica6.3 2.9 5.6 1.8 virginica6.5 3.0 5.8 2.2 virginica7.6 3.0 6.6 2.1 virginica4.9 2.5 4.5 1.7 virginica7.3 2.9 6.3 1.8 virginica6.7 2.5 5.8 1.8 virginica7.2 3.6 6.1 2.5 virginica6.5 3.2 5.1 2.0 virginica6.4 2.7 5.3 1.9 virginica

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 41: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Base de Dados de Iris X

6.8 3.0 5.5 2.1 virginica5.7 2.5 5.0 2.0 virginica5.8 2.8 5.1 2.4 virginica6.4 3.2 5.3 2.3 virginica6.5 3.0 5.5 1.8 virginica7.7 3.8 6.7 2.2 virginica7.7 2.6 6.9 2.3 virginica6.0 2.2 5.0 1.5 virginica6.9 3.2 5.7 2.3 virginica5.6 2.8 4.9 2.0 virginica7.7 2.8 6.7 2.0 virginica6.3 2.7 4.9 1.8 virginica6.7 3.3 5.7 2.1 virginica

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 42: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Base de Dados de Iris XI

7.2 3.2 6.0 1.8 virginica6.2 2.8 4.8 1.8 virginica6.1 3.0 4.9 1.8 virginica6.4 2.8 5.6 2.1 virginica7.2 3.0 5.8 1.6 virginica7.4 2.8 6.1 1.9 virginica7.9 3.8 6.4 2.0 virginica6.4 2.8 5.6 2.2 virginica6.3 2.8 5.1 1.5 virginica6.1 2.6 5.6 1.4 virginica7.7 3.0 6.1 2.3 virginica6.3 3.4 5.6 2.4 virginica6.4 3.1 5.5 1.8 virginica

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 43: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Base de Dados de Iris XII

6.0 3.0 4.8 1.8 virginica6.9 3.1 5.4 2.1 virginica6.7 3.1 5.6 2.4 virginica6.9 3.1 5.1 2.3 virginica5.8 2.7 5.1 1.9 virginica6.8 3.2 5.9 2.3 virginica6.7 3.3 5.7 2.5 virginica6.7 3.0 5.2 2.3 virginica6.3 2.5 5.0 1.9 virginica6.5 3.0 5.2 2.0 virginica6.2 3.4 5.4 2.3 virginica5.9 3.0 5.1 1.8 virginica

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 44: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Algoritmo do Vizinho Mais Proximo - Neareast Neighbor

1 Seja Xnew um vetor cuja classe e desconhecida.

2 Procurar na tabela o vetor armazenado mais proximo deXnew.

3 Chamar de Xnear o vetor mais proximo de Xnew

4 Atribuir a Xnew a mesma classe de Xnear

5 Se a classificacao for correta incluir Xnew na tabela.

Mao a obra, ou melhor ao codigo ...

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 45: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Qual o problema com o Vizinho Mais Proximo?

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 46: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Uma Solucao

KNN - K Vizinhos Mais Proximos(K=Numero Impar Inteiro)O Padrao e classificado de acordo com a maioria dos vizinhos.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 47: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Algoritmo dos K Vizinhos Mais Proximos - K NeareastNeighbors

1 Armazenar os exemplos em uma tabela.

2 seja Xnew um vetor de classe desconhecida.

3 Encontrar na tabela os K vetores mais proximos de Xnew

4 Seja Ck a classe a que pertence a maioria dos vetores.

5 Atribuir Classe(Xnew) = Ck

6 Se a classificacao for correta incluir Xnew na tabela.

Bom, vamos ao codigo ...

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 48: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Vantagens e Desvantagens do KNN

Vantagens

Simplicidade de Implementacao.

Ideal para tabelas pequenas ou medias.

Nao requer treinamento.

Desvantagens

Alto custo computacional para tabelas grandes.

A constante K e obtida por tentativa e erro.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 49: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Distancia Mınima ao Centroide

Cada classe passa a ter um unico vetor que a representachamado de centroide.

Apos o ”treinamento”nao sera necessario armazenar osexemplos. Apenas os centroides permanecem na memoria.

O centroide e o vetor medio, ou seja, a media dos exemplosda classe.

O centroide e o representante de sua classe.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 50: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Distancia Mınima ao Centroide

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 51: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Atualizando o Centroide

Como foi visto o centroide representa a classe, portanto,descoberto um novo indivıduo da classe, o centroide deve/pode seratualizado.Mj(nj + 1) = (1− a)Mj(nj) + a(Xnew)Onde:a = 1/(nj + 1) e o fator de aprendizagemnj e o total de exemplos utilizados antes da chegada do XnewMj(nj) e o centroide antes da chegada do XnewMj(nj + 1) e o novo centroide com Xnew incorporado.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 52: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Avaliando Classificadores - Matriz de Confusao

Corretamente Classificadas = 5 + 3 + 11 = 19Erroneamente Classificadas = 2 + 3 + 0 + 0 + 2 + 1 = 8Total de Instancias = 27Taxa de Acerto = 19/27 (70,4 % )Taxa de Erro = 8/27 (29,6 % )

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 53: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Matriz de Confusao por Classe - Tabela de Confusao -Binario

TP = True Positives. Verdadeiros Positivos. Classificados corretamente como gatos.FP = False Positives. Falsos Positivos. Classificados como gatos que sao outra coisaFN = False Negatives. Falsos Negativos. Classificados como outra coisa, mas sao realmente gatos.TN = True Negatives. Classificados como outra coisa e realmente nao sao gatos.

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 54: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Metricas

True Positive Rate (Recall) (TPR). TPR = TP / (TP + FN)

True Negative Rate (Specificity) SPC = TN / (FP + TN)

Positive Predictive Value (Precision) PPV = TP / (TP + FP)

Negative Predictive Value (NPV) NPV = TN / (TN + FN)

False Positive Rate (fall-out) FPR = FP /( FP + TN)

False Discovery Rate (FDR) FDR = FP /(FP + TP) = 1 -PPV

False Negative Rate (Miss Rate) FNR = FN / ( FN + TP)

etc etc etc

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 55: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Metricas Curva ROC - Receiver Operating Characteritics

Area Sob a curva. Acima de 0.9 (excelente). Entre 0.8 e 0.9(bom). Entre 0.7 e 0.8 (medio). Entre 0.6 e 0.7 (fraco).Abaixo de0.6 (ineficaz).

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 56: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Continua ...

Isso e so o comeco ....

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)

Page 57: Inteligência Artificial - Data Mining

Seres Humanos e Padroes Conceito Intuitivo Formalizando Na Pratica Distancias Classificadores Elementares Contatos

Contatos

Prof. Ronaldo F. RamosDoutor em Systemes Informatiques (Informatica)- Universidade de Evry - Franca.Pos Doutorado - UFC - DETIMestre em Engenharia de Producao/Inteligencia Aplicada - Universidade Federal deSanta CatarinaEngenheiro Mecanico - Universidade Federal do Ceara30 Anos de experiencia em Projetos de Engenharia e Sistemas [email protected]

Prof. Guilherme de Alencar BarretoDoutor em Engenharia Eletrica - Universidade de Sao Paulo - USP - Sao Carlos /Universidade de Bielefeld, UB, AlemanhaMestre em Engenharia Eletrica - Universidade de Sao Paulo - USP - Sao CarlosEngenheiro de Teleinformatica - Universidade Federal do CearaBolsista CNPQ Nıvel 2http://lattes.cnpq.br/8902002461422112

Prof. Ronaldo F. Ramos, Dr

Introducao ao Reconhecimento de Padroes (Aprendizagem de Maquina / Data Mining)