6
O problema da seleção de atributos Classifique estas personalidades

Data Mining: o problema da seleção de atributos

Embed Size (px)

Citation preview

Page 1: Data Mining: o problema da seleção de atributos

O problema da seleção de atributos

Classifique estas personalidades

Page 2: Data Mining: o problema da seleção de atributos

Jogadores

Lutadores

ArtistasRevolucionários

CientistasPolíticos

A tarefa de classificação pode ser feita de diversas maneiras

Page 3: Data Mining: o problema da seleção de atributos

Argentina

Canadá Inglaterra

Brasil

EUA

A tarefa de classificação pode ser feita de diversas maneiras

China

Índia

Austria

Polônia

Page 4: Data Mining: o problema da seleção de atributos

Quais os melhores atributos?

Local de nascimento; Altura; Peso; Idade; Tipo sanguíneo; Formação; Atividade; Renda; ...

Page 5: Data Mining: o problema da seleção de atributos

Antes de tudo pensar em:

Para a função da base todos os atributos anteriores são necessários?

Como funciona o algoritmo? Algum atributo pode influenciar muito

nos resultados gerados?

Lembrar que:Maior parte dos algoritmos leva em conta todos os atributos da base, não seleciona apenas um (como nos slides da apresentação).

Page 6: Data Mining: o problema da seleção de atributos

Bases de dados

Tendência de grandes bases é tornar-se um “bando de dados” e não um banco de dados.

Se é necessário conhecimentos específicos um especilista pode dizer: Atributos mais relevantes; Atributos menos relevantes.

Isto pode melhorar resultados de qualquer algoritmo. Instance Based Learning: os valores descritos nos

atributos servem de comparação com novos exemplos. Então, quais são os melhores exemplos?