15
LABIC MCM Árvores de Decisão: supervisionado, simbólico, não incremental (?) Modo de Aprendizado Paradigmas de Aprendizado Linguagens de Descrição Formas de Aprendizado -Supervisionado -N ão Supervisionado -Simbólico -Estatístico -Instance-Based -Conexionista -Genético -Instâncias ou Exem plos -Conceitos Aprendidos ou Hipóteses -Teoria de D om ínio ou Conhecimento de Fundo -Incremental -N ão Incremental

Árvores de Decisão: supervisionado, simbólico, não incremental (?)

  • Upload
    jera

  • View
    20

  • Download
    0

Embed Size (px)

DESCRIPTION

Árvores de Decisão: supervisionado, simbólico, não incremental (?). Árvores de Decisão. Pode-se definir formalmente uma árvore de decisão como sendo:. 1.um nó folha - ou nó resposta - que contém um nome de classe, ou - PowerPoint PPT Presentation

Citation preview

Page 1: Árvores de Decisão: supervisionado, simbólico, não incremental (?)

LABIC

1 MCM

Árvores de Decisão: supervisionado, simbólico, não incremental (?)

Modo deAprendizado

Paradigmas deAprendizado

Linguagens deDescrição

Formas deAprendizado

- Supervisionado

- NãoSupervisionado

- Simbólico

- Estatístico

- Instance-Based

- Conexionista

- Genético

- Instâncias ouExemplos

- ConceitosAprendidos ouHipóteses

- Teoria deDomínio ouConhecimentode Fundo

- Incremental

- NãoIncremental

Page 2: Árvores de Decisão: supervisionado, simbólico, não incremental (?)

LABIC

2 MCM

Árvores de Decisão

1.um nó folha - ou nó resposta - que contém um nome de classe, ou

2.um nó não folha - ou nó de decisão - que contém um teste de atributo que, para cada um dos possíveis valores de atributo, tem um ramo para uma outra árvore de decisão

Pode-se definir formalmente uma árvore de decisão como sendo:

Page 3: Árvores de Decisão: supervisionado, simbólico, não incremental (?)

LABIC

3 MCM

Representação da AD

1

Y

2X

X

falso

falso

verdadeiro

verdadeiro

Page 4: Árvores de Decisão: supervisionado, simbólico, não incremental (?)

LABIC

4 MCM

Árvores de Decisão (Cont)

Padrões no conjunto de amostras são identificados.

Conjunto de exemplos experimentais observados

TemperaturaTemperatura RegiãoRegião TempoTempo Barometro Barometro Predição PrediçãoAcima 0°CAcima 0°C OesteOeste NubladoNublado Baixando Baixando Chuva ChuvaAbaixo 0°CAbaixo 0°C NubladoNublado Fixo Fixo Neve NeveAcima 0°CAcima 0°C LesteLeste NubladoNublado Aumentando Sol Aumentando SolAcima 0°CAcima 0°C Parcial Nubl. FixoParcial Nubl. Fixo Sol Sol

LimpoLimpo Fixo Fixo Sol SolAcima 0°CAcima 0°C SulSul LimpoLimpo Baixando Baixando Chuva Chuva 0°C0°C NorteNorte Parcial Nubl. FixoParcial Nubl. Fixo Neve Neve

TemperaturaTemperatura RegiãoRegião TempoTempo Barometro Barometro Predição PrediçãoAcima 0°CAcima 0°C OesteOeste NubladoNublado Baixando Baixando Chuva ChuvaAbaixo 0°CAbaixo 0°C NubladoNublado Fixo Fixo Neve NeveAcima 0°CAcima 0°C LesteLeste NubladoNublado Aumentando Sol Aumentando SolAcima 0°CAcima 0°C Parcial Nubl. FixoParcial Nubl. Fixo Sol Sol

LimpoLimpo Fixo Fixo Sol SolAcima 0°CAcima 0°C SulSul LimpoLimpo Baixando Baixando Chuva Chuva 0°C0°C NorteNorte Parcial Nubl. FixoParcial Nubl. Fixo Neve Neve

Page 5: Árvores de Decisão: supervisionado, simbólico, não incremental (?)

LABIC

5 MCM

Árvores de Decisão (Cont)

BarômetroBarômetroBarômetroBarômetro

Aumentando

Fixo

Baixando

TempoTempoTempoTempo

Nublado

ParcialNubl.

Limpo

TempTempTempTemp

Acima 0°C

0°C

Abaixo 0°C

Sol Neve Sol

Chuva Sol Sem dados

Neve

Escolhe atributo Escolhe atributo mais relevante mais relevante primeiroprimeiro

Escolhe atributo Escolhe atributo mais relevante mais relevante primeiroprimeiro

Exclui Exclui Fatores Fatores Irrelevantes Irrelevantes (Região)(Região)

Exclui Exclui Fatores Fatores Irrelevantes Irrelevantes (Região)(Região)

Nenhuma solução Nenhuma solução descoberta: (Mais descoberta: (Mais exemplos requeridos)exemplos requeridos)

Nenhuma solução Nenhuma solução descoberta: (Mais descoberta: (Mais exemplos requeridos)exemplos requeridos)

TemperaturaTemperatura RegiãoRegião TempoTempo Barometro Barometro Predição PrediçãoAcima 0°CAcima 0°C OesteOeste NubladoNublado Baixando Baixando Chuva ChuvaAbaixo 0°CAbaixo 0°C NubladoNublado Fixo Fixo Neve NeveAcima 0°CAcima 0°C LesteLeste NubladoNublado Aumentando Sol Aumentando SolAcima 0°CAcima 0°C Parcial Nubl. FixoParcial Nubl. Fixo Sol Sol

LimpoLimpo Fixo Fixo Sol SolAcima 0°CAcima 0°C SulSul LimpoLimpo Baixando Baixando Chuva Chuva 0°C0°C NorteNorte Parcial Nubl. FixoParcial Nubl. Fixo Neve Neve

TemperaturaTemperatura RegiãoRegião TempoTempo Barometro Barometro Predição PrediçãoAcima 0°CAcima 0°C OesteOeste NubladoNublado Baixando Baixando Chuva ChuvaAbaixo 0°CAbaixo 0°C NubladoNublado Fixo Fixo Neve NeveAcima 0°CAcima 0°C LesteLeste NubladoNublado Aumentando Sol Aumentando SolAcima 0°CAcima 0°C Parcial Nubl. FixoParcial Nubl. Fixo Sol Sol

LimpoLimpo Fixo Fixo Sol SolAcima 0°CAcima 0°C SulSul LimpoLimpo Baixando Baixando Chuva Chuva 0°C0°C NorteNorte Parcial Nubl. FixoParcial Nubl. Fixo Neve Neve

Page 6: Árvores de Decisão: supervisionado, simbólico, não incremental (?)

LABIC

6 MCM

Regras de Decisão

Se Barômetro = Aumentando

então Sol.

Se Barômetro = Fixo e

Tempo = Nublado

então Neve.

Se Barômetro = Fixo e

Tempo = Parcialmente Nublado e

Temperatura = 0C

então Neve.

Page 7: Árvores de Decisão: supervisionado, simbólico, não incremental (?)

LABIC

7 MCM

Algoritmos da Família TDIDT

TDIDT TTDIDT Top op DDown own IInduction of nduction of DDecision ecision TTreesrees

Esta família agrupa os algoritmos e sistemas mais representativos que utilizam como algoritmo básico de aprendizado o ID3.

Algoritmos: ID3, ID3’, C4, C4.5, ID4, ID5, etc.

Page 8: Árvores de Decisão: supervisionado, simbólico, não incremental (?)

LABIC

8 MCM

Estágios do Processo de Aprendizado da Família TDIDT

1.construção da árvore de decisão para classificar corretamente todos os exemplos

2.poda da árvore de decisão para eliminar subárvores não confiáveis

3.processamento da árvore podada para melhorar a sua legibilidade - construção de regras a partir da árvore

Page 9: Árvores de Decisão: supervisionado, simbólico, não incremental (?)

LABIC

9 MCM

sexo cirurgia TSH TFI TT4 TI classe

ffmfm...

ffvff...

5.87.38.86.95.4...

66.270.260.265.465.2

...

156.2152.9148.4132.7150.9

...

fvfff...

negneg

hipo_primhipo_comp

neg...

Árvores de Decisão

Page 10: Árvores de Decisão: supervisionado, simbólico, não incremental (?)

LABIC

10 MCM

TSH

neg FTI

hipo_prim TI

neg cirurgia

neg TT4

hipo_comp neg

<6.05 >6.05

<64.5 >64.5

v f

v f

<150.5 >150.5

Árvores de Decisão (Cont)

Page 11: Árvores de Decisão: supervisionado, simbólico, não incremental (?)

LABIC

11 MCM

1. Seentão

2. Se e

então...

6. Se ee

ee

então

TSH < 6.05

neg

neg

hipo_prim

TSH > 6.05

TSH > 6.05

FTI < 64.5

FTI > 64.5TI = fcirurgia = fTT4 > 150.5

Regras de Decisão

Page 12: Árvores de Decisão: supervisionado, simbólico, não incremental (?)

LABIC

12 MCM

Características Gerais dos Sistemas TDIDT

Sistemas de propósito geral com o objetivo de classificar objetos: Eles produzem regras ou descrições de um determinado número de classes de objetos. Quando novos objetos são observados, estas regras devem predizer a qual classe cada um deles pertence.

Representação do Conhecimento na forma de árvores de decisão. Em geral, realizam aprendizado não incremental.

Constroem a árvore de decisão em forma top-down. Os exemplos, a partir dos quais são geradas as regras de

classificação, são conhecidos somente através dos valores de um conjunto de atributos. Por sua vez, as árvores de decisão são construídas em função destes mesmos atributos.

Page 13: Árvores de Decisão: supervisionado, simbólico, não incremental (?)

LABIC

13 MCM

Esquema Geral dos Algoritmos de Aprendizado por Exemplos

1. pré-processamento dos exemplos de aprendizado no qual deve ser considerado o tratamento de: atributos numéricos; atributos com valores desconhecidos; valores irrelevantes; valores sem significado.

O processo de aprendizado e classificação é dividido em:

2. construção de regras de classificação envolve: escolha do critério de seleção do melhor atributo na

construção da árvore de decisão tratamento de domínios com ruído ou domínios

incompletos poda na árvore de decisão

Existente para todos os paradigmas

Específico para Simbólico

Page 14: Árvores de Decisão: supervisionado, simbólico, não incremental (?)

LABIC

14 MCM

Vantagens

Podem adquirir e representar facilmente conceitos disjuntos

Podem manusear dados com ruído (dados com erros ou incertezas)

Executam pouca busca

A simplicidade do formato de representação é contrabalanceada por sua eficiência

Têm obtido muito sucesso em diversas áreas de aplicação - vários deles estão disponíveis comercialmente

Page 15: Árvores de Decisão: supervisionado, simbólico, não incremental (?)

LABIC

15 MCM

Desvantagens

Um mesmo conceito pode ser representado por várias árvores de decisão

É difícil entender um conceito representado como uma árvore de decisão grande

Limitados a uma linguagem descritiva baseada em atributos-valores