Upload
jera
View
20
Download
0
Embed Size (px)
DESCRIPTION
Árvores de Decisão: supervisionado, simbólico, não incremental (?). Árvores de Decisão. Pode-se definir formalmente uma árvore de decisão como sendo:. 1.um nó folha - ou nó resposta - que contém um nome de classe, ou - PowerPoint PPT Presentation
Citation preview
LABIC
1 MCM
Árvores de Decisão: supervisionado, simbólico, não incremental (?)
Modo deAprendizado
Paradigmas deAprendizado
Linguagens deDescrição
Formas deAprendizado
- Supervisionado
- NãoSupervisionado
- Simbólico
- Estatístico
- Instance-Based
- Conexionista
- Genético
- Instâncias ouExemplos
- ConceitosAprendidos ouHipóteses
- Teoria deDomínio ouConhecimentode Fundo
- Incremental
- NãoIncremental
LABIC
2 MCM
Árvores de Decisão
1.um nó folha - ou nó resposta - que contém um nome de classe, ou
2.um nó não folha - ou nó de decisão - que contém um teste de atributo que, para cada um dos possíveis valores de atributo, tem um ramo para uma outra árvore de decisão
Pode-se definir formalmente uma árvore de decisão como sendo:
LABIC
3 MCM
Representação da AD
1
Y
2X
X
falso
falso
verdadeiro
verdadeiro
LABIC
4 MCM
Árvores de Decisão (Cont)
Padrões no conjunto de amostras são identificados.
Conjunto de exemplos experimentais observados
TemperaturaTemperatura RegiãoRegião TempoTempo Barometro Barometro Predição PrediçãoAcima 0°CAcima 0°C OesteOeste NubladoNublado Baixando Baixando Chuva ChuvaAbaixo 0°CAbaixo 0°C NubladoNublado Fixo Fixo Neve NeveAcima 0°CAcima 0°C LesteLeste NubladoNublado Aumentando Sol Aumentando SolAcima 0°CAcima 0°C Parcial Nubl. FixoParcial Nubl. Fixo Sol Sol
LimpoLimpo Fixo Fixo Sol SolAcima 0°CAcima 0°C SulSul LimpoLimpo Baixando Baixando Chuva Chuva 0°C0°C NorteNorte Parcial Nubl. FixoParcial Nubl. Fixo Neve Neve
TemperaturaTemperatura RegiãoRegião TempoTempo Barometro Barometro Predição PrediçãoAcima 0°CAcima 0°C OesteOeste NubladoNublado Baixando Baixando Chuva ChuvaAbaixo 0°CAbaixo 0°C NubladoNublado Fixo Fixo Neve NeveAcima 0°CAcima 0°C LesteLeste NubladoNublado Aumentando Sol Aumentando SolAcima 0°CAcima 0°C Parcial Nubl. FixoParcial Nubl. Fixo Sol Sol
LimpoLimpo Fixo Fixo Sol SolAcima 0°CAcima 0°C SulSul LimpoLimpo Baixando Baixando Chuva Chuva 0°C0°C NorteNorte Parcial Nubl. FixoParcial Nubl. Fixo Neve Neve
LABIC
5 MCM
Árvores de Decisão (Cont)
BarômetroBarômetroBarômetroBarômetro
Aumentando
Fixo
Baixando
TempoTempoTempoTempo
Nublado
ParcialNubl.
Limpo
TempTempTempTemp
Acima 0°C
0°C
Abaixo 0°C
Sol Neve Sol
Chuva Sol Sem dados
Neve
Escolhe atributo Escolhe atributo mais relevante mais relevante primeiroprimeiro
Escolhe atributo Escolhe atributo mais relevante mais relevante primeiroprimeiro
Exclui Exclui Fatores Fatores Irrelevantes Irrelevantes (Região)(Região)
Exclui Exclui Fatores Fatores Irrelevantes Irrelevantes (Região)(Região)
Nenhuma solução Nenhuma solução descoberta: (Mais descoberta: (Mais exemplos requeridos)exemplos requeridos)
Nenhuma solução Nenhuma solução descoberta: (Mais descoberta: (Mais exemplos requeridos)exemplos requeridos)
TemperaturaTemperatura RegiãoRegião TempoTempo Barometro Barometro Predição PrediçãoAcima 0°CAcima 0°C OesteOeste NubladoNublado Baixando Baixando Chuva ChuvaAbaixo 0°CAbaixo 0°C NubladoNublado Fixo Fixo Neve NeveAcima 0°CAcima 0°C LesteLeste NubladoNublado Aumentando Sol Aumentando SolAcima 0°CAcima 0°C Parcial Nubl. FixoParcial Nubl. Fixo Sol Sol
LimpoLimpo Fixo Fixo Sol SolAcima 0°CAcima 0°C SulSul LimpoLimpo Baixando Baixando Chuva Chuva 0°C0°C NorteNorte Parcial Nubl. FixoParcial Nubl. Fixo Neve Neve
TemperaturaTemperatura RegiãoRegião TempoTempo Barometro Barometro Predição PrediçãoAcima 0°CAcima 0°C OesteOeste NubladoNublado Baixando Baixando Chuva ChuvaAbaixo 0°CAbaixo 0°C NubladoNublado Fixo Fixo Neve NeveAcima 0°CAcima 0°C LesteLeste NubladoNublado Aumentando Sol Aumentando SolAcima 0°CAcima 0°C Parcial Nubl. FixoParcial Nubl. Fixo Sol Sol
LimpoLimpo Fixo Fixo Sol SolAcima 0°CAcima 0°C SulSul LimpoLimpo Baixando Baixando Chuva Chuva 0°C0°C NorteNorte Parcial Nubl. FixoParcial Nubl. Fixo Neve Neve
LABIC
6 MCM
Regras de Decisão
Se Barômetro = Aumentando
então Sol.
Se Barômetro = Fixo e
Tempo = Nublado
então Neve.
Se Barômetro = Fixo e
Tempo = Parcialmente Nublado e
Temperatura = 0C
então Neve.
LABIC
7 MCM
Algoritmos da Família TDIDT
TDIDT TTDIDT Top op DDown own IInduction of nduction of DDecision ecision TTreesrees
Esta família agrupa os algoritmos e sistemas mais representativos que utilizam como algoritmo básico de aprendizado o ID3.
Algoritmos: ID3, ID3’, C4, C4.5, ID4, ID5, etc.
LABIC
8 MCM
Estágios do Processo de Aprendizado da Família TDIDT
1.construção da árvore de decisão para classificar corretamente todos os exemplos
2.poda da árvore de decisão para eliminar subárvores não confiáveis
3.processamento da árvore podada para melhorar a sua legibilidade - construção de regras a partir da árvore
LABIC
9 MCM
sexo cirurgia TSH TFI TT4 TI classe
ffmfm...
ffvff...
5.87.38.86.95.4...
66.270.260.265.465.2
...
156.2152.9148.4132.7150.9
...
fvfff...
negneg
hipo_primhipo_comp
neg...
Árvores de Decisão
LABIC
10 MCM
TSH
neg FTI
hipo_prim TI
neg cirurgia
neg TT4
hipo_comp neg
<6.05 >6.05
<64.5 >64.5
v f
v f
<150.5 >150.5
Árvores de Decisão (Cont)
LABIC
11 MCM
1. Seentão
2. Se e
então...
6. Se ee
ee
então
TSH < 6.05
neg
neg
hipo_prim
TSH > 6.05
TSH > 6.05
FTI < 64.5
FTI > 64.5TI = fcirurgia = fTT4 > 150.5
Regras de Decisão
LABIC
12 MCM
Características Gerais dos Sistemas TDIDT
Sistemas de propósito geral com o objetivo de classificar objetos: Eles produzem regras ou descrições de um determinado número de classes de objetos. Quando novos objetos são observados, estas regras devem predizer a qual classe cada um deles pertence.
Representação do Conhecimento na forma de árvores de decisão. Em geral, realizam aprendizado não incremental.
Constroem a árvore de decisão em forma top-down. Os exemplos, a partir dos quais são geradas as regras de
classificação, são conhecidos somente através dos valores de um conjunto de atributos. Por sua vez, as árvores de decisão são construídas em função destes mesmos atributos.
LABIC
13 MCM
Esquema Geral dos Algoritmos de Aprendizado por Exemplos
1. pré-processamento dos exemplos de aprendizado no qual deve ser considerado o tratamento de: atributos numéricos; atributos com valores desconhecidos; valores irrelevantes; valores sem significado.
O processo de aprendizado e classificação é dividido em:
2. construção de regras de classificação envolve: escolha do critério de seleção do melhor atributo na
construção da árvore de decisão tratamento de domínios com ruído ou domínios
incompletos poda na árvore de decisão
Existente para todos os paradigmas
Específico para Simbólico
LABIC
14 MCM
Vantagens
Podem adquirir e representar facilmente conceitos disjuntos
Podem manusear dados com ruído (dados com erros ou incertezas)
Executam pouca busca
A simplicidade do formato de representação é contrabalanceada por sua eficiência
Têm obtido muito sucesso em diversas áreas de aplicação - vários deles estão disponíveis comercialmente
LABIC
15 MCM
Desvantagens
Um mesmo conceito pode ser representado por várias árvores de decisão
É difícil entender um conceito representado como uma árvore de decisão grande
Limitados a uma linguagem descritiva baseada em atributos-valores