Exercícios sobre classificação Mineração de dados

  • View
    142

  • Download
    1

Embed Size (px)

Text of Exercícios sobre classificação Mineração de dados

  • Slide 1
  • Exerccios sobre classificao Minerao de dados
  • Slide 2
  • l O que deveria ser feito, na fase de preparao de dados, para aplicar o mtodo ID3 para classificao com os dados abaixo? coralturaformalocalClasse preto32,5largoRua Canind, 123A marrom22,3Rua Borges, 456/304C marrom15,7estreitoRua Chaves, 132B amarelo31,4estreitoRua Napoleo, 45/101C
  • Slide 3
  • l O que deveria ser feito, na fase de preparao de dados, para aplicar o mtodo k-NN para classificao com os dados abaixo? coralturacomprimentotipopesoClasse preto3,251057,00150,34A marrom2,232343,00245,89C marrom1,571956,50223,55B amarelo3,143490,00342,50C
  • Slide 4
  • l O que deveria ser feito, na fase de preparao de dados, considerando uma rede neural backpropagation para classificao usando os dados abaixo? coralturacomprimentotipopesoClasse preto3,251057,00150,34A marrom2,232343,00245,89B marrom1,571956,50223,55B amarelo3,143490,00342,50A
  • Slide 5
  • l O que deveria ser feito, na fase de preparao de dados, considerando o uso do algoritmo nave bayes e os dados abaixo? coralturacomprimentotipopesoClasse preto3,251057,00150,34A marrom2,232343,00245,89B marrom1,571956,50223,55B amarelo3,143490,00342,50A
  • Slide 6
  • Considere o seguinte conjunto de treino, em que cada exemplo definido por trs atributos (A,B,C) e a classe X. Sabendo que: Entropia (S) = - (p + log 2 p + + p - log 2 p - ) Ganho (S, A) = Entropia (S) - ((|Sv| / |S|) * Entropia (Sv)), onde Sv = subconjunto de S para um valor do atributo At |Sv| = nmero de elementos de Sv |S| = nmero de elementos de S a) Qual a incerteza (entropia) associada ao conjunto de treino inicial? b) Qual o Ganho de Informao para cada um dos atributos? (log 2 1=0, log 2 0,5=-1, log 2 0,25=-2, log 2 0,75=-0,415, log 2 0,333=-1,585, log 2 0,667=-0,585) c) Face a este resultado, qual seria a rvore de deciso obtida para este conjunto de treino, construda de acordo com o critrio de maximizao do ganho de informao?
  • Slide 7
  • Dada a rvore de deciso abaixo, que regras seriam geradas pelo algoritmo C4.5?
  • Slide 8
  • Considerando os dados de treino abaixo e o algoritmo C4.5, quais seriam os intervalos de deciso considerados para o atributo Peso? PesoIdadeSexoClasse 70jovemMasc2 80adultoMasc2 60adultoFem1 75jovemMasc2 35crianaFem1 85adultoMasc2 50crianaMasc1 PesoClasse 351 501 601 702 752 802 852 Peso 65 Qual a rvore de deciso gerada?
  • Slide 9
  • Determine a classificao obtida para o exemplo C11 (Z1=C, Z2=1, Z3=1) utilizando o algoritmo naive Bayes, considerando os dados de treino abaixo e sabendo que P( E 1 |H ).P( E 2 | H)....P(E n | H).P(H ) P( E 1 ).P( E 2 )....P(E n ) P(H|E)=
  • Slide 10
  • Determine a classificao obtida para o exemplo C11 (Z1=C, Z2=1, Z3=1) utilizando o algoritmo k-NN, considerando os dados abaixo e k=1.
  • Slide 11
  • Determine a classificao obtida para o exemplo C11 (Z1=C, Z2=1, Z3=1) utilizando o algoritmo k-NN, considerando os dados abaixo, k=3, e a seguinte tabela de distncias para o atributo Z1: ABC A0 B10 C20,50
  • Slide 12
  • lgrimasastigma- tismo pressoprescrioLENTES normalsimnormalhipermetr. NO normalnonormalmiopia GELAT. normalsimnormalmiopia DURA reduzidasimaltamiopia NO reduzidanonormalhipermetr. NO normalnoaltahipermetr. NO normalnoaltamiopia GELAT. normalsimnormalmiopia DURA normalsimaltahipermetr. NO normalsimaltamiopia GELAT. normalsimnormalmiopia. DURA lgrimas 3 4 2 1 normal reduzida astigmat. simno prescrio miopiahipermetr. 1.Complete a rvore de deciso colocando no lugar dos nmeros das folhas, a classe, de forma a minimizar os erros de classificao. 2.Faa a matriz de confuso correspondente.