29
Análise de Componentes Principais Carlos Alberto Alves Varella Doutor em Engenharia Agrícola Universidade Federal Rural do Rio de Janeiro Pós-Graduação em Agronomia Ciência do Solo: CPGA- CS Novembro 2011

Carlos Alberto Alves Varella Doutor em Engenharia Agrícola Universidade Federal Rural do Rio de Janeiro Pós-Graduação em Agronomia Ciência do Solo: CPGA-CS

Embed Size (px)

Citation preview

  • Slide 1
  • Carlos Alberto Alves Varella Doutor em Engenharia Agrcola Universidade Federal Rural do Rio de Janeiro Ps-Graduao em Agronomia Cincia do Solo: CPGA-CS Novembro 2011
  • Slide 2
  • Introduo a tcnica mais conhecida da estatstica multivariada; Pode ser utilizada para gerao de ndices e agrupamento de indivduos; Cada componente principal uma combinao linear de todas as variveis originais; So independentes entre si; importante ter uma viso conjunta de todas ou quase todas as tcnicas da estatstica multivariada para resolver a maioria dos problema prticos.
  • Slide 3
  • Construo da matriz de dados (Matriz X) Matriz de dados para p variveis e n indivduos; Caractersticas observadas so : X 1, X 2, X 3,..., X p ; A matriz de ordem n x p.
  • Slide 4
  • Matriz de Covarincia, S Obtida a partir da matriz X de dados de ordem n x p; uma estimativa da matriz de covarincia da populao ; A matriz S simtrica e de ordem p x p.
  • Slide 5
  • Padronizao dos dados Mdia zero e varincia 1 Mdia qualquer e varincia 1
  • Slide 6
  • Variveis Padronizadas A matriz Z igual a matriz de correlao R da matriz de dados X;
  • Slide 7
  • Consideraes sobre a padronizao Normalmente partimos da matriz padronizada; O resultado a partir da matriz S pode ser diferente do resultado a partir da matriz R. A padronizao s dever ser feita quando as unidades das variveis observadas no so as mesmas.
  • Slide 8
  • Determinao dos Componentes Principais Os componentes principais so determinados resolvendo-se a equao caracterstica da matriz S ou R, isto :
  • Slide 9
  • Autovalores da matriz R 1, 2, 3,..., p so as razes da equao caracterstica da matriz R ou S, ento: 1, 2, 3,..., p podem se autovalores da matriz R ou S;
  • Slide 10
  • Autovetores Para cada autovalor i existe um autovetor: ip 2i 1i i a a a a ~
  • Slide 11
  • Componente principal Y i Sendo o autovalor = i, ento o i-simo componente principal dado por: pip22i11ii XaXaXaY
  • Slide 12
  • Propriedades dos Componentes Principais A varincia do componente principal Y i igual ao valor do autovalor i : O primeiro componente o que apresenta maior varincia e assim por diante: ii YarV )Y(arV )Y( V )Y( V p21
  • Slide 13
  • Propriedades dos Componentes Principais Total de varincia das variveis originais = somatrio dos autovalores = total de varincia dos componentes principais: )Y(arV )X( V iii Os componentes principais no so correlacionados entre si: 0Y,YovC ji
  • Slide 14
  • Importncia de cada componente principal Medida pela porcentagem de varincia de cada componente em relao ao total 100 Strao 100 YarV Y V C i p 1i i i p 1i i i i
  • Slide 15
  • Nmero de componentes No existe um modelo estatstico; O nmero de ser aquele que acumula 70% ou mais de proporo da varincia total. pkonde%70100 YarV Y V Y V k 1i i k1
  • Slide 16
  • Interpretao dos componentes Verifica-se o Grau de influncia que cada varivel Xj tem sobre o componente Yi. j j1 1 j 1 j11YXj1,j XarV a X V Y V arYXCorr
  • Slide 17
  • Interpretao dos componentes Verifica-se o peso ou loading de cada varivel sobre o componente p p1 p 2 12 2 1 11 1 XarV a w, X V a w, X V a w
  • Slide 18
  • Escores dos componentes Organizao dos dados Trat (Indiv) Variveis Escores dos componentes principais X1X1 X2X2...XpXp Y1Y1 Y2Y2 YkYk 1X 11 X 12...X 1p Y 11 Y 12...Y 1k 2X 21 X 22...X 2p Y 21 Y 22...Y 2k nX n1 X n2 X np Y n1 Y n2...Y nk
  • Slide 19
  • Escores do primeiro componente para n tratamentos e p variveis O escore o valor da cominao linear; Y n1 =componente 1 do tratamento n para p variveis.
  • Slide 20
  • Exemplo de Aplicao Variveis originais observadas (X1 e X2) e padronizados (Z1 e Z2). Duas variveis para cinco tratamentos (k=5). Tratamentos Variveis originaisVariveis padronizadas X1X1 X2X2 Z1Z1 Z2Z2 110296 24,38276,9554 210487 24,86086,3033 310162 24,14364,4920 49368 22,23134,9268 510077 23,90465,5788 Varincia17,50190,50 11
  • Slide 21
  • Padronizao da Varincia Os dados sero padronizados para varincia 1:
  • Slide 22
  • Matriz de Correlao Elementos da diagonal principal igual a 1. Significa a correlao entre mesmas variveis; Elementos fora da diagonal principal igual a 0,5456. Significa a correlao entre as variveis (X1,X2).
  • Slide 23
  • Autovalores da matriz de correlao So os elementos fora da diagonal principal da matriz. Significa a varincia de cada componente principal. 1 = 1,5456 e 2 = 0,4544
  • Slide 24
  • Trao da matriz de correlao Somatrio dos elementos da diagonal da matriz. Significa o total de varincia. Trao(R) = 1+1=2
  • Slide 25
  • Primeiro autovetor da matriz de correlao So os coeficientes das variveis padronizadas Z1, Z2. Y1 a combinao linear de Z1, Z2 que denominamos de primeiro componente principal
  • Slide 26
  • Resultados da anlise Varincia, ponderao, correlao, % de varincia e % de varincia acumulada dos componentes principais. CPVarincia () PonderaoCorrelao entre Zj eYi % de varincia % de varincia acumulada dos Y i Z1Z1 Z2Z2 Z1Z1 Z2Z2 Y11,54560,707 0,879 77,28 Y20,4544-0,7070,707-0,4760,47622,72100,00
  • Slide 27
  • Escores dos componentes principais Tratamentos Componentes principais Y1Y1 Y2Y2 122,16-12,32 222,04-13,12 320,25-13,90 419,20-12,24 520,85-12,96
  • Slide 28
  • Grfico de disperso Permite visualizar se os componentes principais (Y is ) so capazes de discriminar indivduos da populao ( ) utilizando caractersticas (X i ). 19 20 21 22 23 -14-13.5-13-12.5-12 Segundo componente (Y2) Primeiro componente (Y1)
  • Slide 29
  • Aula prtica com o programa computacional SAS Material didtico: http://www.ufrrj.br/institutos/it/deng/varella/multivariada.htm http://www.ufrrj.br/institutos/it/deng/varella/multivariada.htm Disciplina: Anlise Multivariada Aplicada as Cincias Agrrias.Aula prtica: 14-17 com SAS.