Análise Multivariada - Rede Linux IME-USP hugobz/estatistica/analise multivariada... · Análise Multivariada

  • View
    226

  • Download
    0

Embed Size (px)

Text of Análise Multivariada - Rede Linux IME-USP hugobz/estatistica/analise multivariada... · Análise...

Anlise Multivariada

G. Amaral

Anlise Multivariada

Getlio Amaral

Universidade Federal de Pernambuco

2006

Anlise Multivariada

G. Amaral

As notas de aula Apenas apresentam os tpicos deInteresse. O aluno precisa consultar os livros abaixo paraobter os conhecimentos necessrios para as provas e,futuramente, parasua vida profissional.

Livros TextosAnderson, T. A. (1984), An Introduction To MultivariateStatisticalMardia, Kent and Bibby (1979) Multivariate AnalysisJohnson and Wichern (1982) Applied Multivariate StatisticalAnalysisAvaliao1 Prova2 Trabalho (artigo, apresentao, relatrio, 5 perguntas,respostas) Sorteio toda aula3 Conjunto de Dados

Anlise Multivariada

G. Amaral

As notas de aula Apenas apresentam os tpicos deInteresse. O aluno precisa consultar os livros abaixo paraobter os conhecimentos necessrios para as provas e,futuramente, parasua vida profissional.Livros TextosAnderson, T. A. (1984), An Introduction To MultivariateStatistical

Mardia, Kent and Bibby (1979) Multivariate AnalysisJohnson and Wichern (1982) Applied Multivariate StatisticalAnalysisAvaliao1 Prova2 Trabalho (artigo, apresentao, relatrio, 5 perguntas,respostas) Sorteio toda aula3 Conjunto de Dados

Anlise Multivariada

G. Amaral

As notas de aula Apenas apresentam os tpicos deInteresse. O aluno precisa consultar os livros abaixo paraobter os conhecimentos necessrios para as provas e,futuramente, parasua vida profissional.Livros TextosAnderson, T. A. (1984), An Introduction To MultivariateStatisticalMardia, Kent and Bibby (1979) Multivariate Analysis

Johnson and Wichern (1982) Applied Multivariate StatisticalAnalysisAvaliao1 Prova2 Trabalho (artigo, apresentao, relatrio, 5 perguntas,respostas) Sorteio toda aula3 Conjunto de Dados

Anlise Multivariada

G. Amaral

As notas de aula Apenas apresentam os tpicos deInteresse. O aluno precisa consultar os livros abaixo paraobter os conhecimentos necessrios para as provas e,futuramente, parasua vida profissional.Livros TextosAnderson, T. A. (1984), An Introduction To MultivariateStatisticalMardia, Kent and Bibby (1979) Multivariate AnalysisJohnson and Wichern (1982) Applied Multivariate StatisticalAnalysis

Avaliao1 Prova2 Trabalho (artigo, apresentao, relatrio, 5 perguntas,respostas) Sorteio toda aula3 Conjunto de Dados

Anlise Multivariada

G. Amaral

As notas de aula Apenas apresentam os tpicos deInteresse. O aluno precisa consultar os livros abaixo paraobter os conhecimentos necessrios para as provas e,futuramente, parasua vida profissional.Livros TextosAnderson, T. A. (1984), An Introduction To MultivariateStatisticalMardia, Kent and Bibby (1979) Multivariate AnalysisJohnson and Wichern (1982) Applied Multivariate StatisticalAnalysisAvaliao1 Prova2 Trabalho (artigo, apresentao, relatrio, 5 perguntas,respostas) Sorteio toda aula3 Conjunto de Dados

Anlise Multivariada

G. Amaral

Pesquisas HistricasNormal Bivariada: Adrian (1808) Laplace (1811) Gauss (1823)Galton Geneticista - Correlao, Regresso eHomocedasticidadeKarl Pearson - Coeficiente de correlao para estudar problemasem gentica, biologia e outras reas.Fisher - Mtodos para agricultura, botanica e outras reas.

Anlise Multivariada

G. Amaral

Normal MultivariadaTem sido adequada para problemas de vrias reas doconhecimento como psicologia, engenharia, economia e outros.Mtodos no Paramtricos (sero abordados em seminrios)Modernos, boas possibilidades de pulicaes, melhores resultadosem muitos casos.Bootstrap Distribuio Emprica c/reamostragemKernel Distribuio estimada dos dados

Anlise Multivariada

G. Amaral

Matrix de dados

X =

x11 . . . x1p... ...xn1 . . . xnp

Seja xi a i-sima linha escrita como coluna, que dada por

x i = (xi1, . . . , xip)

Seja x(j) a j-sima coluna de X

x (j) = (x1j , . . . , xnj)

Anlise Multivariada

G. Amaral

Vetor de Mdias

x = (x1, . . . , xp)

onde xi = 1nn

r=1 xri .Matriz de covarincia

S = (sij),

onde sij = 1nn

r=1(xri xi )(xrj xj).Notao Matricial

x =1nX 1,

onde 1 = (1, . . . , 1) um vetor de dimenso n.Para a matriz de covarianncia

S =1n(X X 1

nX 11X ),

ou ainda, se H = I 1n11,

S =1nX HX

Anlise Multivariada

G. Amaral

Matriz de Correlao

R = (rij),

onde rij =sijsi sj

.

Exerccio 1 (Mardia et al, 1979, p. 11) Exemplo 1.4.1 (dados de28 rvores).Calcular, usando o R ou outro programa, o vetor de mdias, amatriz de covarincia e a matriz de correlao.Exerccio 2Fazer o download do "Atlas do desenvolvimento Humano doRecife."Escolher uma varivel quantitativa e calcular as mesmasquantidades do exerccio 1.

Anlise Multivariada

G. Amaral

Combinaes lineares

yr = a1xr1+, . . . , apxrpTransformao de Escala

yr = D1(xr x),onde r = 1, . . . , n, D = diag(si ) e diag(.) denota uma matrizdiagonal.Esta mudana torna unitria a varincia das variveis.Transformao de Mahalanobiszr = S1/2(xr x),onde S1/2S1/2 = S inversa da matriz raiz quadrada de S .S1/2 definida a partir dos autovalores e autovetores de S .Se matriz de autovetores de S e 1, . . . , p os autovalores deS ,a matriz raiz quadrada dada por

S1/2 = 1/2,

onde 1/2 = diag(1/2i ).A inversa de S1/2 por

S1/2 = 1/2,

onde 1/2 = diag(1/2i ).

Anlise Multivariada

G. Amaral

NotaoX :Matriz de Dados;xi : uma observao;x(j) uma varivel;Xi um vetor aletrio cujo o valor observado xi .

Anlise Multivariada

G. Amaral

Distribuies MultivariadasConsidere p variveis aleatrias X1, . . . ,Xp, a funo dedistribuio de probabilidade (fdp) dada por

F (x1, . . . , xp) = P(X1 x1), . . . ,Xp xp).

A funo de densidade (fd) definida por

F (x1, . . . , xn)x1 . . . xp

= f (x1, . . . , xp).

e

F (x1, . . . , xp) = xp

. . .

x1

f (u1, . . . , up)du1 . . . dup.

Anlise Multivariada

G. Amaral

IndependnciaSeja F (x1, . . . , xp) a fdp de X1, . . . ,Xp, o conjunto de variveisaleatrias X1, . . . ,Xp, mutuamente independente seF (x1, . . . , xp) = F1(x1) . . .Fp(xp),onde

Fi (xi ) =

. . .

f (u1, . . . , up)du1 . . . dup,

onde uj 6= xi

Anlise Multivariada

G. Amaral

Transformao de VariveisSe a densidade de X1, . . . ,Xp f (x1, . . . , xp), considere asseguintes p funes

yi = yi (x1, . . . , xp)A transforma ao inversa

xi = xi (y1, . . . , yp).Considere as p variveis aleatrias

Yi = yi (x1, . . . , xp)A densidade de Y1, . . . ,Yp

g(y1, . . . , yp) = f (x1(y1, . . . , yp), . . . , xp(y1, . . . , yp))|J(y1, . . . , yp)|,

onde

J(y1, . . . , yp) =

x1y1

. . . x1yp...

...xpy1

. . .xpyp

Anlise Multivariada

G. Amaral

Amostra AleatriaSeja X1, ...,Xn uma amostra aleatria de uma distribuio F (x)com vetor de mdias e matriz de covarincia .O estimador

X =n

i=1 Xin

centrado, isto , E (X ) = .Alm disto, cov(X ) = 1n.

Anlise Multivariada

G. Amaral

possvel mostrar tambm que

E (Sn) =n 1

n,

onde Sn =n

j=1(Xj X )(Xj X ).Exerccio 3Se um vetor aleatrio V tem E (V ) = v e Cov(V ) = v , proveque E (VV ) = v + vv .

Anlise Multivariada

G. AmaralNormal MultivaridaNormal univariada

f (x ;, ) = k exp12(x )1(x )

As quantidades univariadas podem ser redefinidas para o casomultivariado

x =

x1...xn

=

1...n

Anlise Multivariada

G. Amaral

=

1,1 . . . 1,m... . . . ...k,1 . . . k,m

Substituindo-se x , e por suas verses multivariadas, temos

f (x ;, ) = k exp12 (x)

1(x) .

A nica incgnita para determinar a distribuio de x k.

Anlise Multivariada

G. Amaral

Clculo da Constante k

k =

. . .

exp12 (x)

1(x) dxp . . . dx1.

Usando-se o corolrio A.1.6 (Vide Anderson, 1984, p. 586), se positiva definida, ento existe uma matriz no singular C talque

C 1C = I ,I a matriz identidade e C a tranposta de C .Considere

x = Cy ,onde y = (y1, . . . , yp).Temos que

(x )1(x ) = y C 1Cy = y y .Como

J = |C |,a constante de interesse dada por

k = Mod |C |

. . .

exp{12 y

y} dyp . . . dy1.

Anlise Multivariada

G. Amaral

Simplificando-se o integrando, temos

exp{12 y

y} =

pi=1

exp12 y

2i .

O valor da constante de interesse dado por

k = Mod |C |

. . .

exp12 y

21 . . .

exp12 y

2p dyp . . . dy1

= Mod |C |

exp12 y

2p dyp . . .

exp

12 y

21 dy1

= Mod |C |(

2)p.

Calculando-se o determinante de C, tem-se

|C ||1||C | = I ,o que resulta em

Mod |C | = 1|1|

.

Assim, a constante de interesse

1k

=

1(2)12 p.

Portanto, a funo de densidade da normal multivariada dadapor

|A|(2)

12 p

exp

12 (x)1(x)

Anlise Multivariada

G. Amaral

Exerccio 4Considere uma distribuio multivariada do vetor (x , y). Paraobter este vetor, seja u and v N(0, 1) independentes e definax = u se uv 0 enquanto x = u se uv < 0. Defina y = v .Mostre que x e y so N(0, 1), porm (x , y) no tem distribuionormal bivariada.

Anlise Multivariada

G. Amaral

Esperana e CovarinciaEsperana de Um VetorSe X = (X1, . . . ,Xp), o valor esper