verde.esalq.usp.br_~jorge_cursos_cesar_Capitulo_4

Material elaborado pelo Prof. Csar Gonalves de Lima

64 CAPTULO 4. DISTRIBUIO NORMAL MULTIVARIADA Para fazermos inferncias, muitas vezes assumimos que o vetor aleatrio de interesse tem uma distribuio normal multivariada. Antes de desenvolvermos a funo de densidade normal multivariada, faremos uma reviso da distribuio normal univa-riada. 4.1 FUNO DENSIDADE NORMAL UNIVARIADA A distribuio normal padro dada por

g(z) = )2/z(2

e21 , - < z < (4.1)

com E(z) = 0 e var(z) = 1. Quando z tem a densidade (4.1), dizemos que z distri-buda como N(0, 1) ou, simplesmente, z ~ N(0, 1). Para obtermos uma varivel aleatria y com mdia arbitrria e varincia 2, usaremos a transformao z = (y )/ ou y = z + , de tal forma que E(y) = e var(y) = 2. Para uma funo contnua e crescente (como y = z + ) ou para uma funo contnua e decrescente, a tcnica de troca de varivel para integral definida d

f(y) = g(z) dydz (4.2)

onde |dz/dy| o valor absoluto de dz/dy (ver Hogg & Craig, 1995, p.169). Para usar (4.2) para encontrar a densidade de y, z e dz/dy devem estar expressos em termos de y. A densidade g(z) dada em (4.1) e para z = (y )/, temos |dz/dy| = 1/. Assim

f(y) = g(z) dydz =

yg

1 = 22 2)(e

21

/ y (4.3)

que a densidade normal da varivel y, com E(y) = e var(y) = 2. Quando y tem a densidade (4.3), dizemos que y ~ N(, 2). Na prxima seo (4.2) usaremos uma extenso multivariada desta tcnica para encontrar a funo de densidade da normal multivariada. 4.2 FUNO DE DENSIDADE NORMAL MULTIVARIADA Iniciaremos com as variveis normais padronizadas independentes z1, z2, ..., zp com i = 0 e var(zi) = 2i = 1 para todo i e ij = 0 para i j, e as transformaremos em vari-veis normais multivariadas y1, y2, ..., yp, com mdias, varincias e covarincias arbi-trrias.


65Comearemos com um vetor aleatrio z = [z1, z2, ..., zp] onde E(z) = 0 e cov(z) = I e cada zi ~ N(0,1). Desejamos transformar z em um vetor aleatrio normal multivariado y = [y1, y2, ..., yp], com E(y) = e cov(y) = , onde um vetor px1 e uma matriz pxp, positiva definida.

Por (4.1) e uma extenso de (3.12) temos que

g(z1, z2, ..., zp) = g(z ) = g(z1) g(z2) g(zp)

=

)2( 21e21 /z

)2( 22e

21 /z

)2( 2e

21 /pz

= ( )2/

1

2

2

1 =p

iiz

p e = ( ) 22

1 z/z'ep (4.4)

Se z tem a densidade (4.4) dizemos que z tem uma densidade normal multiva-

riada com vetor de mdias 0 e matriz de covarincias I, ou que z ~ Np(0, I), onde p a dimenso da distribuio e corresponde ao nmero de variveis em z. Para trans-formar z em y, com E(y) = e cov(y) = , arbitrrias, definimos

y = 1/2 z + (4.5) onde 21/ a matriz (simtrica) raiz quadrada definida em (2.108). De (3.39) e (3.44) obtemos

E(y) = E( 2/1 z + ) = 2/1 E(z) + E() = 2/1 (0) + = cov(y) = cov( 2/1 z + ) = cov( 2/1 z) = 2/1 cov(z)( 2/1 ) = 2/1 21/ =

Note a analogia de (4.5) com y = z + na Seo 4.1.

A densidade de y = 2/1 z + obtida fazendo uma analogia com o caso uni-variado e utilizando a mesma tcnica de troca de variveis:

f (y) = g(z) abs ( )21/ (4.6) onde 21/ = ( ) 121 / e abs ( )21/ o valor absoluto do determinante de 21/ . Como a matriz 21/ positiva definida, podemos dispensar o valor absoluto da ex-presso (4.6) e reescrev-la como

f (y) = g(z) ( )21/ (4.7) = g(z) 21/ (4.8)


66

Expressando z = 21/ (y ) e usando (4.4) e (4.8), podemos escrever a densidade de y como

f(y) = )/2( )'(211

)2(1 yy

/||

ep (4.9)

que a funo densidade normal multivariada com vetor de mdias e matriz de co-varincias . Quando y tem a densidade (4.9) dizemos que y distribuda como Np(, ), ou simplesmente que y ~ Np(, ). O ndice p a dimenso da distribuio normal p-variada e indica o nmero de variveis envolvidas, isto , indica que y um vetor p x 1, um vetor p x 1 e uma matriz p x p. Comparando (4.9) e (4.3) podemos perceber que a distncia padronizada, defi-nida como (y ) 1 (y ), aparece no lugar de (y )2/2 no expoente e que a raiz quadrada da varincia generalizada || aparece no lugar da raiz quadrada de 2, no denominador. 4.3 FUNES GERADORAS DE MOMENTOS (Para maiores detalhes: ver Rencher, 1999, pg. 80-82) A funo geradora de momentos (f.g.m.) para uma varivel aleatria y definida como

My(t) = E( tye ) (4.10)

desde que E( tye ) exista para um nmero t na vizinhana h < t < h para algum h R, positivo. A funo geradora de momentos de y ~N(, 2) dada por

My(t) = 2 22 / tte + (4.11)

A f.g.m. caracteriza uma distribuio em alguns aspectos importantes e muito teis, servindo para gerar os momentos da distribuio. Para uma varivel aleatria contnua y

My(t) = E( tye ) = ( )

dyyfety

ento (trocando a ordem da integrao e diferenciao):

( )dt

tdM y = ( )tM y' = ( )

dyyfey ty (4.12)


67Fazendo t = 0 temos o primeiro momento ou a mdia da distribuio

( )( )01 =tM y = ( )( )01yM = ( )

dyyfy = E(y) (4.13)

De modo anlogo, o k-simo momento pode ser obtido usando a derivada de ordem k, avaliada em t = 0:

( )( )0=tM ky = E( ky ) (4.14) O segundo momento E(y2) pode ser usado para encontrar a varincia.

Para um vetor aleatrio y, a funo geradora de momentos (f.g.m.) definida como

My(t) = E ( )pp1 ytytyte +++ L221 = E( yt'e ) (4.15) Por analogia com (4.13) temos que:

( )t

0ty

=M =

( )t

0y

M = E(y) (4.16)

Similarmente, ( )sr tt

M

ty2 avaliada em tr = ts = 0 fornece E(yrys), que pode ser usada no clculo da covarincia entre yr e ys.

Teorema 4.3A Se y ~ Np(, ), sua funo geradora de momentos dada por My(t) = 2/ tt't' +e (4.18)

Prova: ver Rencher, pg. 81 ou Searle, pg. 43-44.

Corolrio 1. A funo geradora de momentos para y My(t) = 2/ tt'e (4.22)

Essas duas propriedades da funo geradora de momentos sero muito importantes nos prximos captulos: 1. Se dois vetores aleatrios tm a mesma funo geradora de momentos, elas tm a

mesma densidade. 2. Dois vetores aleatrios so independentes se e somente se a sua funo geradora

de momentos conjunta puder ser fatorada no produto de suas duas funes gera-doras de momento individuais; isto , se y= [ ,, y,y 21 ] e t= [

,, tt 21 , ], ento y1 e y2 so independentes se e somente se

My(t) = My1(t1) My2(t2) (4.23)


68 4.4 PROPRIEDADES DA DISTRIBUIO NORMAL MULTIVARIADA Teorema 4.4A. Seja y ~ Np(, ), seja a um vetor p x 1 de constantes e A uma matriz k x p de constantes, de posto k p. Ento (i) z = ay ~ N(a, aa) (ii) z = Ay ~ Nk(A, AA) Corolrio 1. Se b um vetor k x 1 de constantes ento

z = Ay + b ~ Nk(A + b, AA)

Teorema 4.4B. Se y ~ Np(, ) ento qualquer subvetor rx1 de y tem uma distribui-o normal r-variada com mdias, varincias e covarincias iguais s da distribuio normal p-variada original.

Corolrio 1. Se y ~ Np(, ) ento qualquer varivel individual yi em y distribuda como N(i, ii). Usando a notao de (3.5), na qual o vetor v particionado em dois vetores denotados por y e x, de dimenses p x 1 e q x 1, respectivamente. Com essa partio, o vetor de mdias e a matriz de covarincias para v ficam:

v =

xy

= E(v) =

x

y

= cov(v) =

xxxy

yxyy

Teorema 4.4C. Se o vetor particionado v =

xy

Np+q(, ) ento y e x so inde-pendentes se xy = 0.

Corolrio 1. Se y ~ Np(, ), ento quaisquer duas variveis individuais yi e yj so independentes se ij = 0.

Corolrio 2. Se y ~ Np(, ) e se cov(Ay, By) = AB = 0 ento Ay e By so inde-pendentes.


69Teorema 4.4D. Se y e x tm distribuio conjunta normal multivariada com yx 0 ento a distribuio condicional de y dado x, f(y | x), normal multivariada com vetor de mdia e matriz de covarincias dados por:

E(y | x) = y + )(1 xxxyx x (4.26) cov(y | x) = yy xy1 xxyx (4.27)

(Prova: ver Rencher, pg. 84-85)

Desde que a expresso (4.26) uma funo linear de x, qualquer par de vari-veis yi e yj em um vetor normal multivariado exibe uma tendncia linear E(yi | yj) = i + (ij /jj)(yj j). Deste modo, a covarincia ij est relacionada com a inclinao da reta. Nos casos de variveis no normais que exibem uma tendncia curvilnea, ij pode dar uma indicao muito enganadora da relao, como ilustrado no Exemplo 3.2. A matriz de covarincias condicionais em (4.26) no envolve x. Por outro lado, para algumas distribuies no-normais, cov(y | x) uma funo de x.

Corolrio 1. Se v = [y, x1, ..., xq] = [y, x] com =

xy e =

xxx

x

y

yy t2 , ento

y | x tem distribuio normal (univariada) com

E(y | x) = y + tyx )(1 xxx x (4.33) var(y | x) = 2y tyx 1xx xy (4.34)

Como em (4.34), tyx 1xx yx 0 porque 1xx positiva definida, ento var(y | x) var(y) (4.35)

Exemplo 4.4(a). Para ilustrar os Teoremas 4.4.A, 4.4B e 4.4C, seja y ~ N3(, ) com

=

213

e =

312110204

i) Para z = y1 2y2 + y3 = [1 2 1] y = ay a = 3 e aa = 19 e pelo Teorema 4.4.A(i), z ~ N(3, 19)


70ii) As funes lineares z1 = y1 y2 + y3 e z2 = 3y1 + y2 2y3 podem ser escritas

z =

2

1

zz

=

213111

3

2

1

yyy

= Ay

Ento, pelos Teoremas 3.6B(i) e 3.6D(i),

A =

64

e AA =

294

414

e pelo Teorema 4.4A(ii), temos que z ~ N2

294414

64

.

iii) Para ilustrar a distribuio marginal no Teorema 4.4B, vale notar que y1 ~ N(3, 4),

y2 ~ N(1, 1) e y3 ~ N(2, 3), e que

2

1

yy

~ N2

1004

13

e

3

1

yy

~ N2

3224

23

iv) Para ilustrar o Teorema 4.4.C note que 12 = 0 y1 e y2 independentes. Exemplo 4.4(b). Para ilustrar o Teorema 4.4D, consideremos v ~ N4(, ), onde

=

1252

e =

7323361321103309

i) Se v particionado como v = [y1, y2, x1, x2] ento

y =

52

, x =

12

, yy =

1009

, yx =

21

33 e xx =

7336

De (4.26) e (4.27) obtemos:

E(y | x) = y + )(1 xxxyx x

=

52

+

21

33 1

7336

+

12

2

1

xx

=

+++

21

21

113

331

314

119

11103

xx

xx


71

cov(y | x) = yy xy1 xxyx

=

1009

21

33 1

7336

2313

=

142424126

331

Assim, y | x ~ N2

+++

142424126

331,

113

331

314

119

11103

21

21

xx

xx

Exemplo 4.4(c). Para ilustrar o Corolrio 1 do Teorema 4.4D, continuamos com o vetor v ~ N4(, ), onde e dados no Exemplo 4.4(b). Se v particionado como v = [y, x1, x2, x3] ento e ficam

=

1252

e =

7323361321103309

i) De (4.33) temos que:

E(y | x1, x2, x3) = y + ,x

y

)(1 xxx x

= 2 + [ ]3301

732361211

+

125

3

2

1

xxx

= 795 17

12 x + 276 x + 37

9 x

ii) De (4.34) ns obtemos

var(y | x1, x2, x3) = 2y ,x y 1xx xy

= 9 [ ]3301

732361211

330

= 7

18

Assim, temos que y| x1, x2, x3 ~ N

++7

18,79

76

712

795

321 xxx . Note ainda que

var(y | x1, x2, x3) = 718 < var(y) = 9, o que ilustra (4.35).


724.5 CORRELAO PARCIAL A seguir, definiremos a correlao parcial de yi e yj ajustada para um subconjunto de outros ys. Por convenincia, usaremos a notao dos Teoremas 4.4C e 4.4D, admi-tindo que y formado por um subconjunto de ys que inclui as variveis yi e yj e x, pelos outros ys.

Seja v ~ Np+q(, ) e seja v, , e particionadas como no Teorema 4.4C e 4.4D:

v =

xy

, =

x

y

e =

xxxy

yxyy

A covarincia de yi e yj na distribuio condicional de y dado x ser denotada por qrsij .... , onde yi e yj so duas variveis em y e x = [yr, ys, ..., yq]. Desse modo qrsij .... o (ij)-simo elemento de cov(y | x) = yy xy1 xxyx . Por exemplo: 13.567

representa a covarincia entre y1 e y3 na distribuio condicional de y1, y2, y3, y4 dado y5, y6 e y7 (neste caso x = [y5 y6 y7]). De modo anlogo, .56722 representa a varincia de y2 dado y5, y6 e y7.

Definimos o coeficiente de correlao parcial (populacional) entre yi e yj, na distribuio condicional de y dado x, onde x = [yr, ys, ..., yq], como

qrsij .... = qrsjjqrsii

qrsij

........

....

(4.36)

O coeficiente de correlao parcial amostral, qrsijr .... , ser discutido posteriormente, na seo 10.7. A matriz de correlaes parciais pode ser obtida a partir de (3.28) e de (4.27) como

y.x = 1y.xD y.x 1y.xD (4.37) onde y.x = cov(y | x) = yy xy 1xxyx e y.xD = [diag( y.x )]1/2. A menos que y e x sejam independentes ( y.x = 0), a correlao parcial qrsij .... diferente da correlao usual ij = jjiiij , podendo at ter sinal contrrio. Para mostrar isso, vamos expressar qrsij .... em termos de ij. Primeiramente, vamos escrever yx em termos de suas linhas,


73

yx = cov(y, x) =

qppp

q

q

xyxyxy

xyxyxy

xyxyxy

LMOMM

LL

21

22212

12111

=

t

t

t

px

2x

1x

(4.38)

onde txi = [ 1xyi , 2xyi , ..., qixy ] a i-sima linha de yx . Ento, qrsij .... o (ij)-simo elemento de y.x = yy xyxxyx 1 que pode ser escrito como

qrsij .... = ij txi 1xx xj (4.39) Supondo que ij seja positivo, ento qrsij .... < 0 se txi 1xx jx > ij . Desde que 1xx positiva definida, (4.39) mostra que qrsii .... = ii txi 1xx jx ii .

Exemplo 4.5. Vamos comparar 12 com 12.34 usando e do Exemplo 4.4(b). De temos que

12 = 2211

12

=

)1)(9(0 = 0

Da matriz cov(y |x) =

142424126

331 , obtemos

34.12 = 34.34.

34.

2211

12

= )33/14)(33/126(

33/24 = )14)(126(

24 = 0,571

que mostra a diferena entre o valor da correlao (usual) e a correlao parcial. EXERCCIOS Ver exerccios das pginas 90-92 do livro-texto.

Documents

verde.esalq.usp.br_~jorge_cursos_cesar_Capitulo_4