Upload
fernanda-caruso
View
5
Download
0
Embed Size (px)
Citation preview
Material elaborado pelo Prof. Csar Gonalves de Lima
64 CAPTULO 4. DISTRIBUIO NORMAL MULTIVARIADA Para fazermos inferncias, muitas vezes assumimos que o vetor aleatrio de interesse tem uma distribuio normal multivariada. Antes de desenvolvermos a funo de densidade normal multivariada, faremos uma reviso da distribuio normal univa-riada. 4.1 FUNO DENSIDADE NORMAL UNIVARIADA A distribuio normal padro dada por
g(z) = )2/z(2
e21 , - < z < (4.1)
com E(z) = 0 e var(z) = 1. Quando z tem a densidade (4.1), dizemos que z distri-buda como N(0, 1) ou, simplesmente, z ~ N(0, 1). Para obtermos uma varivel aleatria y com mdia arbitrria e varincia 2, usaremos a transformao z = (y )/ ou y = z + , de tal forma que E(y) = e var(y) = 2. Para uma funo contnua e crescente (como y = z + ) ou para uma funo contnua e decrescente, a tcnica de troca de varivel para integral definida d
f(y) = g(z) dydz (4.2)
onde |dz/dy| o valor absoluto de dz/dy (ver Hogg & Craig, 1995, p.169). Para usar (4.2) para encontrar a densidade de y, z e dz/dy devem estar expressos em termos de y. A densidade g(z) dada em (4.1) e para z = (y )/, temos |dz/dy| = 1/. Assim
f(y) = g(z) dydz =
yg
1 = 22 2)(e
21
/ y (4.3)
que a densidade normal da varivel y, com E(y) = e var(y) = 2. Quando y tem a densidade (4.3), dizemos que y ~ N(, 2). Na prxima seo (4.2) usaremos uma extenso multivariada desta tcnica para encontrar a funo de densidade da normal multivariada. 4.2 FUNO DE DENSIDADE NORMAL MULTIVARIADA Iniciaremos com as variveis normais padronizadas independentes z1, z2, ..., zp com i = 0 e var(zi) = 2i = 1 para todo i e ij = 0 para i j, e as transformaremos em vari-veis normais multivariadas y1, y2, ..., yp, com mdias, varincias e covarincias arbi-trrias.
Material elaborado pelo Prof. Csar Gonalves de Lima
65Comearemos com um vetor aleatrio z = [z1, z2, ..., zp] onde E(z) = 0 e cov(z) = I e cada zi ~ N(0,1). Desejamos transformar z em um vetor aleatrio normal multivariado y = [y1, y2, ..., yp], com E(y) = e cov(y) = , onde um vetor px1 e uma matriz pxp, positiva definida.
Por (4.1) e uma extenso de (3.12) temos que
g(z1, z2, ..., zp) = g(z ) = g(z1) g(z2) g(zp)
=
)2( 21e21 /z
)2( 22e
21 /z
)2( 2e
21 /pz
= ( )2/
1
2
2
1 =p
iiz
p e = ( ) 22
1 z/z'ep (4.4)
Se z tem a densidade (4.4) dizemos que z tem uma densidade normal multiva-
riada com vetor de mdias 0 e matriz de covarincias I, ou que z ~ Np(0, I), onde p a dimenso da distribuio e corresponde ao nmero de variveis em z. Para trans-formar z em y, com E(y) = e cov(y) = , arbitrrias, definimos
y = 1/2 z + (4.5) onde 21/ a matriz (simtrica) raiz quadrada definida em (2.108). De (3.39) e (3.44) obtemos
E(y) = E( 2/1 z + ) = 2/1 E(z) + E() = 2/1 (0) + = cov(y) = cov( 2/1 z + ) = cov( 2/1 z) = 2/1 cov(z)( 2/1 ) = 2/1 21/ =
Note a analogia de (4.5) com y = z + na Seo 4.1.
A densidade de y = 2/1 z + obtida fazendo uma analogia com o caso uni-variado e utilizando a mesma tcnica de troca de variveis:
f (y) = g(z) abs ( )21/ (4.6) onde 21/ = ( ) 121 / e abs ( )21/ o valor absoluto do determinante de 21/ . Como a matriz 21/ positiva definida, podemos dispensar o valor absoluto da ex-presso (4.6) e reescrev-la como
f (y) = g(z) ( )21/ (4.7) = g(z) 21/ (4.8)
Material elaborado pelo Prof. Csar Gonalves de Lima
66
Expressando z = 21/ (y ) e usando (4.4) e (4.8), podemos escrever a densidade de y como
f(y) = )/2( )'(211
)2(1 yy
/||
ep (4.9)
que a funo densidade normal multivariada com vetor de mdias e matriz de co-varincias . Quando y tem a densidade (4.9) dizemos que y distribuda como Np(, ), ou simplesmente que y ~ Np(, ). O ndice p a dimenso da distribuio normal p-variada e indica o nmero de variveis envolvidas, isto , indica que y um vetor p x 1, um vetor p x 1 e uma matriz p x p. Comparando (4.9) e (4.3) podemos perceber que a distncia padronizada, defi-nida como (y ) 1 (y ), aparece no lugar de (y )2/2 no expoente e que a raiz quadrada da varincia generalizada || aparece no lugar da raiz quadrada de 2, no denominador. 4.3 FUNES GERADORAS DE MOMENTOS (Para maiores detalhes: ver Rencher, 1999, pg. 80-82) A funo geradora de momentos (f.g.m.) para uma varivel aleatria y definida como
My(t) = E( tye ) (4.10)
desde que E( tye ) exista para um nmero t na vizinhana h < t < h para algum h R, positivo. A funo geradora de momentos de y ~N(, 2) dada por
My(t) = 2 22 / tte + (4.11)
A f.g.m. caracteriza uma distribuio em alguns aspectos importantes e muito teis, servindo para gerar os momentos da distribuio. Para uma varivel aleatria contnua y
My(t) = E( tye ) = ( )
dyyfety
ento (trocando a ordem da integrao e diferenciao):
( )dt
tdM y = ( )tM y' = ( )
dyyfey ty (4.12)
Material elaborado pelo Prof. Csar Gonalves de Lima
67Fazendo t = 0 temos o primeiro momento ou a mdia da distribuio
( )( )01 =tM y = ( )( )01yM = ( )
dyyfy = E(y) (4.13)
De modo anlogo, o k-simo momento pode ser obtido usando a derivada de ordem k, avaliada em t = 0:
( )( )0=tM ky = E( ky ) (4.14) O segundo momento E(y2) pode ser usado para encontrar a varincia.
Para um vetor aleatrio y, a funo geradora de momentos (f.g.m.) definida como
My(t) = E ( )pp1 ytytyte +++ L221 = E( yt'e ) (4.15) Por analogia com (4.13) temos que:
( )t
0ty
=M =
( )t
0y
M = E(y) (4.16)
Similarmente, ( )sr tt
M
ty2 avaliada em tr = ts = 0 fornece E(yrys), que pode ser usada no clculo da covarincia entre yr e ys.
Teorema 4.3A Se y ~ Np(, ), sua funo geradora de momentos dada por My(t) = 2/ tt't' +e (4.18)
Prova: ver Rencher, pg. 81 ou Searle, pg. 43-44.
Corolrio 1. A funo geradora de momentos para y My(t) = 2/ tt'e (4.22)
Essas duas propriedades da funo geradora de momentos sero muito importantes nos prximos captulos: 1. Se dois vetores aleatrios tm a mesma funo geradora de momentos, elas tm a
mesma densidade. 2. Dois vetores aleatrios so independentes se e somente se a sua funo geradora
de momentos conjunta puder ser fatorada no produto de suas duas funes gera-doras de momento individuais; isto , se y= [ ,, y,y 21 ] e t= [
,, tt 21 , ], ento y1 e y2 so independentes se e somente se
My(t) = My1(t1) My2(t2) (4.23)
Material elaborado pelo Prof. Csar Gonalves de Lima
68 4.4 PROPRIEDADES DA DISTRIBUIO NORMAL MULTIVARIADA Teorema 4.4A. Seja y ~ Np(, ), seja a um vetor p x 1 de constantes e A uma matriz k x p de constantes, de posto k p. Ento (i) z = ay ~ N(a, aa) (ii) z = Ay ~ Nk(A, AA) Corolrio 1. Se b um vetor k x 1 de constantes ento
z = Ay + b ~ Nk(A + b, AA)
Teorema 4.4B. Se y ~ Np(, ) ento qualquer subvetor rx1 de y tem uma distribui-o normal r-variada com mdias, varincias e covarincias iguais s da distribuio normal p-variada original.
Corolrio 1. Se y ~ Np(, ) ento qualquer varivel individual yi em y distribuda como N(i, ii). Usando a notao de (3.5), na qual o vetor v particionado em dois vetores denotados por y e x, de dimenses p x 1 e q x 1, respectivamente. Com essa partio, o vetor de mdias e a matriz de covarincias para v ficam:
v =
xy
= E(v) =
x
y
= cov(v) =
xxxy
yxyy
Teorema 4.4C. Se o vetor particionado v =
xy
Np+q(, ) ento y e x so inde-pendentes se xy = 0.
Corolrio 1. Se y ~ Np(, ), ento quaisquer duas variveis individuais yi e yj so independentes se ij = 0.
Corolrio 2. Se y ~ Np(, ) e se cov(Ay, By) = AB = 0 ento Ay e By so inde-pendentes.
Material elaborado pelo Prof. Csar Gonalves de Lima
69Teorema 4.4D. Se y e x tm distribuio conjunta normal multivariada com yx 0 ento a distribuio condicional de y dado x, f(y | x), normal multivariada com vetor de mdia e matriz de covarincias dados por:
E(y | x) = y + )(1 xxxyx x (4.26) cov(y | x) = yy xy1 xxyx (4.27)
(Prova: ver Rencher, pg. 84-85)
Desde que a expresso (4.26) uma funo linear de x, qualquer par de vari-veis yi e yj em um vetor normal multivariado exibe uma tendncia linear E(yi | yj) = i + (ij /jj)(yj j). Deste modo, a covarincia ij est relacionada com a inclinao da reta. Nos casos de variveis no normais que exibem uma tendncia curvilnea, ij pode dar uma indicao muito enganadora da relao, como ilustrado no Exemplo 3.2. A matriz de covarincias condicionais em (4.26) no envolve x. Por outro lado, para algumas distribuies no-normais, cov(y | x) uma funo de x.
Corolrio 1. Se v = [y, x1, ..., xq] = [y, x] com =
xy e =
xxx
x
y
yy t2 , ento
y | x tem distribuio normal (univariada) com
E(y | x) = y + tyx )(1 xxx x (4.33) var(y | x) = 2y tyx 1xx xy (4.34)
Como em (4.34), tyx 1xx yx 0 porque 1xx positiva definida, ento var(y | x) var(y) (4.35)
Exemplo 4.4(a). Para ilustrar os Teoremas 4.4.A, 4.4B e 4.4C, seja y ~ N3(, ) com
=
213
e =
312110204
i) Para z = y1 2y2 + y3 = [1 2 1] y = ay a = 3 e aa = 19 e pelo Teorema 4.4.A(i), z ~ N(3, 19)
Material elaborado pelo Prof. Csar Gonalves de Lima
70ii) As funes lineares z1 = y1 y2 + y3 e z2 = 3y1 + y2 2y3 podem ser escritas
z =
2
1
zz
=
213111
3
2
1
yyy
= Ay
Ento, pelos Teoremas 3.6B(i) e 3.6D(i),
A =
64
e AA =
294
414
e pelo Teorema 4.4A(ii), temos que z ~ N2
294414
64
.
iii) Para ilustrar a distribuio marginal no Teorema 4.4B, vale notar que y1 ~ N(3, 4),
y2 ~ N(1, 1) e y3 ~ N(2, 3), e que
2
1
yy
~ N2
1004
13
e
3
1
yy
~ N2
3224
23
iv) Para ilustrar o Teorema 4.4.C note que 12 = 0 y1 e y2 independentes. Exemplo 4.4(b). Para ilustrar o Teorema 4.4D, consideremos v ~ N4(, ), onde
=
1252
e =
7323361321103309
i) Se v particionado como v = [y1, y2, x1, x2] ento
y =
52
, x =
12
, yy =
1009
, yx =
21
33 e xx =
7336
De (4.26) e (4.27) obtemos:
E(y | x) = y + )(1 xxxyx x
=
52
+
21
33 1
7336
+
12
2
1
xx
=
+++
21
21
113
331
314
119
11103
xx
xx
Material elaborado pelo Prof. Csar Gonalves de Lima
71
cov(y | x) = yy xy1 xxyx
=
1009
21
33 1
7336
2313
=
142424126
331
Assim, y | x ~ N2
+++
142424126
331,
113
331
314
119
11103
21
21
xx
xx
Exemplo 4.4(c). Para ilustrar o Corolrio 1 do Teorema 4.4D, continuamos com o vetor v ~ N4(, ), onde e dados no Exemplo 4.4(b). Se v particionado como v = [y, x1, x2, x3] ento e ficam
=
1252
e =
7323361321103309
i) De (4.33) temos que:
E(y | x1, x2, x3) = y + ,x
y
)(1 xxx x
= 2 + [ ]3301
732361211
+
125
3
2
1
xxx
= 795 17
12 x + 276 x + 37
9 x
ii) De (4.34) ns obtemos
var(y | x1, x2, x3) = 2y ,x y 1xx xy
= 9 [ ]3301
732361211
330
= 7
18
Assim, temos que y| x1, x2, x3 ~ N
++7
18,79
76
712
795
321 xxx . Note ainda que
var(y | x1, x2, x3) = 718 < var(y) = 9, o que ilustra (4.35).
Material elaborado pelo Prof. Csar Gonalves de Lima
724.5 CORRELAO PARCIAL A seguir, definiremos a correlao parcial de yi e yj ajustada para um subconjunto de outros ys. Por convenincia, usaremos a notao dos Teoremas 4.4C e 4.4D, admi-tindo que y formado por um subconjunto de ys que inclui as variveis yi e yj e x, pelos outros ys.
Seja v ~ Np+q(, ) e seja v, , e particionadas como no Teorema 4.4C e 4.4D:
v =
xy
, =
x
y
e =
xxxy
yxyy
A covarincia de yi e yj na distribuio condicional de y dado x ser denotada por qrsij .... , onde yi e yj so duas variveis em y e x = [yr, ys, ..., yq]. Desse modo qrsij .... o (ij)-simo elemento de cov(y | x) = yy xy1 xxyx . Por exemplo: 13.567
representa a covarincia entre y1 e y3 na distribuio condicional de y1, y2, y3, y4 dado y5, y6 e y7 (neste caso x = [y5 y6 y7]). De modo anlogo, .56722 representa a varincia de y2 dado y5, y6 e y7.
Definimos o coeficiente de correlao parcial (populacional) entre yi e yj, na distribuio condicional de y dado x, onde x = [yr, ys, ..., yq], como
qrsij .... = qrsjjqrsii
qrsij
........
....
(4.36)
O coeficiente de correlao parcial amostral, qrsijr .... , ser discutido posteriormente, na seo 10.7. A matriz de correlaes parciais pode ser obtida a partir de (3.28) e de (4.27) como
y.x = 1y.xD y.x 1y.xD (4.37) onde y.x = cov(y | x) = yy xy 1xxyx e y.xD = [diag( y.x )]1/2. A menos que y e x sejam independentes ( y.x = 0), a correlao parcial qrsij .... diferente da correlao usual ij = jjiiij , podendo at ter sinal contrrio. Para mostrar isso, vamos expressar qrsij .... em termos de ij. Primeiramente, vamos escrever yx em termos de suas linhas,
Material elaborado pelo Prof. Csar Gonalves de Lima
73
yx = cov(y, x) =
qppp
q
q
xyxyxy
xyxyxy
xyxyxy
LMOMM
LL
21
22212
12111
=
t
t
t
px
2x
1x
(4.38)
onde txi = [ 1xyi , 2xyi , ..., qixy ] a i-sima linha de yx . Ento, qrsij .... o (ij)-simo elemento de y.x = yy xyxxyx 1 que pode ser escrito como
qrsij .... = ij txi 1xx xj (4.39) Supondo que ij seja positivo, ento qrsij .... < 0 se txi 1xx jx > ij . Desde que 1xx positiva definida, (4.39) mostra que qrsii .... = ii txi 1xx jx ii .
Exemplo 4.5. Vamos comparar 12 com 12.34 usando e do Exemplo 4.4(b). De temos que
12 = 2211
12
=
)1)(9(0 = 0
Da matriz cov(y |x) =
142424126
331 , obtemos
34.12 = 34.34.
34.
2211
12
= )33/14)(33/126(
33/24 = )14)(126(
24 = 0,571
que mostra a diferena entre o valor da correlao (usual) e a correlao parcial. EXERCCIOS Ver exerccios das pginas 90-92 do livro-texto.