11
  Material elaborado pelo Prof. C ésar Gonçalves de Lim a 64  CAPÍTULO 4. DISTRIBUIÇÃO NORMAL MULTIVARIADA Para fazermos inferências, muitas vezes assumimos que o vetor aleatório de interesse tem uma distribuição normal multivariada. Antes de desenvolvermos a função de densidade normal multivariada, faremos uma revisão da distribuição normal univa- riada. 4.1 FUNÇÃO DENSIDADE NORMAL UNIVARIADA A distribuição normal padrão é dada por  g (  z ) = ) 2 / z ( 2 e 2 1  π , - < z <  (4.1) com  E (  z ) = 0 e var(  z ) = 1. Quando  z  tem a densidade (4.1), dizemos que “  z é distri- buída como N (0, 1)” ou, simplesmente, z  ~ N (0, 1). Para obtermos uma variável aleatória  y com média arbitrária µ  e variância σ 2 , usaremos a transformação z  = (  y – µ )/σ  ou  y =  z σ  + µ , de tal forma que  E (  y) = µ  e var(  y) = σ 2 . Para uma função contínua e crescente (como  y =  z σ  + µ ) ou para uma função contínua e decrescente, a técnica de troca de variável para integral definida dá  f (  y) = g (  z )  dy dz  (4.2) onde |d  z /d  y| é o valor absoluto de d  z /d  y (ver Hogg & Craig, 1995, p.169). Para usar (4.2) para encontrar a densidade de y,  z e dz/dy  devem estar expressos em termos de  y. A densidade g (  z ) é dada em (4.1) e para z  = (  y – µ )/σ , temos |dz/dy| = 1/σ . Assim  f (  y) = g (  z ) dy dz  =        − σ µ  y  g σ 1  = 2 2 2 ) ( e 2 1  σ µ π σ /  y  (4.3) que é a densidade normal da variável y, com E (  y) = µ  e var(  y) = σ 2 . Quando  y tem a densidade (4.3), dizemos que y ~ N (µ , σ 2 ).  Na próxima seção (4.2) usaremos uma extensão multivariada desta técnica par a encontrar a função de densidade da normal multivariada. 4.2 FUNÇÃO DE DENSIDADE NORMAL MULTIVARIADA Iniciaremos com as variáveis normais padronizadas independentes z 1 , z 2 , ..., z  p  com µ i  = 0 e var(  z i ) = 2 i σ = 1 para todo i e ij σ  = 0 para i ≠   j, e as transformaremos em variá- veis normais multivariadas y 1 ,  y 2 , ...,  y  p , com médias, variâncias e covariâncias arbi- trárias.

verde.esalq.usp.br_~jorge_cursos_cesar_Capitulo_4

Embed Size (px)

Citation preview

  • Material elaborado pelo Prof. Csar Gonalves de Lima

    64 CAPTULO 4. DISTRIBUIO NORMAL MULTIVARIADA Para fazermos inferncias, muitas vezes assumimos que o vetor aleatrio de interesse tem uma distribuio normal multivariada. Antes de desenvolvermos a funo de densidade normal multivariada, faremos uma reviso da distribuio normal univa-riada. 4.1 FUNO DENSIDADE NORMAL UNIVARIADA A distribuio normal padro dada por

    g(z) = )2/z(2

    e21 , - < z < (4.1)

    com E(z) = 0 e var(z) = 1. Quando z tem a densidade (4.1), dizemos que z distri-buda como N(0, 1) ou, simplesmente, z ~ N(0, 1). Para obtermos uma varivel aleatria y com mdia arbitrria e varincia 2, usaremos a transformao z = (y )/ ou y = z + , de tal forma que E(y) = e var(y) = 2. Para uma funo contnua e crescente (como y = z + ) ou para uma funo contnua e decrescente, a tcnica de troca de varivel para integral definida d

    f(y) = g(z) dydz (4.2)

    onde |dz/dy| o valor absoluto de dz/dy (ver Hogg & Craig, 1995, p.169). Para usar (4.2) para encontrar a densidade de y, z e dz/dy devem estar expressos em termos de y. A densidade g(z) dada em (4.1) e para z = (y )/, temos |dz/dy| = 1/. Assim

    f(y) = g(z) dydz =

    yg

    1 = 22 2)(e

    21

    / y (4.3)

    que a densidade normal da varivel y, com E(y) = e var(y) = 2. Quando y tem a densidade (4.3), dizemos que y ~ N(, 2). Na prxima seo (4.2) usaremos uma extenso multivariada desta tcnica para encontrar a funo de densidade da normal multivariada. 4.2 FUNO DE DENSIDADE NORMAL MULTIVARIADA Iniciaremos com as variveis normais padronizadas independentes z1, z2, ..., zp com i = 0 e var(zi) = 2i = 1 para todo i e ij = 0 para i j, e as transformaremos em vari-veis normais multivariadas y1, y2, ..., yp, com mdias, varincias e covarincias arbi-trrias.

  • Material elaborado pelo Prof. Csar Gonalves de Lima

    65Comearemos com um vetor aleatrio z = [z1, z2, ..., zp] onde E(z) = 0 e cov(z) = I e cada zi ~ N(0,1). Desejamos transformar z em um vetor aleatrio normal multivariado y = [y1, y2, ..., yp], com E(y) = e cov(y) = , onde um vetor px1 e uma matriz pxp, positiva definida.

    Por (4.1) e uma extenso de (3.12) temos que

    g(z1, z2, ..., zp) = g(z ) = g(z1) g(z2) g(zp)

    =

    )2( 21e21 /z

    )2( 22e

    21 /z

    )2( 2e

    21 /pz

    = ( )2/

    1

    2

    2

    1 =p

    iiz

    p e = ( ) 22

    1 z/z'ep (4.4)

    Se z tem a densidade (4.4) dizemos que z tem uma densidade normal multiva-

    riada com vetor de mdias 0 e matriz de covarincias I, ou que z ~ Np(0, I), onde p a dimenso da distribuio e corresponde ao nmero de variveis em z. Para trans-formar z em y, com E(y) = e cov(y) = , arbitrrias, definimos

    y = 1/2 z + (4.5) onde 21/ a matriz (simtrica) raiz quadrada definida em (2.108). De (3.39) e (3.44) obtemos

    E(y) = E( 2/1 z + ) = 2/1 E(z) + E() = 2/1 (0) + = cov(y) = cov( 2/1 z + ) = cov( 2/1 z) = 2/1 cov(z)( 2/1 ) = 2/1 21/ =

    Note a analogia de (4.5) com y = z + na Seo 4.1.

    A densidade de y = 2/1 z + obtida fazendo uma analogia com o caso uni-variado e utilizando a mesma tcnica de troca de variveis:

    f (y) = g(z) abs ( )21/ (4.6) onde 21/ = ( ) 121 / e abs ( )21/ o valor absoluto do determinante de 21/ . Como a matriz 21/ positiva definida, podemos dispensar o valor absoluto da ex-presso (4.6) e reescrev-la como

    f (y) = g(z) ( )21/ (4.7) = g(z) 21/ (4.8)

  • Material elaborado pelo Prof. Csar Gonalves de Lima

    66

    Expressando z = 21/ (y ) e usando (4.4) e (4.8), podemos escrever a densidade de y como

    f(y) = )/2( )'(211

    )2(1 yy

    /||

    ep (4.9)

    que a funo densidade normal multivariada com vetor de mdias e matriz de co-varincias . Quando y tem a densidade (4.9) dizemos que y distribuda como Np(, ), ou simplesmente que y ~ Np(, ). O ndice p a dimenso da distribuio normal p-variada e indica o nmero de variveis envolvidas, isto , indica que y um vetor p x 1, um vetor p x 1 e uma matriz p x p. Comparando (4.9) e (4.3) podemos perceber que a distncia padronizada, defi-nida como (y ) 1 (y ), aparece no lugar de (y )2/2 no expoente e que a raiz quadrada da varincia generalizada || aparece no lugar da raiz quadrada de 2, no denominador. 4.3 FUNES GERADORAS DE MOMENTOS (Para maiores detalhes: ver Rencher, 1999, pg. 80-82) A funo geradora de momentos (f.g.m.) para uma varivel aleatria y definida como

    My(t) = E( tye ) (4.10)

    desde que E( tye ) exista para um nmero t na vizinhana h < t < h para algum h R, positivo. A funo geradora de momentos de y ~N(, 2) dada por

    My(t) = 2 22 / tte + (4.11)

    A f.g.m. caracteriza uma distribuio em alguns aspectos importantes e muito teis, servindo para gerar os momentos da distribuio. Para uma varivel aleatria contnua y

    My(t) = E( tye ) = ( )

    dyyfety

    ento (trocando a ordem da integrao e diferenciao):

    ( )dt

    tdM y = ( )tM y' = ( )

    dyyfey ty (4.12)

  • Material elaborado pelo Prof. Csar Gonalves de Lima

    67Fazendo t = 0 temos o primeiro momento ou a mdia da distribuio

    ( )( )01 =tM y = ( )( )01yM = ( )

    dyyfy = E(y) (4.13)

    De modo anlogo, o k-simo momento pode ser obtido usando a derivada de ordem k, avaliada em t = 0:

    ( )( )0=tM ky = E( ky ) (4.14) O segundo momento E(y2) pode ser usado para encontrar a varincia.

    Para um vetor aleatrio y, a funo geradora de momentos (f.g.m.) definida como

    My(t) = E ( )pp1 ytytyte +++ L221 = E( yt'e ) (4.15) Por analogia com (4.13) temos que:

    ( )t

    0ty

    =M =

    ( )t

    0y

    M = E(y) (4.16)

    Similarmente, ( )sr tt

    M

    ty2 avaliada em tr = ts = 0 fornece E(yrys), que pode ser usada no clculo da covarincia entre yr e ys.

    Teorema 4.3A Se y ~ Np(, ), sua funo geradora de momentos dada por My(t) = 2/ tt't' +e (4.18)

    Prova: ver Rencher, pg. 81 ou Searle, pg. 43-44.

    Corolrio 1. A funo geradora de momentos para y My(t) = 2/ tt'e (4.22)

    Essas duas propriedades da funo geradora de momentos sero muito importantes nos prximos captulos: 1. Se dois vetores aleatrios tm a mesma funo geradora de momentos, elas tm a

    mesma densidade. 2. Dois vetores aleatrios so independentes se e somente se a sua funo geradora

    de momentos conjunta puder ser fatorada no produto de suas duas funes gera-doras de momento individuais; isto , se y= [ ,, y,y 21 ] e t= [

    ,, tt 21 , ], ento y1 e y2 so independentes se e somente se

    My(t) = My1(t1) My2(t2) (4.23)

  • Material elaborado pelo Prof. Csar Gonalves de Lima

    68 4.4 PROPRIEDADES DA DISTRIBUIO NORMAL MULTIVARIADA Teorema 4.4A. Seja y ~ Np(, ), seja a um vetor p x 1 de constantes e A uma matriz k x p de constantes, de posto k p. Ento (i) z = ay ~ N(a, aa) (ii) z = Ay ~ Nk(A, AA) Corolrio 1. Se b um vetor k x 1 de constantes ento

    z = Ay + b ~ Nk(A + b, AA)

    Teorema 4.4B. Se y ~ Np(, ) ento qualquer subvetor rx1 de y tem uma distribui-o normal r-variada com mdias, varincias e covarincias iguais s da distribuio normal p-variada original.

    Corolrio 1. Se y ~ Np(, ) ento qualquer varivel individual yi em y distribuda como N(i, ii). Usando a notao de (3.5), na qual o vetor v particionado em dois vetores denotados por y e x, de dimenses p x 1 e q x 1, respectivamente. Com essa partio, o vetor de mdias e a matriz de covarincias para v ficam:

    v =

    xy

    = E(v) =

    x

    y

    = cov(v) =

    xxxy

    yxyy

    Teorema 4.4C. Se o vetor particionado v =

    xy

    Np+q(, ) ento y e x so inde-pendentes se xy = 0.

    Corolrio 1. Se y ~ Np(, ), ento quaisquer duas variveis individuais yi e yj so independentes se ij = 0.

    Corolrio 2. Se y ~ Np(, ) e se cov(Ay, By) = AB = 0 ento Ay e By so inde-pendentes.

  • Material elaborado pelo Prof. Csar Gonalves de Lima

    69Teorema 4.4D. Se y e x tm distribuio conjunta normal multivariada com yx 0 ento a distribuio condicional de y dado x, f(y | x), normal multivariada com vetor de mdia e matriz de covarincias dados por:

    E(y | x) = y + )(1 xxxyx x (4.26) cov(y | x) = yy xy1 xxyx (4.27)

    (Prova: ver Rencher, pg. 84-85)

    Desde que a expresso (4.26) uma funo linear de x, qualquer par de vari-veis yi e yj em um vetor normal multivariado exibe uma tendncia linear E(yi | yj) = i + (ij /jj)(yj j). Deste modo, a covarincia ij est relacionada com a inclinao da reta. Nos casos de variveis no normais que exibem uma tendncia curvilnea, ij pode dar uma indicao muito enganadora da relao, como ilustrado no Exemplo 3.2. A matriz de covarincias condicionais em (4.26) no envolve x. Por outro lado, para algumas distribuies no-normais, cov(y | x) uma funo de x.

    Corolrio 1. Se v = [y, x1, ..., xq] = [y, x] com =

    xy e =

    xxx

    x

    y

    yy t2 , ento

    y | x tem distribuio normal (univariada) com

    E(y | x) = y + tyx )(1 xxx x (4.33) var(y | x) = 2y tyx 1xx xy (4.34)

    Como em (4.34), tyx 1xx yx 0 porque 1xx positiva definida, ento var(y | x) var(y) (4.35)

    Exemplo 4.4(a). Para ilustrar os Teoremas 4.4.A, 4.4B e 4.4C, seja y ~ N3(, ) com

    =

    213

    e =

    312110204

    i) Para z = y1 2y2 + y3 = [1 2 1] y = ay a = 3 e aa = 19 e pelo Teorema 4.4.A(i), z ~ N(3, 19)

  • Material elaborado pelo Prof. Csar Gonalves de Lima

    70ii) As funes lineares z1 = y1 y2 + y3 e z2 = 3y1 + y2 2y3 podem ser escritas

    z =

    2

    1

    zz

    =

    213111

    3

    2

    1

    yyy

    = Ay

    Ento, pelos Teoremas 3.6B(i) e 3.6D(i),

    A =

    64

    e AA =

    294

    414

    e pelo Teorema 4.4A(ii), temos que z ~ N2

    294414

    64

    .

    iii) Para ilustrar a distribuio marginal no Teorema 4.4B, vale notar que y1 ~ N(3, 4),

    y2 ~ N(1, 1) e y3 ~ N(2, 3), e que

    2

    1

    yy

    ~ N2

    1004

    13

    e

    3

    1

    yy

    ~ N2

    3224

    23

    iv) Para ilustrar o Teorema 4.4.C note que 12 = 0 y1 e y2 independentes. Exemplo 4.4(b). Para ilustrar o Teorema 4.4D, consideremos v ~ N4(, ), onde

    =

    1252

    e =

    7323361321103309

    i) Se v particionado como v = [y1, y2, x1, x2] ento

    y =

    52

    , x =

    12

    , yy =

    1009

    , yx =

    21

    33 e xx =

    7336

    De (4.26) e (4.27) obtemos:

    E(y | x) = y + )(1 xxxyx x

    =

    52

    +

    21

    33 1

    7336

    +

    12

    2

    1

    xx

    =

    +++

    21

    21

    113

    331

    314

    119

    11103

    xx

    xx

  • Material elaborado pelo Prof. Csar Gonalves de Lima

    71

    cov(y | x) = yy xy1 xxyx

    =

    1009

    21

    33 1

    7336

    2313

    =

    142424126

    331

    Assim, y | x ~ N2

    +++

    142424126

    331,

    113

    331

    314

    119

    11103

    21

    21

    xx

    xx

    Exemplo 4.4(c). Para ilustrar o Corolrio 1 do Teorema 4.4D, continuamos com o vetor v ~ N4(, ), onde e dados no Exemplo 4.4(b). Se v particionado como v = [y, x1, x2, x3] ento e ficam

    =

    1252

    e =

    7323361321103309

    i) De (4.33) temos que:

    E(y | x1, x2, x3) = y + ,x

    y

    )(1 xxx x

    = 2 + [ ]3301

    732361211

    +

    125

    3

    2

    1

    xxx

    = 795 17

    12 x + 276 x + 37

    9 x

    ii) De (4.34) ns obtemos

    var(y | x1, x2, x3) = 2y ,x y 1xx xy

    = 9 [ ]3301

    732361211

    330

    = 7

    18

    Assim, temos que y| x1, x2, x3 ~ N

    ++7

    18,79

    76

    712

    795

    321 xxx . Note ainda que

    var(y | x1, x2, x3) = 718 < var(y) = 9, o que ilustra (4.35).

  • Material elaborado pelo Prof. Csar Gonalves de Lima

    724.5 CORRELAO PARCIAL A seguir, definiremos a correlao parcial de yi e yj ajustada para um subconjunto de outros ys. Por convenincia, usaremos a notao dos Teoremas 4.4C e 4.4D, admi-tindo que y formado por um subconjunto de ys que inclui as variveis yi e yj e x, pelos outros ys.

    Seja v ~ Np+q(, ) e seja v, , e particionadas como no Teorema 4.4C e 4.4D:

    v =

    xy

    , =

    x

    y

    e =

    xxxy

    yxyy

    A covarincia de yi e yj na distribuio condicional de y dado x ser denotada por qrsij .... , onde yi e yj so duas variveis em y e x = [yr, ys, ..., yq]. Desse modo qrsij .... o (ij)-simo elemento de cov(y | x) = yy xy1 xxyx . Por exemplo: 13.567

    representa a covarincia entre y1 e y3 na distribuio condicional de y1, y2, y3, y4 dado y5, y6 e y7 (neste caso x = [y5 y6 y7]). De modo anlogo, .56722 representa a varincia de y2 dado y5, y6 e y7.

    Definimos o coeficiente de correlao parcial (populacional) entre yi e yj, na distribuio condicional de y dado x, onde x = [yr, ys, ..., yq], como

    qrsij .... = qrsjjqrsii

    qrsij

    ........

    ....

    (4.36)

    O coeficiente de correlao parcial amostral, qrsijr .... , ser discutido posteriormente, na seo 10.7. A matriz de correlaes parciais pode ser obtida a partir de (3.28) e de (4.27) como

    y.x = 1y.xD y.x 1y.xD (4.37) onde y.x = cov(y | x) = yy xy 1xxyx e y.xD = [diag( y.x )]1/2. A menos que y e x sejam independentes ( y.x = 0), a correlao parcial qrsij .... diferente da correlao usual ij = jjiiij , podendo at ter sinal contrrio. Para mostrar isso, vamos expressar qrsij .... em termos de ij. Primeiramente, vamos escrever yx em termos de suas linhas,

  • Material elaborado pelo Prof. Csar Gonalves de Lima

    73

    yx = cov(y, x) =

    qppp

    q

    q

    xyxyxy

    xyxyxy

    xyxyxy

    LMOMM

    LL

    21

    22212

    12111

    =

    t

    t

    t

    px

    2x

    1x

    (4.38)

    onde txi = [ 1xyi , 2xyi , ..., qixy ] a i-sima linha de yx . Ento, qrsij .... o (ij)-simo elemento de y.x = yy xyxxyx 1 que pode ser escrito como

    qrsij .... = ij txi 1xx xj (4.39) Supondo que ij seja positivo, ento qrsij .... < 0 se txi 1xx jx > ij . Desde que 1xx positiva definida, (4.39) mostra que qrsii .... = ii txi 1xx jx ii .

    Exemplo 4.5. Vamos comparar 12 com 12.34 usando e do Exemplo 4.4(b). De temos que

    12 = 2211

    12

    =

    )1)(9(0 = 0

    Da matriz cov(y |x) =

    142424126

    331 , obtemos

    34.12 = 34.34.

    34.

    2211

    12

    = )33/14)(33/126(

    33/24 = )14)(126(

    24 = 0,571

    que mostra a diferena entre o valor da correlao (usual) e a correlao parcial. EXERCCIOS Ver exerccios das pginas 90-92 do livro-texto.