73
Econometria – Prof. Adriano M. R. Figueiredo 1 UNIVERSIDADE FEDERAL DE MATO GROSSO FACULDADE DE ECONOMIA Econometria Prof. Adriano Marcos Rodrigues Figueiredo Versão de 21/01/2008 1 CUIABÁ - MT 1 Os direitos de reprodução pertencem ao autor e requer citação apropriada.

Econometria - Adriano Figueiredo

Embed Size (px)

DESCRIPTION

conta

Citation preview

  • Econometria Prof. Adriano M. R. Figueiredo

    1

    UNIVERSIDADE FEDERAL DE MATO GROSSO FACULDADE DE ECONOMIA

    Econometria Prof. Adriano Marcos Rodrigues Figueiredo

    Verso de 21/01/20081

    CUIAB - MT

    1 Os direitos de reproduo pertencem ao autor e requer citao apropriada.

  • Econometria Prof. Adriano M. R. Figueiredo

    2

    SUMRIO

    1. Introduo.......................................................................................................................... 3 2. Pressuposies do Modelo de Regresso Linear Clssico ................................................ 4

    2.1. Pressuposio 1: A relao entre Y e X linear......................................................... 6 2.2. Pressuposio 2: O erro aleatrio tem mdia zero ..................................................... 9 2.3. Pressuposio 3: O erro aleatrio tem varincia constante (presena de homocedasticidade) ............................................................................................................... 9 2.4. Pressuposio 4: Os erros aleatrios so independentes (ou no autocorrelacionados) ............................................................................................................ 10 2.5. Pressuposio 5: As variveis explicativas so no aleatrias (so fixas) ............... 11 2.6. Pressuposio 6: O erro tem distribuio normal, com mdia zero e varincia constante: ............................................................................................................................. 11 2.7. Pressuposio 7: Ausncia de relao linear exata entre as variveis explicativas (no multicolinearidade) .................................................................................. 12

    3 Estimao ........................................................................................................................ 13 Anexo 1: Estimao utilizando matrizes no Excel: ............................................................. 19 Anexo 2: Exerccios: ............................................................................................................ 20

    4 Violaes nas Pressuposies Clssicas do Modelo de Regresso Linear ..................... 24 4.1. Pressuposio 1: A relao entre Y e X linear....................................................... 24 4.2. Pressuposio 2: O erro aleatrio tem mdia zero ................................................... 31 4.3. Pressuposio 3: O erro aleatrio tem varincia constante (presena de homocedasticidade) ............................................................................................................. 37 4.4. Pressuposio 4: Os erros aleatrios so independentes (ou no autocorrelacionados) ............................................................................................................ 53 4.5. Pressuposio 5: As variveis explicativas so no aleatrias (so fixas) ............... 65 4.6. Pressuposio 6: O erro tem distribuio normal, com mdia zero e varincia constante: ............................................................................................................................. 65 4.7. Pressuposio 7: Ausncia de relao linear exata entre as variveis explicativas (no multicolinearidade) .................................................................................. 68 4.8. Resumo ..................................................................................................................... 72

    5 Referncias Bibliogrficas .............................................................................................. 73 6. Programas Recomendados .............................................................................................. 73

  • Econometria Prof. Adriano M. R. Figueiredo

    3

    1. Introduo

    A Econometria como a utilizao da estatstica aplicada economia tem como

    instrumento fundamental a anlise de regresso, que consiste na obteno dos parmetros para

    uma dada relao existente entre as variveis dependentes e independentes.

    Na regresso linear simples (RLS), estima-se a relao existente entre apenas 2

    variveis, uma dependente (endgena ou explicada), Y, e uma independente (exgena ou

    explicativa ou explicadora), X, como uma funo matemtica qualquer: Y = f (X).

    Na regresso linear mltipla (RLM), estima-se a relao existente entre mais de duas

    variveis: Y = f (X1, X2, ..., Xn).

    O modelo a ser estimado normalmente possui componente aleatrio, requerendo a

    incluso de um erro que captar os efeitos das variveis importantes para explicar Y, mas que

    no esto no modelo. Representa-se ento, o efeito das demais variveis explicativas por um

    termo aditivo ui, denominado resduo ou erro. O modelo torna-se:

    cuja expresso geral matricial

    em que uma matriz de parmetros a serem estimados (incluindo o intercepto e os

    coeficientes angulares) e um vetor de resduos ou erros aleatrios.

    O formato matricial linear aberto ser:

    1 11 1 0 1

    2 21 2 1 2

    1

    1

    1

    1

    k

    k

    n n nk k n

    Y X X

    Y X X

    Y X X

    = +

    L

    L

    M M M O M M M

    L

    Portanto, tm-se as matrizes assim nomeadas:

    1 11 1 0 1

    2 21 2 1 2

    1 x 1 x 1 1 x 1 x 1

    1

    1

    1

    k

    k

    n n nk k nn n ( k ) ( k ) n

    Y X X

    Y X XY ; X ; ;

    Y X X+ +

    = = = =

    L

    L

    M M M O M M M

    L

    A disperso dos pontos em torno da reta o resultado de um grande nmero de

    pequenas causas, cada uma delas produzindo um desvio positivo (+) ou negativo (). O desvio

    ser a diferena entre o valor observado e o valor estimado da varivel dependente do modelo.

    Portanto, tem-se ui devido a:

    omisso de variveis

  • Econometria Prof. Adriano M. R. Figueiredo

    4

    problemas de especificao

    erros de medida da varivel dependente

    Pode-se dizer que Y nunca pode ser previsto exatamente. Portanto, para cada valor de

    X, existe uma distribuio de probabilidade dos valores de Y, com mdia

    e varincia constante 2.

    O objetivo da anlise de regresso estimar uma curva atravs da nuvem de pontos do

    diagrama de disperso, sendo que a forma da curva deve ser pressuposta pelo pesquisador.

    Neste caso, a teoria a respeito da relao estudada, a anlise da disperso dos pontos e os

    estudos anteriores acerca desta relao ajudaro nesta definio.

    2. Pressuposies do Modelo de Regresso Linear Clssico

    O modelo clssico de anlise de regresso construdo com base numa srie de

    pressuposies referentes ao comportamento da populao. Estas pressuposies so descritas

    no Quadro 1. Conhecidas essas pressuposies, ser possvel estimar os parmetros do

    modelo, assim como a matriz de varincia e covarincia dos mesmos e a respectiva matriz

    para os resduos.

  • Econometria Prof. Adriano M. R. Figueiredo

    5

    Quadro 1. Pressuposies do Modelo de Regresso Linear Clssico Normal

    Pressuposio

    Expresso Matemtica* Problema (o que acontece se as

    pressuposies no forem atendidas) Notao Escalar Notao Matricial

    1. Relao Linear Yi=0 + 1 Xi1 + ... + k Xik + i

    em que i =1, 2, 3,..., n Y = X +

    No linearidade, Erro de especificao dos Xs

    2 . Mdia do erro zero E(i) = 0 para todo i E() = 0, onde e 0 so vetores nX1 Erro de especificao

    3. Varincia do erro constante E(i) = , para todo i E() = I

    Heterocedasticidade

    4. Erros independentes E(ij) = 0, i j Autocorrelao

    5. Variveis explicativas so no-estocsticas ou fixas

    X1, X2, ..., Xk so fixos Cov(Xij, i) = 0

    p/ j= 1, 2, 3, ..., n

    A matriz X no-estocstica Cov(X, ) = 0

    Erros nas variveis, Varivel dependente defasada,

    Relaes simultneas

    6. Independncia linear entre as variveis explicativas

    Ausncia de relao linear entre os Xs

    Posto de X igual ao seu nmero de colunas, isto ,

    (X) = p < n Multicolinearidade

    7. Erro tem distribuio normal i ~ N (0, )

    i = 1, 2, 3, ..., n ~ N (0, I) Erros no-normais

    * Em que Y = [Yi] um vetor nX1 das observaes da varivel dependente; X = [Xij] uma matriz nXp das observaes das variveis independentes; = [i] um vetor nX1 dos erros aleatrios; = [j], j = 0, 1, 2, ..., k um vetor pX1 de parmetros a serem estimados; a varincia do erro, tambm a ser estimada; I uma matriz identidade de ordem mXn; k o nmero de variveis independentes; p = K + 1 o nmero de parmetros; n o nmero de observaes; E significa valor esperado ou esperana matemtica. Agradeo a Andrea Francisca Conceio Mendes pela digitao desta tabela.

  • Econometria Prof. Adriano M. R. Figueiredo

    6

    A seguir faz-se a descrio rpida das pressuposies do modelo clssico de regresso.

    2.1. Pressuposio 1: A relao entre Y e X linear

    Forma funcional

    Esta pressuposio em princpio implica na considerao de uma reta estimada, ou seja,

    uma funo linear nas variveis do tipo

    0 1 1 2 2i i i k ki iY X X X= + + + + + K ou pela forma matricial:

    Y = X + em que Y o vetor de variveis explicadas, X uma matriz de variveis explicativas

    (incluindo uma coluna de uns para o intercepto) e um vetor de resduos aleatrios.

    Entretanto, deve-se atentar para outros tipos de linearidades implcitas na

    pressuposio. Tm-se os seguintes tipos de linearidades: linearidade das variveis

    explicativas (X) e linearidade dos parmetros (). A no-linearidade nas variveis s vezes

    pode ser contornada por transformaes nas variveis, mas a no-linearidade dos parmetros

    mais complicada e requer outros mtodos de estimao no-lineares.

    fcil imaginar que o comportamento de um fenmeno econmico no segue a

    relao retilnea, como por exemplo, as tradicionais relaes de oferta e demanda no

    necessariamente sero retas que se cruzam. muito mais fcil admitir que o comportamento

    de variveis econmicas seja curvilneo.

    Quando as variveis explicativas so elevadas a alguma potncia diferente de um, a

    funo que relaciona o comportamento dessas variveis com a varivel explicada ser

    diferente de uma reta e os estimadores tradicionais de Mnimos Quadrados Ordinrios

    (M.Q.O.) no mais sero vlidos.

    Existem modelos que so chamados de intrinsecamente lineares, ou que podem se

    tornar lineares por transformao das variveis. O caso mais comum na literatura econmica

    o de funes do tipo Cobb-Douglas, ou seja,

    = eXXAXY 332

    21

    1

    em que os parmetros podem assumir valores diferentes de um e, ainda, tem-se a

    multiplicao de variveis explicativas. A funo acima pode ser linearizada transformando-

    se as variveis em logaritmos, obtendo:

    lnY = lnA + 1.lnX1 + 2.lnX2 + 3. lnX3 +

  • Econometria Prof. Adriano M. R. Figueiredo

    7

    ou, simbolizando o ln por *:

    ++++= *33*22

    *110

    * XXXY

    A funo linearizada pode ser estimada da forma tradicional lembrando que os

    parmetros estimados sero agora da funo transformada, que no caso log-log (Cobb-

    Douglas), equivalem s elasticidades. A funo transformada pode ser vista como linear nos

    parmetros (os parmetros so todos em primeira potncia) e nas variveis transformadas

    (X*=lnX).

    Outros modelos no podem ser transformados e so os chamados intrinsecamente no-

    lineares. Por exemplo, possvel perceber que a funo abaixo no pode ser linearizada:

    +++= eeeAY 2513 X4X

    21

    Esses modelos devem ser estimados por Mnimos Quadrados No-Lineares ou

    Mxima Verossimilhana No-Linear.

    Algumas formas funcionais utilizadas em economia da produo podem ser:

    Cobb-Douglas logaritmizada: =

    +=n

    1iii0 xlogaaylog

    CES: =

    +=n

    1iii0 xaay

    Generalizada Leontief: = ==

    ++=n

    1i

    n

    1jjiij

    n

    1iii0 xxaxaay

    Translog: = ==

    ++=n

    1i

    n

    1jjiij

    n

    1iii0 xlogxlogaxlogaaylog

    Quadrtica: = ==

    ++=n

    1i

    n

    1jjiij

    n

    1iii0 xxaxaay

    A utilizao de uma forma mais complexa em detrimento de uma mais simples

    depender da disposio dos dados e do rigor cientfico desejado. A funo Cobb-Douglas de

    modo geral oferece um ajustamento satisfatrio e fcil de executar. As funes elasticidade

    de substituio constante (CES), Generalizada Leontief, Transcendental Logartmica e

    Quadrtica so generalizaes da funo Cobb-Douglas para contornar pressuposies

  • Econometria Prof. Adriano M. R. Figueiredo

    8

    econmicas de substitutibilidade dos fatores e produtos ou ainda de concorrncia perfeita,

    entre outras situaes.

    Juntamente ao problema da forma funcional (linearidade dos parmetros e variveis),

    quando se especifica um modelo, automaticamente esto sendo cometidos outros dois tipos de

    erros que podero ou no comprometer a anlise. Um est associado omisso de uma

    varivel relevante e outro associado incluso de varivel irrelevante.

    Omisso de varivel relevante

    Imagine que a reviso de literatura, reviso terica, indique que a quantidade

    demandada (Q) de um produto seja funo do preo do produto (P) e da renda (R), e que o

    comportamento da demanda do produto analisado na realidade est em conformidade com a

    teoria. O modelo correto seria:

    (A) Qt = 0 + 1.Pt + 2.Rt + t*

    em que os so parmetros estimados e o resduo aleatrio.

    Imagine agora que, por algum motivo, estimou-se a demanda em funo apenas do

    preo do produto, fazendo:

    (B) Qt = 0 + 1.Pt + t.

    em que so parmetros e as demais variveis como anteriormente citadas.

    A questo : quais as conseqncias sobre os estimadores de M.Q.O. (ou sobre os

    estimados)? Qual o efeito sobre 0 e 1 em razo da excluso de R do modelo?

    Se Pt for altamente correlacionado com Rt, a retirada de Rt trar um alto vis (alta

    tendenciosidade) e os parmetros estimados sero muito diferentes do valor esperado:

    estimado E()

    ou seja, os parmetros estimados sero inconsistentes e no limite E() .

    Os testes de hipteses no sero vlidos e as estimativas de varincias tambm sero

    tendenciosas.

    Incluso de varivel irrelevante

    Imagine agora a situao inversa: o modelo estimado contempla mais variveis

    explicativas do que as que deveriam estar no modelo correto. Imagine que o modelo deveria

    ter apenas P e que foi estimado com P e Z, sendo Z uma varivel irrelevante no modelo.

    (A) Qt = 0 + 1.Pt + t. modelo correto

    (B) Qt = 0 + 1.Pt + 2.Zt + t* modelo estimado

    e que Z no tem relevncia terica.

    A questo : quais as conseqncias de , em razo da incluso de Zt, sobre ?

  • Econometria Prof. Adriano M. R. Figueiredo

    9

    As conseqncias da incluso de uma varivel irrelevante sero menos problemticas

    que no caso da omisso de uma varivel relevante. Primeiro, a presena das variveis

    irrelevantes no viesa as outras estimativas. Segundo, aumentam-se a varincia dos

    parmetros e o desvio-padro. Tende, portanto, a fazer com que seja no significativo,

    mas aumenta o coeficiente R2.

    2.2. Pressuposio 2: O erro aleatrio tem mdia zero

    Significa que o erro tem uma distribuio de probabilidade centralizada em zero (com

    mdia zero). O erro o efeito das variveis que no consigo explicar no modelo. A mdia

    pode ser considerada como o valor esperado do erro, ou seja,

    E (i) = 0 , i = 1, 2, ..., n

    Ou na forma matricial,

    E() = 0

    Dado que E() = 0, ento E(Y) = E[ X + ] = E[ X] +E[ ] = E[ X] + 0

    Portanto, E(Y) = X e o modelo fornece solues adequadas estatisticamente. Essa

    pressuposio importante para ter confiana na estimao por = (XX)-1XY. Caso os

    erros no tenham mdia zero, o estimador = (XX)-1XY ser tendencioso.

    2.3. Pressuposio 3: O erro aleatrio tem varincia constante (presena de homocedasticidade)

    A varincia calculada com base no valor esperado do quadrado da diferena entre a

    mdia e o valor esperado da mdia. Ou seja, a definio estatstica

    V(ei) = E [ei E (ei)]2

    V(ei) = E (ei2) = 2 (populacional) para todo i

    ou seja, presena de Homocedasticidade nos resduos. A presena da homocedasticidade

    implica que a varincia para todos os resduos a mesma.

    O caso contrrio ser:

    V(ei) = E (ei2) = i

    2 presena de Heterocedasticidade

    O problema de heterocedasticidade tpico de dados de seo cruzada. Pode

    significar, por exemplo, uma heterogeneidade da amostra. A disperso dos valores para cada

  • Econometria Prof. Adriano M. R. Figueiredo

    10

    observao diferente entre as observaes. A amostra vem de uma populao onde os erros

    no so homogneos.

    2.4. Pressuposio 4: Os erros aleatrios so independentes (ou no autocorrelacionados)

    Neste caso pressupe-se que os erros de uma observao no afetam os erros do

    perodo seguinte, e assim sucessivamente.

    COV(ei ,ej) = E { [ei E(ei)] [ej E(ej)] }

    E (ei, ej) = 0, i j

    esta pressuposio denominada ausncia de autocorrelao. A violao desta

    pressuposio um problema tpico de sries temporais.

    Quando se trabalha com ajustamentos de sries temporais, essa pressuposio em geral

    no obedecida, visto que nas sries temporais como, por exemplo, as sries de preos, de

    salrios e de produo tm no seu comportamento o reflexo de movimentos cclicos e/ou

    sazonais.

    Algumas causas da autocorrelao nos resduos esto relacionadas a variveis no-

    especificadas no modelo, forma funcional inadequada e inrcia temporal no fenmeno.

    A principal conseqncia da violao desta pressuposio a ineficincia dos

    estimadores de M.Q.O. mas, continuam no-tendenciosos. Nesta situao, da mesma forma

    que para a heterocedasticidade, melhor utilizar o mtodo de Mnimos Quadrados

    Generalizados (M.Q.G.).

    2.4.1 Investigao acerca da Matriz de Varincia e Covarincia dos resduos

    A anlise da Matriz de Varincia e Covarincia dos resduos, doravante chamada de

    Var-cov(), permite interpretar as pressuposies de presena de homocedasticidade dos

    resduos e presena da no autocorrelao dos resduos numa mesma matriz.

    Seja o vetor de resduos do tipo:

    1

    2

    x 1n n

    =

    M

  • Econometria Prof. Adriano M. R. Figueiredo

    11

    Ento, sua transposta ser: [ ]1 2 1 x n n' = L . Assim, a matriz var-cov() ser:

    ( ) ( )

    ( )

    1

    2

    21 2 1

    22 1 2

    21 2

    2

    22

    2

    0 0

    0 0

    0 0

    n

    n

    n

    n n

    Var Cov E E

    E I E

    = =

    = =

    L

    L

    M M O M

    L

    L

    L

    M M O M

    L

    Assim, ao escrever que var-cov() = 2.I, ao mesmo tempo se diz que as varincias so

    homocedsticas iguais a 2 (diagonal principal tem todos os valores iguais a 2, i=j) e que as

    autocorrelaes entre resduos de observaes distintas so nulas (valores nulos fora da

    diagonal principal, ij).

    2.5. Pressuposio 5: As variveis explicativas so no aleatrias (so fixas)

    Neste caso, pressupem-se fixos os valores da varivel explicativa e observa-se o que

    ocorre com a varivel dependente. Se o X aleatrio, mas independente do erro, pode-se

    mostrar que os parmetros estimados sero no-tendenciosos.

    Entretanto, se as variveis explicativas e os termos aleatrios forem correlacionados,

    haver inconsistncia dos estimadores de mnimos quadrados ordinrios. Deve-se utilizar o

    estimador de variveis instrumentais. O mtodo de Variveis instrumentais prev que

    = (ZX)-1ZY , e Z uma matriz de instrumentos independentes dos erros aleatrios.

    2.6. Pressuposio 6: O erro tem distribuio normal, com mdia zero e varincia constante:

    Esta pressuposio pode ser especificada da forma:

    i N (0, 2) , i = 1, 2, ..., n

    As conseqncias associadas a no-normalidade dos resduos so parmetros

    estimados no-normais e no ser possvel fazer os testes de hipteses com distribuies

    baseadas na normal, como os usuais testes t e F para avaliar a qualidade dos

  • Econometria Prof. Adriano M. R. Figueiredo

    12

    ajustamentos, e para construir intervalos de confiana para os parmetros conforme exposto

    ao longo do curso.

    Os estimadores continuam sendo os Melhores Estimadores Lineares No-

    Tendenciosos (MELNT).

    2.7. Pressuposio 7: Ausncia de relao linear exata entre as variveis explicativas (no multicolinearidade)

    Considere a matriz de variveis explicativas como composta por colunas das variveis

    X1, X2, ... , Xn e ainda uma coluna de 1 para incluir o intercepto.

    A pressuposio prev a no existncia de qualquer relao linear, como por exemplo,

    X1 = 2.X2

    X1 + 3.X2 = X5

    No mtodo de mnimos quadrados ordinrios, a existncia de uma relao linear entre

    os Xs representa uma reduo no posto da matriz (X) e o determinante de XX ser prximo

    de zero. No caso de uma relao linear exata, haver uma singularidade perfeita na matriz

    XX e seu determinante ser prximo de zero.

    Como o mtodo de mnimos quadrados ordinrios prev a inverso da matriz XX, o

    determinante prximo de zero far com que os parmetros sejam indeterminados. A matriz

    (XX)-1 no existir e no ser possvel estimar o modelo.

    O problema da correlao entre as variveis explicativas pode ser visto da seguinte

    maneira:

    1) ausncia de correlao ou ausncia de multicolinearidade: a regresso mltipla d o mesmo

    resultado que as regresses simples quando as correlaes parciais entre as variveis

    explicativas forem nulas;

    2) correlao perfeita ou multicolinearidade perfeita: a relao linear perfeita entre os Xs

    causa a indeterminao de = (XX)-1XY pois (XX)-1 singular;

    3) alto grau de correlao entre os Xs ou multicolinearidade imperfeita: multicolinearidade

    Multicolinearidade: problema relacionado com fortes correlaes entre as variveis

    explicativas no modelo de regresso

  • Econometria Prof. Adriano M. R. Figueiredo

    13

    O enfoque diferente das outras pressuposies: um problema da amostra, enquanto

    as outras pressuposies se referiam mais ao erro e populao, enquanto esta se refere mais

    amostra. No se trata, portanto, de testar a pressuposio, mas sim de pensar como lidar com

    o problema.

    Conseqncias da multicolinearidade:

    Tericas: conseqncias sobre as propriedades dos estimadores de M.Q.O.; a

    multicolinearidade no afeta em nada as propriedades dos estimadores de M.Q.O.,

    que continuam os melhores estimadores lineares no-tendenciosos (MELNT);

    Prticas:

    1. aumenta as varincias dos parmetros estimados:

    aumenta V() = s2(XX)-1

    (XX)-1 = (1/|XX|) . Adj(XX)

    como |XX| 0 => (XX)-1 e V()

    2. aumenta erro-padro

    3. reduz t => induz no-significncia => estarei aceitando o fato de que ela

    no importante no modelo em virtude da multicolinearidade

    4. Estimativas muito sensveis: tirando uma ou duas observaes, as estimativas

    alteram muito => melhor ter um modelo onde as alteraes no alteram

    muito as estimativas, uma certa estabilidade do modelo em termos de

    magnitudes e sinais

    3 Estimao

    A estimao dos parmetros do modelo linear pressupe a satisfao aos pressupostos

    bsicos anteriormente mencionados. O princpio que norteia os clculos obter valores de

    parmetros que minimizem a Soma do Quadrado dos Resduos - SQRes.

    Ou seja, para o modelo

    FORMA ALGBRICA: Min i2 = (Yi 0 1X1i 2X2i)

    2

    FORMA MATRICIAL: Min ou Min SQRes

  • Econometria Prof. Adriano M. R. Figueiredo

    14

    O problema matemtico de otimizar, ou seja, minimizar um produto de um vetor

    linha por um vetor coluna. Portanto, deriva-se e iguala a zero obtendo a soluo para o vetor

    de parmetros. Segue abaixo:

    ( ) ( )

    ( ) 1

    2 2 0

    ' Y X Y X

    ' Y Y Y X X Y X X

    ( ' ) X Y X X

    X X X Y

    X X X Y

    =

    = +

    = + =

    =

    =

    Portanto, o estimador dos parmetros pelo mtodo de Mnimos Quadrados Ordinrios

    (MQO) :

    ( ) 1(k+1 x 1) X X X Y =

    Assim, com as matrizes X e Y posso obter os parmetros estimados.

    O estimador da varincia dos resduos ser s2, para os (n-p) Graus de Liberdade (GL =

    nmero de observaes, n, menos o nmero de parmetros, p):

    2 SQRes SQRese esn p n p G.L.

    = = =

    A matriz de varincia-covarincia dos parmetros ser:

    ( )( )

    ( )

    ( ) ( ) ( ) ( )

    ( )

    ( )

    ( )( ) ( )( )( ) ( )

    1

    1 1 1

    1

    1

    1 1

    1 1

    Var Cov( ) E

    mas

    X X X Y

    X X X X X X X X X X X

    I . X X X

    X X X

    Var Cov( ) E X X X X X X

    Var Cov( ) E X X X X X X

    =

    =

    = + = +

    = +

    =

    =

    =

    Mas como X so fixas, independentes dos resduos, o valor esperado se reduz a:

    Sistema de equaes normais dos mnimos quadrados

    Vlida para no multicolinearidade de X

  • Econometria Prof. Adriano M. R. Figueiredo

    15

    ( ) [ ] ( )( ) ( )

    1 1

    1 12

    Var Cov( ) X X X E X X X

    Var Cov( ) X X X IX X X

    =

    =

    Ou seja,

    ( ) ( )

    ( )

    ( )

    ( )

    1 12

    12

    12

    12

    Var Cov( ) X X X X X X

    Var Cov( ) I X X

    Var Cov( ) X X

    ou

    Var Cov( ) s X X

    =

    =

    =

    =

    Desta forma, tem-se as equaes essenciais para a estimao. Segue quadro resumo

    abaixo, com os estimadores de MQO.

    Quadro 2. Estimadores de Mnimos Quadrados Ordinrios.

    ( )

    ( )

    1

    2

    12

    SQRes SQRes

    X X X Y

    e es

    n p n p G.L.

    Var Cov( ) s X X

    =

    = = =

    =

    O valor dos erros padres dos parmetros sero obtidos a partir da raiz da varincia

    dos parmetros, ou seja, tirando-se a raiz da diagonal principal da var-cov().

    Os parmetros devem ter anlise de significncia, por meio de um teste de hiptese do

    tipo t-Student:

    0

    1

    0

    0

    j

    j

    j

    j

    calculado n p

    G.L.

    H :

    H : ( bilateral )

    t ~ t

    s

    =

    =

    Os softwares economtricos em geral disponibilizam o valor da probabilidade (p-

    value) associado ao valor de t calculado. Desta forma, pode-se comparar com nveis

    predeterminados de significncia para rejeitar ou no a hiptese nula. Em geral, costuma-se

    observar os p-values comparando a 10%, 5% ou 1% para concluir a respeito da hiptese nula.

    Espera-se, para que a varivel X tenha efeito no-nulo sobre Y, que rejeite-se a hiptese nula

    e que assim, os valores calculados dos parmetros permitam uma interpretao econmica

    deste efeito.

    Estimadores dos parmetros

    Estimador da var-cov dos resduos

    Estimador da var-cov dos parmetros

  • Econometria Prof. Adriano M. R. Figueiredo

    16

    Para auxiliar o entendimento, possvel decompor a variao de Y como abaixo:

    Variao total = variao explicada por X + variao no-explicada

    : variao devida regresso

    SQTot=SQReg + SQRes

    Em que SQTot a soma dos quadrados totais (relativa variao total), SQRes a

    soma do quadrado dos resduos (relativa variao no explicada) e SQReg a soma dos

    quadrados da regresso (relativa variao explicada por X).

    ( )

    ( )

    22 2 2 2

    2

    22 2

    SQTot 2

    SQRes

    SQReg

    SQTot SQReg + SQRes

    i i i i i i

    i

    i i

    y y y e e Y Y Y Y nY

    e e' e Y Y X Y

    y Y Y Y Y nY

    = = + + = =

    = = =

    = = =

    =

    O coeficiente de determinao (R2 R-squared) utilizado para avaliar quanto da

    variao total explicada. Define-se como:

    Y

    X

    + (reta estimada)

  • Econometria Prof. Adriano M. R. Figueiredo

    17

    Seu intervalo de variao de zero a um em condies normais: 0 < R2 < 1.

    Se SQRes=SQT ento R2=0.

    Se SQRes 0 ento R2=1.

    Ou seja, mede quanto da Variao de Y est sendo explicada por Variaes de X, ou

    seja, mede a qualidade do ajustamento. Procura-se estimar um modelo com o maior R2

    possvel. Em geral, acredita-se ter um modelo bem ajustado para valores maiores que 0,8, mas

    sempre se deve ter cautela quanto a esses indicadores usualmente aceitos.

    Na forma matricial, o clculo ser;

    22

    2 21

    X Y nY Y Y X YR

    Y Y nY Y Y nY

    = =

    Outro indicador til, principalmente para comparaes entre modelos o R2 ajustado

    (adjusted R-squared). Ele recebe este nome, pois se faz um ajustamento de SQRes e de SQTot

    quanto aos graus de liberdade da respectiva variao. Assim, tem-se:

    ( )

    ( )

    2

    SQResn-p

    1SQTot

    n-1

    R =

    Em gral, quanto maior o nmero de variveis X, maior o valor de R2, mas para o R2

    ajustado esta regra no vale. Justamente para evitar a incluso equivocada de variveis

    explicativas que se usa o R2 ajustado. Assim, a incluso de uma varivel irrelevante poder

    elevar o valor de R2, mas no necessariamente elevar o valor de R2 ajustado.

    Se n for grande e p pequeno em relao a n, a diferena entre 2R e

    2R ser pequena.

    Se n for pequeno e p grande em relao a n, a diferena entre ambos pode ser grande e o valor

    ajustado ser mais importante.

    Outro indicador o Teste F da regresso (F-statistic). Procura-se saber se o modelo

    tem suporte estatstico. o Teste de significncia global da regresso: os Xs em conjunto

    explicam Y de forma significativa. A hiptese nula de que todos os parmetros em conjunto

    so nulos. A Hiptese alternativa prev pelo menos um parmetro no nulo.

    0 1 2

    1

    0 0 0

    0k

    i

    H : , ,...,

    H : pelo menos um

    = = =

    Define-se a estatstica de teste como:

  • Econometria Prof. Adriano M. R. Figueiredo

    18

    1

    SQRegp-1

    SQResn-p

    p ,n p

    G.L.

    F ~ F =

    Se Fcalculado > Ftabelado , ento rejeita-se H0 e concluo pela existncia de ao menos um X

    explicando Y. Deseja-se um P-value (F de significao) menor que 10%, 5% ou 1%,

    similarmente ao teste de t dos parmetros.

    Esses indicadores em geral so obtidos em todos os softwares economtricos ou

    estatsticos. Pode-se mencionar alguns: Excel, Eviews, Stata, SAS, SPSS, Gauss, MatLab,

    TSP. Alguns sites podem auxiliar ao leitor:

    http://www.oswego.edu/~economic/econsoftware.htm

    http://www.economics.ltsn.ac.uk/software/econometrics.htm

    http://emlab.berkeley.edu/eml/index.shtml

    O anexo apresenta rotinas para execuo dos clculos usando matrizes no Excel. Um

    software bastante interessante, plataforma livre e com verso em portugus o GRETL, no

    link: http://gretl.sourceforge.net/gretl_portugues.html .

  • Econometria Prof. Adriano M. R. Figueiredo

    19

    Anexo 1: Estimao utilizando matrizes no Excel:

    1. Entrada dos dados:

    a. Digitar matriz de dados X e Y no Excel i. Gujarati p.279 X(10x2) e Y(10x1)

    2. Copiar X e colar especial selecionando transpor, fazendo X (2x10) 3. Fazer multiplicao X.X (2x10).(10x2) = XX(2x2)

    a. Seleciona a rea de sada (2x2) b. Inserir frmula matemtica Matriz.mult

    i. Matriz 1 = X ii. Matriz 2 = X

    c. Teclar OK d. Teclar F2 e. Teclar Shift+Control+Enter todas ao mesmo tempo para aparecerem todos os

    dados da matriz XX (2x2) i. Gujarati p.284

    4. Fazer inversa de XX fazendo (XX)-1

    a. Selecionar rea de sada (2x2) b. Inserir frmula matemtica Matriz.inverso c. Matriz = XX d. Teclar OK e. Teclar F2 f. Teclar Shift+Control+Enter todas ao mesmo tempo para aparecerem todos os

    dados da matriz (XX)-1 (2x2) i. Gujarati p.285

    5. Fazer XY (2x10).(10x1) = XY(2x1)

    a. Selecionar rea de sada (2x1) b. Inserir frmula Matriz.mult

    i. Matriz 1 = X ii. Matriz 2 = Y

    c. Teclar OK d. Teclar F2 e. Teclar Shift+Control+Enter todas ao mesmo tempo para aparecerem todos os

    dados da matriz (XY) (2x1) i. Gujarati p.285

    6. Clculo de beta estimado

    a. Betaest = (XX)-1(2x2) (XY)(2x1) = (XX)-1(XY)(2x1)

    i. Selecionar sada 2x1 ii. Inserir frmula Matriz.mult

    1. matriz 1 = (XX)-1 2. matriz 2 = (XY)

    b. Teclar OK c. Teclar F2

  • Econometria Prof. Adriano M. R. Figueiredo

    20

    d. Teclar Shift+Control+Enter todas ao mesmo tempo para aparecerem todos os dados da matriz (betaest) (2x1)

    i. Gujarati p.285

    7. Para obter Matriz de var-cov(betaest) fazer a. ' = YY betaest. XY

    i. Calcular YY pela funo Matriz.mult ii. Calcular betaest. XY pela funo Matriz.mult

    1. matriz 1 = betaest 2. matriz 2 = XY

    iii. Fazer diferena i ii b. Calcular sigma quadrado: s2 = /(n-k)

    i. n-k = graus de liberdade c. Calcular var-cov(betaest) = s2.(XX)-1 (2x2)

    i. Fazer multiplicao de escalar por cada elemento de (XX)-1

    8. Fazer a raiz quadrada dos elementos da diagonal, obtendo os erros padres dos parmetros estimados: utilizar a funo RAIZ() do Excel.

    9. Calcular o valor de t fazendo t = betaest/erropbeta . O valor da probabilidade do teste

    pode ser obtido pela funo estatstica do Excel, fazendo DISTT(t;n-p;2) que retornar o valor da probabilidade para P(t> t) para o valor t, para n-p graus de liberdade e 2 caudas (bicaudal).

    10. Calcular R2

    a. R2 = SQE/SQT = (betaest.XY n.Y 2)/(YY - n.Y 2) i. Y = mdia de Y

    b.

    1n

    SQTpn

    sReSQ

    1

    1n

    SQT1p

    SQE

    R 2

    =

    =

    c. )GL(pn,1pF~

    pn

    sReSQ1p

    SQE

    F

    =

    Anexo 2: Exerccios:

    1. De acordo com a metodologia economtrica, responda verdadeiro (V) ou falso (F): ( ) A heterocedasticidade um problema no modelo de regresso clssico pois altera os

    erros-padres dos parmetros.

    ( ) A expresso ( ) YXXX ''1= permite o clculo dos parmetros por MQO.

    ( ) A existncia de resduos autocorrelacionados implica em interdependncia entre os mesmos.

    ( ) A aceitao da hiptese nula do teste t-Student dos parmetros implica na existncia de efeitos da varivel X sobre Y no modelo Y = f(X) +

  • Econometria Prof. Adriano M. R. Figueiredo

    21

    ( ) sempre desejvel acrescentar variveis ao modelo de regresso at o limite de dez regressores.

    ( ) A expresso para obteno dos parmetros por Mnimos Quadrados Ordinrios,

    ( ) YXXX '' 1= pode ser utilizada para um modelo logaritmizado linear. ( ) A pressuposio de no-autocorrelao dos resduos implica em covarincias nulas

    entre os mesmos. ( ) A estimao realizada pela Ferramenta de Anlise de Dados de Regresso no Excel

    fornece os mesmos parmetros estimados que em ( ) YXXX ''1= .

    ( ) A idia bsica da estimao economtrica obter os parmetros de tal forma que a soma dos erros seja, na mdia, nula, e a soma de seus quadrados seja mnima.

    ( ) A expresso para obteno dos parmetros por Mnimos Quadrados Ordinrios,

    ( ) YXXX '' 1= refere-se a um modelo linearizado qualquer. ( ) A heterocedasticidade dos resduos implica em varincias constantes dos resduos ao

    longo da amostra. ( ) A estimao realizada pelas operaes matriciais no Excel fornecem os mesmos

    parmetros estimados que a Ferramenta de Anlise de Dados de Regresso do referido software.

    ( ) A especificao do modelo no precisa ser feita antes da estimao, pois as vezes ser necessrio excluir alguma varivel do modelo.

    ( ) A fase de estimao do modelo consiste em determinar os parmetros da equao estimada.

    ( ) Todo modelo estimado pode ser utilizado para fazer previses da varivel explicada. ( ) A econometria pode favorecer todas as reas da economia, pois sempre possvel

    explicar tudo que se quer com a econometria. ( ) O modelo de regresso linear simples um caso especfico do modelo de regresso

    linear mltiplo, podendo estimar os parmetros matricialmente nos dois casos. 2. Cite e comente a pressuposio de linearidade do modelo de regresso clssico. 3. O mtodo de estimao de Mnimos Quadrados Ordinrios um dos mais utilizados para estimar parmetros economtricos. Explique o que significa e o raciocnio por trs desse mtodo. 4. Cite e comente a pressuposio de presena de homocedasticidade dos resduos do modelo de regresso clssico. 5. Suponha que se tem dados municipais para o modelo lnQi = o + 1.lnJUROSi1 + 2.lnRDi2 + i, em que Q a quantidade demandada de moeda no municpio i, em milhares de reais; JUROS a taxa de juros interbancria (CDI) em valores nominais; RD a renda disponvel per capita em reais; s so parmetros do modelo e o erro aleatrio tal que ~ N(0,s2). Pergunta-se: a) Como voc faria para obter os valores dos s num ambiente computacional do Microsoft

    Excel? Quais os passos necessrios para execuo da estimao? b) possvel fazer por meio matricial? Quais os passos necessrios para execuo da

    estimao? 6. Seja um exemplo da verso modificada da Curva de Phillips macroeconmica, relacionando o ndice de salrios como varivel dependente (W) como funo dos preos (IGP), da taxa de desemprego (U) e do produto nacional bruto (PNB) como variveis independentes. O modelo ser do tipo: tt3t2t10t UPNBIGPW ++++= . Interprete os resultados abaixo e avalie comparativamente os dois resultados. Fonte: dados mensais

  • Econometria Prof. Adriano M. R. Figueiredo

    22

    de W, U e IGP-DI, coletados no www.ipeadata.gov.br e realizaram-se mdias anuais. O PIB per capita anual foi obtido diretamente do mesmo site. Dependent Variable: LOG(W) Method: Least Squares Date: 03/22/06 Time: 11:05 Sample: 1980 2004 Included observations: 25

    Variable Coefficient Std. Error t-Statistic Prob.

    C -17.74151 3.737840 -4.746459 0.0001 LOG(IGP) -0.020270 0.002273 -8.918010 0.0000 LOG(PIB) 2.450833 0.407685 6.011589 0.0000 LOG(U) 0.425183 0.068249 6.229885 0.0000

    R-squared 0.818600 Mean dependent var 5.414171 Adjusted R-squared 0.792686 S.D. dependent var 0.181513 S.E. of regression 0.082646 Akaike info criterion -2.002847 Sum squared resid 0.143439 Schwarz criterion -1.807827 Log likelihood 29.03559 F-statistic 31.58878 Durbin-Watson stat 1.724283 Prob(F-statistic) 0.000000

    Dependent Variable: W Method: Least Squares Date: 03/22/06 Time: 11:10 Sample: 1980 2004 Included observations: 25

    Variable Coefficient Std. Error t-Statistic Prob.

    C -290.8117 327.1702 -0.888870 0.3841 IGP -0.326847 0.193898 -1.685664 0.1067 PIB 0.046182 0.034176 1.351321 0.1910 U 21.07782 8.048040 2.619000 0.0160

    R-squared 0.255609 Mean dependent var 228.0943 Adjusted R-squared 0.149268 S.D. dependent var 40.64528 S.E. of regression 37.48923 Akaike info criterion 10.23163 Sum squared resid 29514.30 Schwarz criterion 10.42665 Log likelihood -123.8954 F-statistic 2.403666 Durbin-Watson stat 0.607152 Prob(F-statistic) 0.096187

    7. Seja um exemplo do PIB Real (REALGDP) como funo do Consumo Real (REALCONS), Investimento Real (REALINVS), Gastos Reais do Governo (REALGOVT), e Transaes Lquidas Reais com o Exterior (REALINT), OBS a varivel de tendncia. Encontre o R2, R2 ajustado, os coeficientes, erros-padres e valores de t para completar os resultados e analise-os a seguir:

  • Econometria Prof. Adriano M. R. Figueiredo

    23

    Dependent Variable: REALGDP Method: Least Squares Date: 03/09/06 Time: 08:29 Sample: 1950:1 2000:4 Included observations: 204

    Variable Coefficient Std. Error t-Statistic Prob.

    REALCONS 1.123936 44.48754 0.0000 REALINVS 0.516396 0.044046 11.72401 0.0000 REALGOVT 0.538837 0.056164 9.594029 0.0000

    REALINT 1.089732 -1.558385 0.1207 OBS 1.928942 0.370999 0.0000

    C 121.9011 24.04763 5.069154 0.0000

    R-squared Mean dependent var 4562.646 Adjusted R-squared S.D. dependent var 2113.962 S.E. of regression 40.65281 Akaike info criterion 10.27698 Sum squared resid 327224.9 Schwarz criterion 10.37458 Log likelihood -1042.252 F-statistic 109744.5 Durbin-Watson stat 0.246057 Prob(F-statistic) 0.000000

  • Econometria Prof. Adriano M. R. Figueiredo

    24

    4 Violaes nas Pressuposies Clssicas do Modelo de Regresso Linear

    O modelo clssico de anlise de regresso construdo com base numa srie de pressuposies

    referentes ao comportamento da populao. Estas pressuposies foram descritas nas sees

    anteriores e aqui se discute principalmente a forma de testar a hiptese e a operacionalizao da

    soluo.

    4.1. Pressuposio 1: A relao entre Y e X linear

    Deteco do problema:

    Entre outros estes, o teste RESET de Ramsey (1969)2 um dos mais aplicados na literatura.

    O nome vem do pesquisador Ramsey para o Regression Specification Error Test ou teste de erro de

    especificao da regresso (No Eviews, ver na janela da equao o teste de estabilidade (Stability

    Tests) e definir o nmero de termos estimados).

    O teste baseado na regresso aumentada

    Y = X + Z +

    em que X so as variveis explicativas e Z so variveis dependentes estimadas e elevadas a uma

    potncia

    Z = [ Yest2 Yest3 Yest4] exemplo para trs fitted terms (termos acrescentados na regresso

    aumentada).

    A idia olhar a significncia dos para ver se os termos acrescentados so relevantes no

    modelo, indicando erro de especificao.

    Procedimento do teste:

    1) estima-se Y = X +

    2) obtm-se os valores previstos de Y e gera-se Yest2 Yest3 ou mais se

    desejar. Recomenda-se no mximo at 3 termos, ou seja, at Yest4.

    3) Ajusta-se a regresso aumentada, colocando-se os X e as variveis do item 2 :

    Y = f ( X, Yest2, Yest3 )

    4) Com as regresses de 1 e de 3, observam-se os valores de R2 novo (de 3) e R2

    velho (de 1) e calcula-se a estatstica de teste:

    2Ramsey, J. B. (1969) Tests for Specification Errors in Classical Linear Least Squares Regression Analysis, Journal

    of the Royal Statistical Society, Series B, 31, 350371.

  • Econometria Prof. Adriano M. R. Figueiredo

    255) Estatstica de Teste;

    (p) mod

    1

    )( 2

    22

    elonovonoparametrosnmeron

    R

    msregressorenovosdenmero

    RR

    Fnovo

    velhonovo

    =

    F ~ Fm,n-p m o nmero de novos regressores

    n-p o nmero de observaes menos o nmero de parmetros no

    novo modelo

    6) Comparar o F do item 5 com o F da tabela, para o nvel de significncia,

    numerador m e denominador n-p. Como a hiptese nula de que no h

    erro de especificao, espera-se que a hiptese nula no seja rejeitada, ou

    seja, que F seja muito pequeno.

    O teste RESET indica apenas se o modelo est especificado incorretamente, mas no diz

    qual seria a soluo. A soluo para um problema seria incluir outras variveis relevantes no

    modelo, retirar as irrelevantes, ou mudar a forma funcional. Portanto, o bom senso indica que

    melhor incluir variveis do que excluir, pois a excluso pode causar vis, enquanto a incluso tende

    a melhorar o modelo, a no ser pela possibilidade de no-significncia dos parmetros.

    Implementao no Eviews:

    No Eviews, aps a estimao dos parmetros, abre-se a janela da equao e depois clica-se

    em View, e posteriormente em Stability Tests. A opo do teste RESET aparecer em outra janela

    perguntando quantos termos ajustados sero includos (fitted terms). O aluno deve estabelecer

    quantos termos (sugere-se at 3) e clica-se em ok. O programa gerar a estatstica de teste RESET

    de Ramsey, mas aqui a hiptese nula um pouco diferente do teste calculado anterior, pois o

    programa testa se todos os parmetros so zeros, o que indicar que no h erro. Portanto, se a

    probabilidade de F do Eviews for abaixo do nvel de significncia (por exemplo, 10%) (F alto),

    pode-se dizer que rejeita-se a hiptese nula e existe um erro de especificao. Se o F for baixo,

    aceita-se que =0 e, portanto, no h erro de especificao.

    No exemplo, mostra-se que existe erro de especificao.

    Tabela 1. Exemplo de sada do Eviews para o Ramsey RESET Test.

    Ramsey RESET Test:

    F-statistic 5.281559 Probability 0.001932 Log likelihood ratio 15.74446 Probability 0.001279

  • Econometria Prof. Adriano M. R. Figueiredo

    26

    Test Equation: Dependent Variable: QSOJA Method: Least Squares Date: 06/06/03 Time: 14:57 Sample: 1988:09 1998:05 Included observations: 117

    Variable Coefficient Std. Error t-Statistic Prob.

    FERTILIZANTE 304.1298 135.0469 2.252031 0.0263 TRATOR 18591.29 8231.767 2.258481 0.0259

    MO 115237.7 51069.36 2.256493 0.0260 C -230604.7 101861.3 -2.263908 0.0255

    FITTED^2 2.664804 1.165269 2.286857 0.0241 FITTED^3 -0.005642 0.002453 -2.300025 0.0233 FITTED^4 4.43E-06 1.92E-06 2.302617 0.0232

    R-squared 0.532456 Mean dependent var 322.2544 Adjusted R-squared 0.506954 S.D. dependent var 56.01272 S.E. of regression 39.33059 Akaike info criterion 10.23985 Sum squared resid 170158.4 Schwarz criterion 10.40510 Log likelihood -592.0310 F-statistic 20.87869 Durbin-Watson stat 0.770973 Prob(F-statistic) 0.000000

    Outra forma olhar os diferentes modelos e comparar o R2 ajustado. Quanto mais prximo

    de 1 melhor ser a estimao. deficiente para o caso de varivel omitida.

    Outras opes so observar os coeficientes do critrio de Akaike e Schwarz, fornecidos na

    sada da estimao do Eviews. Menores coeficientes AIC e SIC indicam melhores ajustamentos da

    regresso, mas s podem ser comparados se as unidades das variveis das diferentes regresses

    forem as mesmas (por exemplo, no se aplica numa comparao entre Y e outra com LogY). Deve-

    se olhar todos os critrios para melhor anlise dos resultados.

    O Critrio de Informao de Akaike (ou AIC de Akaikes Information Criterion) ou o

    Critrio de Informao de Schwarz ou Bayesiano (ou SIC de Schwarzs Information Criterion ou

    em alguns livros BIC de Bayesian Information Criterion) so expressos no Eviews da forma j

    logaritmizada como:

    em que k o nmero de regressores incluindo-se o intercepto; n o nmero de observaes; l o

    log Verossimilhana da regresso; e so os resduos estimados do modelo.

  • Econometria Prof. Adriano M. R. Figueiredo

    27No formato mais simplificado exposto por Greene (2002), tem-se:

  • Econometria Prof. Adriano M. R. Figueiredo

    28Anexo

    Fazendo o teste RESET para investigar se existe erro de especificao:

    1) fazer a estimao original a ser testada

  • Econometria Prof. Adriano M. R. Figueiredo

    292) na janela Equation, entrar em View, Stability Tests, Ramsey Reset Test como na figura a seguir:

    3) na janela RESET Specification, colocar o nmero de variveis a serem adicionadas no teste (nmero de variveis dos valores previstos de Y)

    entesucessivamassim

    3 digitar ento (FITTED^4)Ye (FITTED^3) Ye (FITTED^2) Yapenas inserirse

    2 digitar ento (FITTED^3)Ye (FITTED^2) Yapenas inserirse

    1 digitar ento (FITTED^2) Yapenas inserirse

    432

    32

    2

    O RESULTADO SAIR CONFORME A LTIMA IMAGEM A SEGUIR

  • Econometria Prof. Adriano M. R. Figueiredo

    30

  • Econometria Prof. Adriano M. R. Figueiredo

    31

    4.2. Pressuposio 2: O erro aleatrio tem mdia zero

    A maior dificuldade que no existe teste formal para essa pressuposio. similar a um

    erro de especificao do modelo, como por exemplo, com variveis relevantes omitidas do modelo.

    O modelo com uma correta especificao provavelmente no ter problemas com mdia dos

    resduos no nula.

    Normalmente se faz o teste simples de H0: mdia igual a zero para investigar a violao

    ou no da pressuposio. Valores elevados para a probabilidade indicaro a aceitao da hiptese

    nula e confirmao da pressuposio.

  • Econometria Prof. Adriano M. R. Figueiredo

    32Anexo:

    Roteiro para testar mdia dos resduos nula:

  • Econometria Prof. Adriano M. R. Figueiredo

    33Tabela dos resduos

    observao observado previsto resduos obs Actual Fitted Residual

    1971Q3 11484.0 10943.9 540.083 1971Q4 9348.00 9417.85 -69.8452 1972Q1 8429.00 9502.75 -1073.75 1972Q2 10079.0 9184.43 894.568 1972Q3 9240.00 8884.84 355.164 1972Q4 8862.00 9288.01 -426.006 1973Q1 6216.00 7311.47 -1095.47 1973Q2 8253.00 7595.20 657.800 1973Q3 8038.00 8297.50 -259.501 1973Q4 7476.00 7559.49 -83.4900 1974Q1 5911.00 5955.55 -44.5506 1974Q2 7950.00 6004.86 1945.14 1974Q3 6134.00 6802.14 -668.142 1974Q4 5868.00 6544.46 -676.458 1975Q1 3160.00 3992.40 -832.395 1975Q2 5872.00 5035.14 836.855

  • Econometria Prof. Adriano M. R. Figueiredo

    34Na janela do Workfile, na serie Resid, possvel fazer o teste t para a mdia dos erros igual a

    zero:

  • Econometria Prof. Adriano M. R. Figueiredo

    35

    Na janela View da Series: Resid, escolher a opo Tests for Description Stats, Simple

    Hypothesis Tests:

    A janela do simple Hypothesis tests permitir especificar se a mdia igual a zero,

    especificando zero e teclando ok:

  • Econometria Prof. Adriano M. R. Figueiredo

    36

    Hypothesis Testing for RESID Date: 03/16/06 Time: 17:12 Sample: 1971Q3 1975Q2 Included observations: 16 Test of Hypothesis: Mean = 0.000000

    Sample Mean = -4.16e-16

    Sample Std. Dev. = 0.144606 Method Value Probability t-statistic -1.15E-14 1.0000

    Como o valor da probabilidade implica na aceitao da hiptese nula, ou seja,

    H0: mdia = 0

  • Econometria Prof. Adriano M. R. Figueiredo

    37

    4.3. Pressuposio 3: O erro aleatrio tem varincia constante (presena de homocedasticidade)

    A presena de heterocedasticidade no gera vis ou tendenciosidade nos parmetros

    angulares. Entretanto, os parmetros de M.Q.O. no sero os mais eficientes (pois o M.Q. O.

    superestimar o verdadeiro erro-padro e presena de heterocedasticidade) e a estimao

    dever ser feita por Mnimos Quadrados Generalizados (M.Q.G.), que consiste em um

    M.Q.O. para variveis transformadas que satisfazem as hipteses usuais de mnimos

    quadrados. A mecnica passa pela diviso de todas as variveis, por exemplo, pelo respectivo

    desvio-padro do resduo, ou caso o desconhea, pela varivel explicativa correlacionada ao

    resduo.

    Procede-se da seguinte forma. Primeiro realiza-se o teste de Glejser, que entre outros

    como o de Goldfeld-Quandt, apresenta-se mais eficiente e auxilia na implementao da

    correo do problema. Esse teste permite que se indique a exata relao existente entre a

    varivel X e os resduos (Diaz, 2000)3.

    Passos:

    1. estimar o modelo inicial: Y = X +

    2. com os resduos de 1, estimar as regresses auxiliares:

    a. |ei| = 0 + 1Xi

    b. |ei| = 0 + 1Xi2

    c. |ei| = 0 + 1(1/Xi)

    d. |ei| = 0 + 1(Xi)

    e. |ei| = 0 + 1Xih

    em que h denota uma potncia.

    Se o 1 for diferente de zero em alguma das regresses auxiliares (pelo teste

    usual de t), ento rejeita-se a hiptese nula de que no h heterocedasticidade.

    Portanto, existe heterocedasticidade. Caso todas as regresses tenham 1= 0,

    ento no existe heterocedasticidade.

    3 DIAZ, M.D.M. Problemas economtricos no modelo linear geral. In: VASCONCELLOS, M.A.S.; ALVES, D. (Coords.) Manual de econometria. So Paulo:Atlas, 2000. p.105-137.

  • Econometria Prof. Adriano M. R. Figueiredo

    38

    Conhecido o resultado do teste de Glejser, utiliza-se a varivel da regresso auxiliar

    que acusou o problema para ponderar as variveis, transformando-as, e procedendo a

    estimao de M.Q.G., ou seja, M.Q.O. nas variveis transformadas.

    Este problema de presena de heterocedasticidade tambm pode ser detectado por

    meio de anlise grfica. Pode-se estimar a funo e fazer o grfico dos resduos ao longo da

    amostra:

    ei x Xi

    ei x Yi ou Yi,estimado

    A estimao por M.Q.G. ser para o modelo:

    P.Y = PX + P

    e o vetor de parmetros estimados ser

    = (XPPX)-1XPPY

    que o mesmo que estimar o M.Q.O. para Y* = X* + *.

    Os resduos podem ser obtidos no Eviews fazendo, na janela de uma equao,

    Procs/make residual series. O programa pergunta o nome da srie a conter os resduos e uma

    vez feito isso s especificar a srie como varivel.

    O mtodo como descrito acima uma alternativa apresentada em vrios livros de

    econometria, mas como a transformao fazendo Y/Xi pode gerar uma correlao espria,

    indicando uma correlao entre Y/X que na realidade no ocorreria entre Y e X caso no

    fosse feita a transformao, sugere-se ento o teste e a correo de White4.

    Por exemplo, para uma regresso da forma

    Yi = 1 + 2 X2i + 3X3i + i

    o teste de White implementado manualmente da seguinte forma:

    a) estima-se a regresso inicial e obtm-se os resduos ei;

    b) faz-se uma regresso auxiliar do tipo

    ei2= 1 + 2 X2i + 3X3i + 4 X2i

    2+ 5X3i2 + 6 X2i.X3i + i

    ou seja, o quadrado dos resduos estimados como funo das variveis explicativas, dos

    quadrados das variveis explicativas e do produto cruzado das variveis explicativas. Deve-se

    incluir o termo do intercepto (1) mesmo que na regresso original no o tenha.

    4 White, Halbert (1980) A Heteroskedasticity-Consistent Covariance Matrix and a Direct Test for

    Heteroskedasticity, Econometrica, 48, 817838.

  • Econometria Prof. Adriano M. R. Figueiredo

    39

    c) Analisa-se o R2 da regresso auxiliar multiplicado pelo tamanho da amostra (n)

    comparando com o valor da tabela qui-quadrado para graus de liberdade iguais ao nmero

    total de regressores da equao auxiliar. No nosso exemplo,

    n. R2 ~ 2 com gl = 5 (X2i, X3i , X2i2, X3i

    2 , X2i.X3i)

    Se n.R2

    > 2 tabelado, ento existe heterocedasticidade.

    Se n.R2

    < 2 tabelado, ento 2 = 3 = 4 = 5 = 6 = 0 , e no existe

    heterocedasticidade.

    Deve-se tomar cuidado com este teste, pois ele prev a incluso de termos adicionais

    que, em presena de muitas variveis X, poder comprometer o modelo com relao aos seus

    graus de liberdade.

    A correo do modelo neste caso pode ser feita utilizando os estimadores de matrizes

    de covarincias heterocedstico-consistentes de White, que podem ser obtidos rapidamente

    pelo software Eviews.

    A operacionalizao no Eviews bastante simples. Primeiro o estudante deve estimar

    o modelo e, na janela da equao estimada, selecionar View/Residual Tests e depois clicar em

    White Heteroskedasticity (no cross terms ou cross terms). A diferena das duas opes que

    na primeira no inclui termos multiplicativos das variveis Xi.Xj. Na primeira opo, se

    economizam graus de liberdade mas representa uma distoro do teste original. Na segunda

    opo, no rigor cientfico, incluem-se termos cruzados e, em presena de muitos regressores,

    pode causar problemas de reduzidos graus de liberdade.

    Sugere-se utilizar a primeira opo quando tiver mais de 5 regressores Xi, e a segunda

    quando tiver menos de 5, pois com os termos cruzados, ocorreria uma incluso de mais outros

    5 termos.

    Para a mesma regresso da Tabela 1, mostram-se os resultados do teste de White para

    termos cruzados e sem termos cruzados. Procure distinguir as diferenas nos resultados.

    A hiptese nula do teste que no h heterocedasticidade, ou seja, de que os erros

    so homocedsticos e independentes dos regressores, e que a especificao do modelo

    correta. Assim, desejvel ter a aceitao da hiptese nula, com probabilidade acima de

    10%, e baixo valor de n.R2.

    Tabela 2. Teste de White no cross terms

    White Heteroskedasticity Test:

    F-statistic 2.956033 Probability 0.010300 Obs*R-squared 16.24547 Probability 0.012495

  • Econometria Prof. Adriano M. R. Figueiredo

    40

    Test Equation: Dependent Variable: RESID^2 Method: Least Squares Date: 06/06/03 Time: 17:59 Sample: 1988:09 1998:05 Included observations: 117

    Variable Coefficient Std. Error t-Statistic Prob.

    C 9515.997 6550.445 1.452725 0.1491 FERTILIZANTE -810.4509 551.7908 -1.468765 0.1448

    FERTILIZANTE^2 18.85117 15.37210 1.226324 0.2227 TRATOR -2061.748 2106.302 -0.978848 0.3298

    TRATOR^2 245.7209 236.7449 1.037914 0.3016 MO 76907.49 29850.12 2.576455 0.0113

    MO^2 -230942.8 103719.0 -2.226620 0.0280

    R-squared 0.138850 Mean dependent var 1663.833 Adjusted R-squared 0.091878 S.D. dependent var 2943.689 S.E. of regression 2805.201 Akaike info criterion 18.77430 Sum squared resid 8.66E+08 Schwarz criterion 18.93956 Log likelihood -1091.297 F-statistic 2.956033 Durbin-Watson stat 1.307013 Prob(F-statistic) 0.010300

  • Econometria Prof. Adriano M. R. Figueiredo

    41

    Tabela 3. Teste de White cross terms

    White Heteroskedasticity Test:

    F-statistic 4.638220 Probability 0.000034 Obs*R-squared 32.83525 Probability 0.000143

    Test Equation: Dependent Variable: RESID^2 Method: Least Squares Date: 06/06/03 Time: 18:01 Sample: 1988:09 1998:05 Included observations: 117

    Variable Coefficient Std. Error t-Statistic Prob.

    C -20557.49 9888.589 -2.078910 0.0400 FERTILIZANTE 445.3517 600.7180 0.741366 0.4601

    FERTILIZANTE^2 25.26911 15.80557 1.598748 0.1128 FERTILIZANTE*TRA

    TOR -120.1672 87.69892 -1.370224 0.1735

    FERTILIZANTE*MO -13077.63 3137.312 -4.168419 0.0001 TRATOR 864.9398 3116.365 0.277548 0.7819

    TRATOR^2 309.3549 253.6114 1.219799 0.2252 TRATOR*MO -22449.97 12081.31 -1.858240 0.0659

    MO 426444.0 90390.39 4.717802 0.0000 MO^2 -365960.5 130236.2 -2.809975 0.0059

    R-squared 0.280643 Mean dependent var 1663.833 Adjusted R-squared 0.220136 S.D. dependent var 2943.689 S.E. of regression 2599.568 Akaike info criterion 18.64567 Sum squared resid 7.23E+08 Schwarz criterion 18.88176 Log likelihood -1080.772 F-statistic 4.638220 Durbin-Watson stat 1.549746 Prob(F-statistic) 0.000034

    Observe que no exemplo dado, existem indcios de que h heterocedasticidade.

    Sabendo anteriormente que ocorre erro de especificao e que os dados originais so de srie

    temporal, conclui-se pela existncia de erro de especificao, mas deve-se analisar com maior

    detalhe a questo da homocedasticidade, pois esta geralmente no ocorre em sries temporais,

    mas sim em seo cruzada. Talvez o resultado do teste possa estar mais ligado dependncia

    dos resultados em relao aos regressores.

    Num outro exemplo, com os dados de Gujarati (2000:p.388), para gastos com P&D

    em relao as vendas, obteve-se o teste de White com cross terms e os resultados a seguir.

    Primeiro apresenta-se os resultados da estimao sem a correo para heterocedasticidade,

    faz-se o teste de White e depois re-estima-se o modelo com a correo de White.

  • Econometria Prof. Adriano M. R. Figueiredo

    42

    Tabela 4. Resultados da estimao inicial.

    Dependent Variable: RD Method: Least Squares Date: 06/06/03 Time: 18:38 Sample: 1 18 Included observations: 18

    Variable Coefficient Std. Error t-Statistic Prob.

    SALES 0.031900 0.008329 3.830033 0.0015 C 192.9931 990.9858 0.194749 0.8480

    R-squared 0.478303 Mean dependent var 3056.856 Adjusted R-squared 0.445697 S.D. dependent var 3705.973 S.E. of regression 2759.153 Akaike info criterion 18.78767 Sum squared resid 1.22E+08 Schwarz criterion 18.88660 Log likelihood -167.0891 F-statistic 14.66916 Durbin-Watson stat 3.015607 Prob(F-statistic) 0.001476

    Tabela 5. Teste de White para o exemplo de Gujarati, p.388.

    White Heteroskedasticity Test:

    F-statistic 3.057178 Probability 0.076975 Obs*R-squared 5.212492 Probability 0.073811

    Test Equation: Dependent Variable: RESID^2 Method: Least Squares Date: 06/06/03 Time: 18:32 Sample: 1 18 Included observations: 18

    Variable Coefficient Std. Error t-Statistic Prob.

    C -6219665. 6459809. -0.962825 0.3509 SALES 229.3508 126.2197 1.817077 0.0892

    SALES^2 -0.000537 0.000449 -1.194952 0.2507

    R-squared 0.289583 Mean dependent var 6767046. Adjusted R-squared 0.194861 S.D. dependent var 14706011 S.E. of regression 13195639 Akaike info criterion 35.77968 Sum squared resid 2.61E+15 Schwarz criterion 35.92808 Log likelihood -319.0171 F-statistic 3.057178 Durbin-Watson stat 1.694567 Prob(F-statistic) 0.076975

    Neste caso, com os dados em seo cruzada (indstrias dos EUA), no foi possvel

    deixar de rejeitar a hiptese nula de homocedasticidade ao nvel de 10% de significncia,

    como observado pelo valor da probabilidade de Obs*R-squared = 0,073811, menor que 0,10.

    Existe problema de heterocedasticidade nos resduos.

    Mostram-se agora os resultados com a correo de White, obtidos no Eviews fazendo

    alterao na janela da estimao, clicando em Options e selecionando a caixa

    heteroskedasticity, e clicando em White. Os resultados so:

  • Econometria Prof. Adriano M. R. Figueiredo

    43

    Tabela 6. Resultados da estimao com a correo de White para heterocedasticidade.

    Dependent Variable: RD Method: Least Squares Date: 06/06/03 Time: 18:42 Sample: 1 18 Included observations: 18 White Heteroskedasticity-Consistent Standard Errors & Covariance

    Variable Coefficient Std. Error t-Statistic Prob.

    SALES 0.031900 0.010147 3.143815 0.0063 C 192.9931 533.9317 0.361457 0.7225

    R-squared 0.478303 Mean dependent var 3056.856 Adjusted R-squared 0.445697 S.D. dependent var 3705.973 S.E. of regression 2759.153 Akaike info criterion 18.78767 Sum squared resid 1.22E+08 Schwarz criterion 18.88660 Log likelihood -167.0891 F-statistic 14.66916 Durbin-Watson stat 3.015607 Prob(F-statistic) 0.001476

    Observe que agora na sada do Eviews, indica-se que foi utilizada a opo White

    Heteroskedasticity-Consistent Standard Errors & Covariance, e pode-se comparar os

    resultados com os da Tabela 4, sem essa opo de White. De modo geral, nesse exemplo, os

    erros-padres estavam subestimados. Pode-se observar que o modelo com heterocedasticidade

    apresenta vis nos erros padres, podendo ser negativo ou positivo, dependendo do estudo.

    Quanto aos parmetros, no ocorrem alteraes.

    Aps a correo de White no cabe mais a nova realizao do teste, pois os resultados

    j foram obtidos com os resduos alterados pelo critrio de White.

  • Econometria Prof. Adriano M. R. Figueiredo

    44

    Anexo Roteiro para estimao no Eviews Heterocedasticidade Gujarati, Tabela 11.5 (Table11-5.wf1), p. 388 Teste de Glejser 1. estimar modelo normalmente:

    Estimation Command: ===================== LS (PD) (VENDAS) C Estimation Equation: ===================== PD = C(1)*VENDAS + C(2) Substituted Coefficients: ===================== PD = 0.03190033243*VENDAS + 192.9931098 Dependent Variable: PD Method: Least Squares Date: 03/04/05 Time: 16:00 Sample: 1 18 Included observations: 18

    Variable Coefficient Std. Error t-Statistic Prob.

    VENDAS 0.031900 0.008329 3.830033 0.0015 C 192.9931 990.9858 0.194749 0.8480

    R-squared 0.478303 Mean dependent var 3056.856 Adjusted R-squared 0.445697 S.D. dependent var 3705.973 S.E. of regression 2759.153 Akaike info criterion 18.78767 Sum squared resid 1.22E+08 Schwarz criterion 18.88660 Log likelihood -167.0891 F-statistic 14.66916 Durbin-Watson stat 3.015607 Prob(F-statistic) 0.001476

  • Econometria Prof. Adriano M. R. Figueiredo

    45

    Gerar sries de resduos em Procs/Make residual series:

  • Econometria Prof. Adriano M. R. Figueiredo

    46

    Fazer srie de resduos absolutos: me=@abs(e)

    Estimar me em funo de Vendas: ou seja, mdulo dos resduos em funo de vendas:

  • Econometria Prof. Adriano M. R. Figueiredo

    47

    Dependent Variable: ME Method: Least Squares Date: 03/04/05 Time: 18:18 Sample: 1 18 Included observations: 18

    Variable Coefficient Std. Error t-Statistic Prob.

    VENDAS 0.011939 0.005704 2.093059 0.0526 C 578.5710 678.6950 0.852476 0.4065

    R-squared 0.214951 Mean dependent var 1650.432 Adjusted R-squared 0.165886 S.D. dependent var 2069.046 S.E. of regression 1889.657 Akaike info criterion 18.03062 Sum squared resid 57132868 Schwarz criterion 18.12955 Log likelihood -160.2756 F-statistic 4.380896 Durbin-Watson stat 1.743294 Prob(F-statistic) 0.052633

  • Econometria Prof. Adriano M. R. Figueiredo

    48

    Me em funo da raiz de vendas:

    Dependent Variable: ME Method: Least Squares Date: 03/04/05 Time: 18:18 Sample: 1 18 Included observations: 18

    Variable Coefficient Std. Error t-Statistic Prob.

    SQR(VENDAS) 7.971957 3.363146 2.370387 0.0307 C -507.0202 1007.684 -0.503154 0.6217

    R-squared 0.259901 Mean dependent var 1650.432 Adjusted R-squared 0.213645 S.D. dependent var 2069.046 S.E. of regression 1834.761 Akaike info criterion 17.97166 Sum squared resid 53861578 Schwarz criterion 18.07059 Log likelihood -159.7449 F-statistic 5.618732 Durbin-Watson stat 1.785727 Prob(F-statistic) 0.030672

  • Econometria Prof. Adriano M. R. Figueiredo

    49

    Me em funo de 1/vendas:

    Dependent Variable: ME Method: Least Squares Date: 03/04/05 Time: 18:20 Sample: 1 18 Included observations: 18

    Variable Coefficient Std. Error t-Statistic Prob.

    1/(VENDAS) -19924566 12318138 -1.617498 0.1253 C 2273.702 604.6990 3.760056 0.0017

    R-squared 0.140538 Mean dependent var 1650.432 Adjusted R-squared 0.086822 S.D. dependent var 2069.046 S.E. of regression 1977.188 Akaike info criterion 18.12118 Sum squared resid 62548360 Schwarz criterion 18.22011 Log likelihood -161.0906 F-statistic 2.616300 Durbin-Watson stat 1.505561 Prob(F-statistic) 0.125313

    Correo: Fazer PD/(SQR(Vendas)) em funo de 1/(SQR(Vendas)) e de (SQR(Vendas))

  • Econometria Prof. Adriano M. R. Figueiredo

    50

    Dependent Variable: PD/SQR(VENDAS) Method: Least Squares Date: 03/04/05 Time: 18:23 Sample: 1 18 Included observations: 18

    Variable Coefficient Std. Error t-Statistic Prob.

    1/SQR(VENDAS) -246.6769 381.1285 -0.647228 0.5267 SQR(VENDAS) 0.036798 0.007114 5.172315 0.0001

    R-squared 0.364889 Mean dependent var 8.855264 Adjusted R-squared 0.325195 S.D. dependent var 8.834378 S.E. of regression 7.257134 Akaike info criterion 6.906286 Sum squared resid 842.6560 Schwarz criterion 7.005216 Log likelihood -60.15658 F-statistic 9.192455 Durbin-Watson stat 2.885313 Prob(F-statistic) 0.007933

  • Econometria Prof. Adriano M. R. Figueiredo

    51

    Mtodo de White: TESTE

    White Heteroskedasticity Test:

    F-statistic 3.057178 Probability 0.076975 Obs*R-squared 5.212492 Probability 0.073811

    Test Equation: Dependent Variable: RESID^2 Method: Least Squares Date: 03/04/05 Time: 18:32 Sample: 1 18 Included observations: 18

    Variable Coefficient Std. Error t-Statistic Prob.

    C -6219665. 6459809. -0.962825 0.3509 VENDAS 229.3508 126.2197 1.817077 0.0892

    VENDAS^2 -0.000537 0.000449 -1.194952 0.2507

    R-squared 0.289583 Mean dependent var 6767046. Adjusted R-squared 0.194861 S.D. dependent var 14706011 S.E. of regression 13195639 Akaike info criterion 35.77968 Sum squared resid 2.61E+15 Schwarz criterion 35.92808 Log likelihood -319.0171 F-statistic 3.057178 Durbin-Watson stat 1.694567 Prob(F-statistic) 0.076975

    Rejeita-se a hiptese nula , portanto temos presena de erros heterocedsticos a 10% de significncia. No teramos se fosse considerado 5%!!!!

  • Econometria Prof. Adriano M. R. Figueiredo

    52

    Correo de heterocedasticidade pelo mtodo de White:

    Dependent Variable: PD Method: Least Squares Date: 03/04/05 Time: 18:29 Sample: 1 18 Included observations: 18 White Heteroskedasticity-Consistent Standard Errors & Covariance

    Variable Coefficient Std. Error t-Statistic Prob.

    C 192.9931 533.9317 0.361457 0.7225 VENDAS 0.031900 0.010147 3.143815 0.0063

    R-squared 0.478303 Mean dependent var 3056.856 Adjusted R-squared 0.445697 S.D. dependent var 3705.973 S.E. of regression 2759.153 Akaike info criterion 18.78767 Sum squared resid 1.22E+08 Schwarz criterion 18.88660 Log likelihood -167.0891 F-statistic 14.66916 Durbin-Watson stat 3.015607 Prob(F-statistic) 0.001476

    Observar que os erros-padres entre a regresso principal e a regresso com correo de White se alteraram, ou seja, a correo de White retirou os vieses nos erros-padres estimados.

  • Econometria Prof. Adriano M. R. Figueiredo

    53

    4.4. Pressuposio 4: Os erros aleatrios so independentes (ou no autocorrelacionados)

    A principal conseqncia da violao desta pressuposio a ineficincia dos

    estimadores de M.Q.O. mas, continuam no-tendenciosos. Nesta situao, da mesma forma

    que para a heterocedasticidade, melhor utilizar o mtodo de Mnimos Quadrados

    Generalizados (M.Q.G.).

    Imagine um modelo mais comum, com autocorrelao de 1. Ordem:

    t1tt +=

    em que o parmetro de autocorrelao e um termo de erro bem comportado, ou seja,

    no autocorrelacionado normal de mdia zero e varincia 2, ou tambm chamado de rudo

    branco (white noise).

    O coeficiente de autocorrelao pode ser obtido pela expresso

    2/11t

    2/1t

    1tt

    )](Var[)](Var[

    ),(Cov

    =

    O teste mais comum para detectar a presena de erros autocorrelacionados o Teste de

    Durbin-Watson. A hiptese nula a ser testada que

    Ho: = 0 => no h autocorrelao

    Contra a hiptese alternativa H1: 0 => > 0 autocorrelao positiva => < 0 autocorrelao negativa

    A estatstica de teste o chamado DW, calculado como:

    ( )( )=

    =

    =

    =

    12

    DWT

    1t

    2t

    T

    2t

    21tt

    em que

    = 0 DW = 2 => ausncia de autocorrelao

    = +1 DW = 0 => autocorrelao positiva e perfeita

    = -1 DW = 4 => autocorrelao negativa e perfeita

    Portanto, deseja-se DW prximo de 2, ou seja, ausncia de autocorrelao.

  • Econometria Prof. Adriano M. R. Figueiredo

    54

    A anlise requer a comparao dos valores de DW com valores tabelados, que

    prevem duas distribuies de probabilidade entrelaadas: uma distribuio inferior e outra

    superior. Elas determinam reas de aceitao e rejeio da hiptese nula, como na figura a

    seguir:

    em que

    dL = limite inferior => vem da tabela para n observaes e k variveis explanatrias

    dU = limite superior => vem da tabela para n observaes e k variveis explanatrias

  • Econometria Prof. Adriano M. R. Figueiredo

    55

    Exemplo:

    Para k = 3 (referente a um modelo com X1, X2 e X3), para n = 30 observaes, a tabela de

    DW para 5% de significncia nos fornece dL = 1,21 e dU=1,65, e portanto,

    4-dL = 4 1,21 = 2,79

    4 dU = 4 1,65 = 2,35

    Para 0

  • Econometria Prof. Adriano M. R. Figueiredo

    56

    H0: no autocorrelao dos resduos

    H1: t = AR(P) ou t = MA(P)

    Por exemplo, suponha o seguinte processo autoregressivo:

    tptp3t32t21t1t +++++= K

    A hiptese nula ser de que todos os coeficientes de autocorrelao so

    simultaneamente nulos, ou seja, todos os i = 0 e no h autocorrelao de qualquer ordem.

    A estatstica de teste ser um multiplicador de Lagrange do tipo

    2p

    '0

    10

    '002

    0 ~e'eeX)XX(X'e

    )pn(R)pn(LM

    ==

    O procedimento ser:

    1. estimar o modelo de regresso pelo mtodo usual de MQO e obter resduos t;

    2. estimar o modelo de t como funo das demais variveis X do modelo a e

    tambm de variveis t defasadas (t-1 t-2 ... etc), utilizando para estas defasagens

    os resduos obtidos em a;

    3. obter o valor de R2 desta regresso b;

    4. A estatstica de teste ser LMBG = (n-p).R2 ~ 2p graus de liberdade. P o nmero

    de defasagens includas na regresso b.

    Se a estatstica de teste LMBG > valor crtico de 2

    p ento se rejeita a hiptese nula e

    existe autocorrelao serial de ordem P, ou seja, pelo menos um i 0. Neste teste, pode-se

    ter variveis X ou mesmo Y defasadas, o que representa uma vantagem sobre o teste DW.

    Estimao solucionando o problema de autocorrelao:

    Estima-se o modelo inicial por M.Q.O. e depois segue um procedimento iterativo at

    alcanar a convergncia nos parmetros. Abaixo esto os passos da estimao de Cochrane-

    Orcutt:

    1) Estima-se modelo inicial por MQO e obtm DW

    2) Calcula-se = 1 0,5.DW

    3) Estima equao transformada:

    ( ) ( ) t1tt211tt XX1YY ++=

  • Econometria Prof. Adriano M. R. Figueiredo

    57

    ou

    Y* = 1* + 2.X1* + t*

    4) Recalcula-se (2) e verifica-se a convergncia para .

    5) Repetem-se os passos (2) a (4) at que a convergncia seja menor que 0,01.

    A implementao no Eviews prev a insero de um termo AR(1) na especificao das

    variveis da equao. O programa far a estimao considerando a correo para o

    autoregressivo de primeira ordem.

  • Econometria Prof. Adriano M. R. Figueiredo

    58

    Anexo Autocorrelao Para a equao da taxa de retorno RR em funo do crescimento (Growth) e da inflao (Inflation): Dependent Variable: RR Method: Least Squares Date: 03/07/05 Time: 20:19 Sample: 1954 1981 Included observations: 28

    Variable Coefficient Std. Error t-Statistic Prob.

    GROWTH 3.943315 1.293445 3.048693 0.0054 INFLATION -2.499426 1.082101 -2.309789 0.0294

    C 3.531812 8.111369 0.435415 0.6670

    R-squared 0.572374 Mean dependent var 5.875000 Adjusted R-squared 0.538164 S.D. dependent var 20.89837 S.E. of regression 14.20223 Akaike info criterion 8.245632 Sum squared resid 5042.582 Schwarz criterion 8.388368 Log likelihood -112.4388 F-statistic 16.73114 Durbin-Watson stat 1.896592 Prob(F-statistic) 0.000024

    DW = 1,8965 Teste de Breusch-Godfrey: SERIAL CORRELATION LM TEST

  • Econometria Prof. Adriano M. R. Figueiredo

    59

    Especificar nmero de variveis a adicionar em Xo, ou seja, se 1 (AR(1)), se 2 (AR(2)):

    Breusch-Godfrey Serial Correlation LM Test:

    F-statistic 0.319962 Probability 0.729357 Obs*R-squared 0.757950 Probability 0.684563

    Test Equation: Dependent Variable: RESID Method: Least Squares Date: 03/07/05 Time: 20:23

    Variable Coefficient Std. Error t-Statistic Prob.

    GROWTH -0.371429 1.426117 -0.260448 0.7968 INFLATION -0.131592 1.125693 -0.116898 0.9080

    C 1.737633 8.657860 0.200700 0.8427 RESID(-1) -0.014931 0.211928 -0.070455 0.9444 RESID(-2) -0.177451 0.222006 -0.799306 0.4323

    R-squared 0.027070 Mean dependent var -3.68E-15 Adjusted R-squared -0.142136 S.D. dependent var 13.66610 S.E. of regression 14.60506 Akaike info criterion 8.361046 Sum squared resid 4906.081 Schwarz criterion 8.598940 Log likelihood -112.0546 F-statistic 0.159981 Durbin-Watson stat 1.787912 Prob(F-statistic) 0.956406

    No h evidencias de autocorrelao no modelo, pois Obs*R-squared=0.75 com Probabilidade de 0.68, indicando aceitao de Ho: no-autocorrelao

  • Econometria Prof. Adriano M. R. Figueiredo

    60

    Exercicio Gujarati, p.447-448: Dependent Variable: LOG(PCDOM) Method: Least Squares Date: 03/07/05 Time: 21:10 Sample: 1951 1980 Included observations: 30

    Variable Coefficient Std. Error t-Statistic Prob.

    LOG(IPI) 0.467509 0.165987 2.816541 0.0093 LOG(PCBOLSA) 0.279443 0.114726 2.435745 0.0223

    LOG(CONST) -0.005152 0.142947 -0.036038 0.9715 LOG(PALU) 0.441449 0.106508 4.144737 0.0003

    C -1.500441 1.003020 -1.495923 0.1472

    R-squared 0.936090 Mean dependent var 3.721145 Adjusted R-squared 0.925864 S.D. dependent var 0.447149 S.E. of regression 0.121749 Akaike info criterion -1.222692 Sum squared resid 0.370573 Schwarz criterion -0.989160 Log likelihood 23.34039 F-statistic 91.54312 Durbin-Watson stat 0.954940 Prob(F-statistic) 0.000000

    Neste caso, DW=0.9549 Para gl=30, k=4, dl=1,143 e du=1,739, portanto, DW rejeita Ho, tenho indicao de autocorrelao positiva Teste LM para AR(1): Breusch-Godfrey Serial Correlation LM Test:

    F-statistic 10.02749 Probability 0.004163 Obs*R-squared 8.840634 Probability 0.002946

    Test Equation: Dependent Variable: RESID Method: Least Squares Date: 03/07/05 Time: 21:12

    Variable Coefficient Std. Error t-Statistic Prob.

    LOG(IPI) -0.104877 0.146079 -0.717946 0.4797 LOG(PCBOLSA) 0.089288 0.102299 0.872811 0.3914

    LOG(CONST) 0.045395 0.123362 0.367981 0.7161 LOG(PALU) -0.009785 0.091346 -0.107125 0.9156

    C -0.368385 0.867570 -0.424617 0.6749 RESID(-1) 0.567066 0.179076 3.166620 0.0042

    R-squared 0.294688 Mean dependent var 8.14E-17 Adjusted R-squared 0.147748 S.D. dependent var 0.113041 S.E. of regression 0.104357 Akaike info criterion -1.505141 Sum squared resid 0.261370 Schwarz criterion -1.224901 Log likelihood 28.57711 F-statistic 2.005497 Durbin-Watson stat 1.521486 Prob(F-statistic) 0.114145

    Existe problema pois rejeita-se Ho a 1%. Existe AR(1)

  • Econometria Prof. Adriano M. R. Figueiredo

    61

    Para AR(2): Breusch-Godfrey Serial Correlation LM Test:

    F-statistic 9.417751 Probability 0.001028 Obs*R-squared 13.50683 Probability 0.001167

    Test Equation: Dependent Variable: RESID Method: Least Squares Date: 03/07/05 Time: 21:13

    Variable Coefficient Std. Error t-Statistic Prob.

    LOG(IPI) -0.036780 0.134421 -0.273620 0.7868 LOG(PCBOLSA) 0.028677 0.095271 0.301008 0.7661

    LOG(CONST) 0.082020 0.112179 0.731149 0.4721 LOG(PALU) -0.017166 0.082432 -0.208239 0.8369

    C -0.552588 0.785758 -0.703255 0.4890 RESID(-1) 0.795135 0.184599 4.307363 0.0003 RESID(-2) -0.489015 0.191703 -2.550900 0.0179

    R-squared 0.450228 Mean dependent var 8.14E-17 Adjusted R-squared 0.306809 S.D. dependent var 0.113041 S.E. of regression 0.094116 Akaike info criterion -1.687610 Sum squared resid 0.203731 Schwarz criterion -1.360664 Log likelihood 32.31415 F-statistic 3.139250 Durbin-Watson stat 1.918606 Prob(F-statistic) 0.021333

    Tambm existe problema para AR(2). Ficou mais expressivo o problema de autocorrelao. Para AR(3): Breusch-Godfrey Serial Correlation LM Test:

    F-statistic 6.169355 Probability 0.003321 Obs*R-squared 13.70695 Probability 0.003332

    Test Equation: Dependent Variable: RESID Method: Least Squares Date: 03/07/05 Time: 21:25

    Variable Coefficient Std. Error t-Statistic Prob.

    LOG(IPI) -0.029746 0.137274 -0.216691 0.8304 LOG(PCBOLSA) 0.025964 0.096960 0.267780 0.7914

    LOG(CONST) 0.078075 0.114254 0.683340 0.5015 LOG(PALU) -0.025278 0.085213 -0.296644 0.7695

    C -0.512105 0.802317 -0.638283 0.5299 RESID(-1) 0.854409 0.219535 3.891895 0.0008 RESID(-2) -0.592317 0.278293 -2.128395 0.0447 RESID(-3) 0.126950 0.244219 0.519819 0.6084

    R-squared 0.456898 Mean dependent var 8.14E-17 Adjusted R-squared 0.284093 S.D. dependent var 0.113041 S.E. of regression 0.095646 Akaike info criterion -1.633151 Sum squared resid 0.201259 Schwarz criterion -1.259498 Log likelihood 32.49727 F-statistic 2.644009 Durbin-Watson stat 2.002055 Prob(F-statistic) 0.038212

    Ainda tem, mas menos que para AR(2). Observe que o termo de RESID(-3) j no significativo. Optar por corrigir para AR(2).

  • Econometria Prof. Adriano M. R. Figueiredo

    62

    Estimao com AR(1) e AR(2):

    Dependent Variable: LOG(PCDOM) Method: Least Squares Date: 03/07/05 Time: 21:31 Sample(adjusted): 1953 1980 Included observations: 28 after adjusting endpoints Convergence achieved after 9 iterations

    Variable Coefficient Std. Error t-Statistic Prob.

    LOG(IPI) 0.440700 0.165083 2.669563 0.0143 LOG(PCBOLSA) 0.291534 0.103733 2.810420 0.0105

    LOG(CONST) 0.102063 0.175677 0.580969 0.5674 LOG(PALU) 0.429664 0.118912 3.613298 0.0016

    C -2.197667 1.211239 -1.814395 0.0839 AR(1) 0.773165 0.187424 4.125212 0.0005 AR(2) -0.531683 0.192075 -2.768097 0.0115

    R-squared 0.960153 Mean dependent var 3.765864 Adjusted R-squared 0.948768 S.D. dependent var 0.428531 S.E. of regression 0.096996 Akaike info criterion -1.615986 Sum squared resid 0.197571 Schwarz criterion -1.282935 Log likelihood 29.62381 F-statistic 84.33634 Durbin-Watson stat 1.850840 Prob(F-statistic) 0.000000

    Inverted AR Roots .39+.62i .39 -.62i

    Comparar com resultados da primeira regresso! Melhores indicadores!

  • Econometria Prof. Adriano M. R. Figueiredo

    63

    Anexo: Tabela de Durbin-Watson para 5% de significncia, reproduzida a partir de Gujarati,

    Damodar. Basic Econometrics. McGraw-Hill, 2004.

  • Econometria Prof. Adriano M. R. Figueiredo

    64

    Exemplo: Se n = 40 e k = 4, dL = 1,285 e dU = 1,721. Se o valor de DW calculado menor

    que 1,285, existe evidncia de autocorrelao serial de primeira ordem e positiva; se DW for

    maior que 1,721 e menor que 4-dU = 2,279, ento no existe evidncia de autocorrelao de

    primeira ordem, mas se DW estiver entre os limites dL e DU, ou entre 4-dU e 4-dL ento

    existe uma rea inconclusiva sobre autocorrelao.

  • Econometria Prof. Adriano M. R. Figueiredo

    65

    4.5. Pressuposio 5: As variveis explicativas so no aleatrias (so fixas)

    Se as variveis explicativas e os termos aleatrios forem correlacionados, haver

    inconsistncia dos estimadores de mnimos quadrados ordinrios. Deve-se utilizar o estimador

    de variveis instrumentais. O mtodo de Variveis instrumentais prev que

    = (ZX)-1ZY , e Z uma matriz de instrumentos independentes dos erros aleatrios.

    No se tem testes formais para investigar esta pressuposio. O que feito em geral

    investigar as correlaes entre as variveis explicativas e os termos aleatrios via matriz de

    correlaes entre eles.

    Outra alternativa fazer o Teste de exogeneidade das variveis utilizando o

    procedimento de Hausmann.

    4.6. Pressuposio 6: O erro tem distribuio normal, com mdia zero e varincia constante:

    O teste para deteco mais usual o Bera-Jarque, ou teste BJ, o qual testa a simetria e

    a curtose da distribuio dos resduos em relao curva normal.

    A curtose est associada ao achatamento da distribuio, quanto mais chata menor o

    valor da curtose (K). Exemplo: K>3 (distribuio mais em p), K

  • Econometria Prof. Adriano M. R. Figueiredo

    66

    ( ) ( )[ ] 2 22412 361

    =+= gl~KSpnBJ

    Se rejeitar H0:erros normais, tenho que descobrir qual a distribuio real dos

    resduos e fazer nova deduo do estimador dos parmetros.

    Em geral, para amostras grandes, aplica-se o Teorema do Limite Central

    argumentando que no limite tem-se a normalidade da distribuio dos resduos.

    Roteiro para testar no Eviews:

    1) estimar a regresso

    2) no menu equation, acionar View/Residual Tests/histogram

    3) a anlise fornece o histograma com uma tabela de estatsticas descritivas da serie de

    resduos, contendo o skewness (simetria) e a kurtosis (curtose). Se K for prximo de 3,

    ento prxima da normal.

    Exemplo 1: se K=2,95 e 2tab = 1,76 e o p-value=0,41, para H0: erro normal, ento p-value

    maior que 0,10 indica a aceitao de H0, ou seja, os erros so normais.

    Exemplo 2:

    Ex12_22, Gujarati (p.447):

    Std. Dev = 0,085542

    Skewness = 0,047155

    Kurtosis = 2,367936

    BJ = 0,47 e p-value = 0,78 => aceita H0: erros normais

  • Econometria Prof. Adriano M. R. Figueiredo

    67

    Anexo Erros Normais: Equation/View/Residual Tests/Histogram Normality Test

  • Econometria Prof. Adriano M. R. Figueiredo

    68

    4.7. Pressuposio 7: Ausncia de relao linear exata entre as variveis explicativas (no multicolinearidade)

    A deteco do problema passa por diversas anlises:

    1. Ocorrncia de R2 alto e ts no-significativos;

    2. Altas correlaes simples entre as variveis explicativas, por exemplo, acima de 0,8;

    3. Altas correlaes parciais entre os Xs: verificar o coeficiente de correlao parcial quando

    algumas variveis so consideradas constantes;

    4. Regresses auxiliares: fazer a regresso considerando o Xi como varivel dependente das

    demais variveis Xj

    X1 = f(X2, X3, X4, ... , Xn)

    X2 = g(X1, X3, X4, ... , Xn)

    X3 = h(X1, X2, X4, ... , Xn)

    Etc

    Esta alternativa permite identificar quais variveis esto mais relacionadas. Se o R2 da

    regresso auxiliar for alto, ento se tem a indicao de multicolinearidade;

    5. Regra de Klein: a multicolinearidade no prejudicial se

    R2Y X1, X2, ... , Xk > R2

    Xi X2, ... , Xk

    6. Verificar a estabilidade das estimativas

    Y = f(X1)

    Y = f(X1,X2)

    Y = f(X1, X2, X3)

    As solues para a presena de multicolinearidade passam pela retirada de variveis

    problemticas, ou omisso de variveis, deixando aquela mais relevante para a pesquisa. As

    regresses auxiliares auxiliaro na escolha entre as variveis para decidir qual ser retirada do

    modelo. O problema com a omisso de variveis a insero de erro de especificao. Outra

    opo aumentar o tamanho da amostra, caso possvel. O aumento da amostra o mesmo que

    reduzir a micronumerosidade e com isto ganha-se observaes que tendem a no estar

    observando uma perfeita relao com outras variveis. Uma terceira opo transformar as

    variveis problemticas, fazendo razes entre elas (Xi/Xj), como os preos relativos. A

  • Econometria Prof. Adriano M. R. Figueiredo

    69

    limitao com este procedimento que se perde a relao direta, ficando apenas com

    parmetros que refletem relaes para a razo.

    O clculo das correlaes parciais no direto nem simples quando se tratar de

    regresso mltipla. Uma alternativa usar pacotes que j contm a rotina, como por exemplo

    o Stata, fazendo uso de comandos como a seguir, para o exemplo dado em Greene

    (2002:p.30): . pcorr y year g interest p

    Partial correlation of y with

    Variable | Corr. Sig.

    -------------+------------------

    year | -0.9385 0.000

    g | 0.9693 0.000

    interest | -0.5410 0.069

    p | 0.0153 0.962

    Ou seja, retorna as correlaes parciais de y com respeito a cada varivel da lista (year,

    g, interest, p).

    Outro mtodo a anlise do Fator de varincia inflacionria (FVI