12

Click here to load reader

Econometria - Danielle Carusi Machado · PDF file2 Variância do estimador de MQO Forma mais geral Definaa matriz X quecontém umaconstante e K-1 variáveis explicativas A variância

Embed Size (px)

Citation preview

Page 1: Econometria - Danielle Carusi Machado · PDF file2 Variância do estimador de MQO Forma mais geral Definaa matriz X quecontém umaconstante e K-1 variáveis explicativas A variância

1

Econometria

1. Multicolinearidade2. Observações missing3. Propriedades assintóticas dos estimadores MQO

Danielle Carusi Machado - UFF - Econometria 2/2010

Econometria

1. Multicolinearidade2. Testes de hipóteses no modelo de regressão linear3. Propriedades assintóticas dos estimadores MQO

Danielle Carusi Machado - UFF - Econometria 2/2010

Multicolinearidade

� Quando existem relação linear exata entre as variáveis independentes será impossível calcular os estimadores de MQO.

� O procedimento MQO utilizado para estimação não será efetivado.� Mensagem: “matriz quase singular” (uma matriz quase singular

X´X não pode ser invertida) ou “a variável xk dropped”. � Relacionamento linear exato: só quando os dados foram

construídos pelo pesquisador, pe., no caso de inclusão de dummies.

� Relacionamento linear aproximado entre as variáveis independentes: comuns em economia.

� O procedimento de estimação não é rompido quando as variáveis são bastante correlacionadas, contudo, surgem problemas de estimação.

Multicolinearidade

� Multicolinearidade: nome dado ao fenômeno de presença de relação linear aproximada entre os regressores.

� Problema de estimação causado por uma amostra particular. Não é um problema teórico.

� Multicolinearidade nos dados pode existir por diferentes motivos:� Regressores possuem a mesma tendência temporal.� Algumas variáveis caminham na mesma direção porque

os dados não foram coletados de uma base grande.� Pode existir realmente algum tipo de relacionamento

aproximado entre os regressores.

Multicolinearidade

Característica do banco de dados que afeta a matriz de covariância do Estimador de MQO.

Considere um estimador de um dos parâmetros βk: E[bk] = βk (não viesado)

Var[b] = σ2(X’X)-1 .

A variância de bk é o k-ésimo elemento da diagonal da matriz σ2(X’X)-1

Escreva [X,z] sendo [outros xs, xk] = [X1,x2]

M1 matriz que gera os resíduos da projeção de um vetor no subespaço formado pelas colunas de X1.

O elemento da diagonal será: [x2′M1x2]-1 que corresponde ao recíproco da soma do quadrado dos resíduos da regressão de x2 em X1.

Variância do estimador de MQO

A variância estimada de bk éVar[b2/X] =

Quanto maior o fit da regressão de x2 em X1, maior a variância. No limite, um ajuste perfeito produz uma variância infinita.

.)1(

)()1( 222.2

2

2

1

222.2

2

SR

s

xxR

sn

ii

−=

−− ∑

=

Page 2: Econometria - Danielle Carusi Machado · PDF file2 Variância do estimador de MQO Forma mais geral Definaa matriz X quecontém umaconstante e K-1 variáveis explicativas A variância

2

Variância do estimador de MQO

Forma mais geral

Defina a matriz X que contém uma constante e K-1 variáveis explicativas

A variância estimada de bk éVar[bk/X] =

( ) ( )∑=

−−n

ikikk xxR

s

1

22.

2

1

Ingrediente para existência

de multicolinearidade:

- Quanto maior a correlação entre xk e as outras variáveis (R 2

k).

Consequências da

Multicolinearidade

� O estimador de MQO permanece não viesado e BLUE.

� O grau de ajuste não é afetado.� Problemas práticos:

� Pequenas mudanças nos dados produzem grandes variações nas estimativas dos parâmetros.

� Os coeficientes estimados apresentam erros padrão muito elevados e baixos níveis de significância, mesmo que sejam conjuntamente significativos e com o grau de ajuste da regressão elevado (R2).

� Os coeficientes podem ter o sinal “errado” e magnitudes irreais.

Consequências da

Multicolinearidade

� Na presença de multicolinearidade, o procedimento de estimação MQO não recebe variação independente suficiente de uma variável para realizar o cálculo com confiança do efeito que esta tem sobre a variável dependente.

� Quando os regressores são altamente correlacionados, a maior parte da sua variação é comum às duas variáveis, deixando pouca variação exclusiva a cada variável.

� MQO tem pouca informação para usar ao fazer as estimativas do coeficiente (similar a um problema de amostra pequena ou que a variável não mudasse muito).

Consequências da

Multicolinearidade

� As variâncias dos estimadores MQO dos parâmetros são muito grandes – Imprecisão dos estimadores dos parâmetros.

� Erros de especificação : não sabemos qual variável é mais ou menos importante para explicar a variação da variável dependente.

Como detectar?

� Controvérsia: muitos métodos inadequados.� Sinais hipotéticos não são encontrados.� Variáveis consideradas a priori importantes não são

significativas individualmente, mas estatística F (significância coletiva) é alta.

� Resultados alterados quando uma variável independente é excluída ou quando uma observação é retirada.

� Matriz de correlação (0,8 a 0,9 são valores absolutos altos): detecta colinearidade de duas variáveis, mas não de mais de duas.

Como detectar?

� Índice de condição dos dados (IC): � Raiz quadrada da razão da maior para a menor raiz

característica de X´X

� Medida de sensibilidade das estimativas a pequenas pertubações dos dados.

� Medida de proximidade de X´X da singularidade (multicolinearidade perfeita): quanto maior o IC maior dificuldade em inverter a matriz.

� Índice maior que 20 indica colinearidade forte: mudança de 1% nos dados faz surgir uma mudança de IC% nos estimadores.

2/1

=raizmínima

raizmáximaγγγγ

Page 3: Econometria - Danielle Carusi Machado · PDF file2 Variância do estimador de MQO Forma mais geral Definaa matriz X quecontém umaconstante e K-1 variáveis explicativas A variância

3

Como detectar?

� Inverso da matriz de correlação:

� Elementos na diagonal: Fatores de inflação da variância (VIF).

� Quanto maior VIF, mais o R2k está perto da unidade.

� Medida da quantidade pela qual a variância da k-ésimaestimativa do coeficiente é aumentada devido a associação linear com as outras variáveis explicativas.

� Se VIF > 10: presença de colinearidade

)2.1(

1

kRVIF

−=

R2 da regressão da k-ésimavariável independente em todas demais variáveis independentes.

No stata:

. reg ln_sal_hora filho idade idade2 sexo educa

Source | SS df MS Number of obs = 14537-------------+------------------------------ F( 5, 14531) = 1939.23

Model | 5434.065 5 1086.813 Prob > F = 0.0000Residual | 8143.68463 14531 .560435251 R-squared = 0.4002

-------------+------------------------------ Adj R-squared = 0.4000Total | 13577.7496 14536 .934077438 Root MSE = .74862

------------------------------------------------------------------------------ln_sal_hora | Coef. Std. Err. t P>|t| [95% Conf. Interval]-------------+----------------------------------------------------------------

filho | -.209508 .0202922 -10.32 0.000 -.2492833 -.1697328idade | .0604502 .0028366 21.31 0.000 .05489 .0660103idade2 | -.0005105 .0000332 -15.37 0.000 -.0005756 -.0004454sexo | -.346604 .0129488 -26.77 0.000 -.3719854 -.3212227educa | .1304724 .0014665 88.97 0.000 .1275979 .1333469_cons | -.4814204 .061482 -7.83 0.000 -.601933 -.3609078

------------------------------------------------------------------------------

. vif

Variable | VIF 1/VIF -------------+----------------------

idade | 33.37 0.029969idade2 | 30.63 0.032650filho | 1.63 0.611927educa | 1.11 0.901243sexo | 1.04 0.961969

-------------+----------------------Mean VIF | 13.56

No stata:

. collin idade idade2 sexo educa filho

Collinearity Diagnostics

SQRT R-Variable VIF VIF Tolerance Squared

----------------------------------------------------idade 27.65 5.26 0.0362 0.9638idade2 19.99 4.47 0.0500 0.9500sexo 1.02 1.01 0.9843 0.0157educa 1.55 1.25 0.6449 0.3551filho 3.11 1.76 0.3218 0.6782

----------------------------------------------------Mean VIF 10.66

CondEigenval Index

---------------------------------1 4.3513 1.00002 1.0883 1.99963 0.3723 3.41874 0.1424 5.52835 0.0395 10.49056 0.0063 26.3514

---------------------------------Condition Number 26.3514 Eigenvalues & Cond Index computed from scaled raw sscp (w/ intercept)Det(correlation matrix) 0.0194

No stata: graph matrix fam peer school

Multicolinearidade

Não existe “cura” para a colinearidade.

1. Exclusão de variáveis: eliminar as variáveis que causam o problema – imporna regressão a hipótese de que a variável problemática não deve aparecerno modelo. Possível problema de especificação.

2. Obtenção de mais dados: dados adicionais e tamanho da amostra.

3. Formalizar os relacionamentos entre os regressores: equações simultâneas.

4. Especificar o relacionamento entre alguns parâmetros: dois parâmetrosiguais ou que a soma das elasticidades deve ser igual a um, etc.

5. Análise componente principal: as variáveis colineares poderiam ser agrupadas para formar um índice composto capaz de representar esteconjunto de variáveis. Variável só pode ser criada se tiver umainterpretação econômica.

Econometria

2. Observações missing3. Testes de hipóteses no modelo de regressão linear4. Propriedades assintóticas dos estimadores MQO

Danielle Carusi Machado - UFF - Econometria 2/2010

Page 4: Econometria - Danielle Carusi Machado · PDF file2 Variância do estimador de MQO Forma mais geral Definaa matriz X quecontém umaconstante e K-1 variáveis explicativas A variância

4

Observações missing

� Existem gaps no banco de dados.� Em surveys, entrevistados não respondem as

perguntas.� Série temporal: dado não existe na frequência

desejada.� Painel: atrito – as unidades observacionais

deixam de ser investigadas.

Observações missing

� Informações missing de forma aleatória:� a informação não está disponível por razões

desconhecidas e;� não há relação com os valores presentes para outras

variáveis existentes na amostra.

� As informações não são perdidas de forma aleatória (estão sistematicamente relacionadas com fenômeno que está sendo modelado) –problema de seleção amostral.

Imputação de dados

� Regressores:� Método de ordem zero: substitui os valores missing

pelas médias das informações completas – melhora no ajuste.

� Predições com base nas outras variáveis disponíveis.� Nos dois casos acima, a variável verdadeira é

substituída por uma proxy: (erro de medida) - viés

ikuikxikx +=ˆ

Imputação de dados

� Variável dependente:� Informações dos regressores está completa.� Estimar os coeficientes e gerar uma predição para

os valores faltantes.� bc é calculado com base nas informações completas

de yc e Xc.

� No segundo passo, o estimador da variância será menor pois está incluindo observações exatas de y.

� A imputação só vale a pena se a % imputada é muito pequena.

cbmXmy =ˆ

Econometria

3. Propriedades assintóticas dos estimadores MQO

Danielle Carusi Machado - UFF - Econometria 2/2010

Propriedades assintóticas

O número de resultados estatísticos exatos, tais como ovalor esperado ou a distribuição verdadeira, emmuitos modelos é baixo.

Usualmente, utilizamos resultados aproximados com baseno que se sabe do comportamento de determinadasestatísticas de grandes amostras.

Danielle Carusi Machado - UFF - Econometria 2/2010

Page 5: Econometria - Danielle Carusi Machado · PDF file2 Variância do estimador de MQO Forma mais geral Definaa matriz X quecontém umaconstante e K-1 variáveis explicativas A variância

5

Convergência

Definições, tipos de convergência quando ncresce:

1. Para uma constante; exemplo, a média amostral,

2. Para uma variável aleatória; exemplo, uma estatística t com n -1 graus de liberdade.

x

Danielle Carusi Machado - UFF - Econometria 2/2010

Convergência para uma constante

Convergência de uma variável aleatória

O que significa uma variável aleatória convergir para uma constante?

Convergência da variância para zero.

A variável aleatória converge para algo que não é aleatório.

Danielle Carusi Machado - UFF - Econometria 2/2010

Resultados de convergência

Convergência de uma sequência de variáveis aleatórias para umaconstante

A média converge para uma constante e a variância converge para zero.

Teorema de convergência para momentos amostrais. Momentosamostrais convergem em probabilidade para seusanálogos populacionais.

(1/n)Σig(zi) converge para E[g(zi)].

211 , [ ] , Var[ ]= / 0n

n i i n nnx x E x x n== Σ = µ → µ σ →

Danielle Carusi Machado - UFF - Econometria 2/2010

Convergência em probabilidade

( ) . positivoalor qualquer v para 0Prlim

sss constante uma para

adeprobabilid em converge aleatória A variável

εεεεεεεε =>−∞→ cxob

c

x

nn

n

A probabilidade que a diferença entre xn e c seja maior do que ε para qualquer ε vai para zero.

Ou seja, xn fica perto de c.

Danielle Carusi Machado - UFF - Econometria 2/2010

Convergência em probabilidade

Convergência em probabilidade significa que os valores das variáveis que não estão próximos de c ficam cada vez mais improváveis à medida que o n cresce.

Exemplo: Suponha uma variável aleatória xn que assume dois valores, zero e n, com probabilidades (1-1/n) e (1/n), respectivamente.Quando n aumenta , o segundo valor é menos provável.Xn converge em probabilidade para zero.

Toda a massa da distribuição de probabilidade fica concentrada em pontos próximos de c. cxp n =lim

Danielle Carusi Machado - UFF - Econometria 2/2010

Convergência em Média Quadrática

Se xn tem média µn e variância σ2 tal que os limites ordinários de µn e σ2 são c e 0, respectivamente, xn converge em “mean square “ para c, e

cxp n =lim

Page 6: Econometria - Danielle Carusi Machado · PDF file2 Variância do estimador de MQO Forma mais geral Definaa matriz X quecontém umaconstante e K-1 variáveis explicativas A variância

6

Convergência em Média Quadrática

Convergência em probabilidade não implicaconvergência em média quadrática!!!

Exemplo dado: calcular o valor esperado: o valor esperadoé igual a 1 para qualquer n.

As condições para a convergência em média são maisfáceis de verificar do que a forma geral de convergência em probabilidade.

Utilizaremos quase sempre convergência em média.

Danielle Carusi Machado - UFF - Econometria 2/2010

Consistência de um estimador

Se a variável aleatória, xn é um estimador (por exemplo, a média), e se:

plim xn = θ

xn é um estimador consistente de θ.

Danielle Carusi Machado - UFF - Econometria 2/2010

Teorema de Slutsky

Se xn é uma variável aleatória tal que plim xn = θ. Onde θ é uma constante.g(.) é uma função contínua. g(.) não é função de

n.Conclusão: plim[g(xn)] = g[plim(xn)] e g[plim(xn)]

existe. Limite de probabilidade não necessariamente

funciona para esperanças.

µ = µ µn n n nE[x ]= ; plim(x ) , E[1/x ]=?; plim(1/x )=1/

Danielle Carusi Machado - UFF - Econometria 2/2010

Corolários Slutsky

θ µ± = θ ± µ× = θ × µ

= θ µ µ ≠= θ µ

n n

n n

n n

n n

n n

x and y are two sequences of random variables with

probability limits and . Plim (x y ) (sum)

Plim (x y ) (product)

Plim (x / y ) / (product, if 0)

Plim[g(x ,y )] g( , ) assuming it exists and g(.) is

continuous with continuous partials, etc.

Danielle Carusi Machado - UFF - Econometria 2/2010

Resultados de Slutsky para

Matrizes

Funções de matrizes são funções contínuas de elementos das matrizes.

Se plimAn = A e plimBn = B (elemento a elemento),

Plim(An-1) = [plim An]-1 = A-1

e plim(AnBn) = plimAnplim Bn = AB

Danielle Carusi Machado - UFF - Econometria 2/2010

Distribuições limites

Convergência para um tipo de VA e não para uma constante

xn é uma sequência de Va com Fn(xn). Se plim xn = θ (constante), Fn(xn) será um ponto.

Mas, Fn pode convergir para uma variável aleatória específica.

A distribuição desta VA será a distribuição limite de xn.

dn n n nx x F (x ) F(x)→∞→ ⇔ →

Danielle Carusi Machado - UFF - Econometria 2/2010

Page 7: Econometria - Danielle Carusi Machado · PDF file2 Variância do estimador de MQO Forma mais geral Definaa matriz X quecontém umaconstante e K-1 variáveis explicativas A variância

7

Teorema de Slutsky para Variáveis

Aleatórias

Se , e se g(Xn) é uma função continua com derivadas

contínuas e que não depende de n, temos que :

Exemplo:

t-student converge para uma normal padrão.

Quadrado de uma t-student converge para uma qui-quadrada.

XX dn →

)()( XgXg dn →

Danielle Carusi Machado - UFF - Econometria 2/2010

Uma extensão do Teorema de

Slutsky

Se (Xn tem uma distribuição limite) e θ é uma constante tal

que (gn tem uma distribuição limite que é função de θ),

e temos que:

Ou seja, substituir o θ por um estimador consistente leva a mesma

distribuição limite.

xx dn →

gxg dn →),( θθθθ

θθθθ=nyp lim gyxg dnn →),(

Danielle Carusi Machado - UFF - Econometria 2/2010

Aplicação do Teorema de Slutsky

Comportamento da estatística F para testar restrições em grandes amostras:

2

2

2

2

****

1)(

´

)´´(

)(´

)´´(

Jd

p

Jd

JF

knee

JJeeee

knee

Jeeee

F

χχχχ

σσσσ

χχχχσσσσ

→−

=−

−=

Danielle Carusi Machado - UFF - Econometria 2/2010

Teorema do Limite Central

Descreve o comportamento de uma variávelaleatória que envolve soma de variáveis“Tendência para a normalidade.”

A média de uma amostra aleatória de qualquerpopulação (com variância finita), quandopadronizada, tem uma distribuição normal padrão assintótica.

Danielle Carusi Machado - UFF - Econometria 2/2010

Teorema do Limite Central

Teorema Lindeberg-Levy (versão simples do TLC):

Se x1, x2, … , xn é uma amostra aleatória de uma população cuja

distribuição de probabilidade tem média µ e variância finita

igual a σ2 e temos que: ∑=

=n

i

in xn

x

1

1

)1,0(

:lim

)1,0(

Ns

xn

spSe

Nx

n

d

n

n

n

dn

→−=

→−

µµµµσσσσ

σσσσµµµµ

Danielle Carusi Machado - UFF - Econometria 2/2010

Teorema do Limite Central

Teorema Lindeberg-Feller :

Suponha que é uma sequência de variáveis aleatórias

independentes com média µi e variâncias positivas finitas σ2i

{ } nix i ,...,1, =

( )

( )

( ) ),0(

...1

...1

2

3212

321

σσσσµµµµ

σσσσσσσσσσσσσσσσσσσσ

µµµµµµµµµµµµµµµµµµµµ

Nxn

n

n

dnn

nn

nn

→−

++++=

++++=

Danielle Carusi Machado - UFF - Econometria 2/2010

Page 8: Econometria - Danielle Carusi Machado · PDF file2 Variância do estimador de MQO Forma mais geral Definaa matriz X quecontém umaconstante e K-1 variáveis explicativas A variância

8

Lindberg-Levy vs. Lindeberg-Feller

Lindeberg-Levy assume amostra aleatória – observaçõespossuem as mesmas média e variância.

Lindeberg-Feller – a variância pode ser diferente entre asobservações, apenas com hipóteses de como elas variam.Soma de variáveis aleatórias, independente da suadistribuição, tenderão a ser normalmente distribuídas. E,mais, Lindeberg-Feller não requere que as variáveis na somavenham da mesma distribuição de probabilidade.

Estimadores em econometria – uso da versão Lindeberg-Fellerdo TLC.

Danielle Carusi Machado - UFF - Econometria 2/2010

Distribuição assintótica

� Uma distribuição assintótica é uma distribuição usada para a aproximar a verdadeira distribuição de amostra finita de uma variável aleatória.

� Construída a partir da distribuição limite da função de uma variável aleatória.

� Se

� é assintoticamente normalmente distribuído com média µ e variância σ2/n.

),(~

)1,0(

2

nNx

Nx

n

n

dn

σσσσµµµµ

σσσσµµµµ →

Danielle Carusi Machado - UFF - Econometria 2/2010

Eficiência assintótica

� Comparação de variâncias assintóticas

� Como comparamos estimadores consistentes? Se

convergem para constante, ambas variâncias vão para zero.

� Eficiência assintótica: Um estimador é assintoticamente

normal, este estimador é eficiente assintoticamente se a

matriz de covariância de qq outro estimador consistente e

assintoticamente normal exceder (1/n)V por uma matriz

definida não negativa.

nθθθθ̂

),0()ˆ( VNn dn →−θθθθθθθθ

Danielle Carusi Machado - UFF - Econometria 2/2010

Eficiência assintótica

Exemplo: Amostra aleatória de uma distribuiçãonormal,

� A média amostral é assintoticamente normal com [µ,σ2/n]

� Mediana é assintoticamente normal com [µ,(π/2)σ2/n]

� Média é assintoticamente mais eficiente.

Danielle Carusi Machado - UFF - Econometria 2/2010

Propriedades assintóticas do EMQ

A hipótese de normalidade não é necessária para derivarmos as propriedades assintóticas.

Hipóteses: Convergência de X′′′′X/n para uma matriz Q positiva definida.

Convergência de X’εεεε/n para 0. Suficiente para a consistência.

Hipóteses: Convergência de (1/√n)X’εεεε para um vetor com distribuição normal – normalidade assintótica.

Danielle Carusi Machado - UFF - Econometria 2/2010

EMQ

EMQ pode ser escrito da seguinte forma:(X′′′′X)-1X′′′′y = (X′′′′X)-1Σixiyi

= ββββ + (X′′′′X)-1Σixiεi

Um vetor de constantes mais um vetor de variáveisaleatórias.

Os resultados para a amostra finita são estabelecidosconforme regras estatísticas para esta soma.

Como esta soma de variáveis se comporta em grandesamostras?

Danielle Carusi Machado - UFF - Econometria 2/2010

Page 9: Econometria - Danielle Carusi Machado · PDF file2 Variância do estimador de MQO Forma mais geral Definaa matriz X quecontém umaconstante e K-1 variáveis explicativas A variância

9

=

=

= + × ε

× ε × ε

1n

i ii 1

1n

i i i ii 1

We use 'convergence in mean square. Adequate for almost all problems, not adequate for some time

series problems.

1 1n n

1 1 1( ' '

n n n

b X'X x

b - b - X'X x x

ββββ

β)( β) =β)( β) =β)( β) =β)( β) =−

=

− −

=

ε ε

∑ ∑

1n

i 1

1 1n

i i j j2 i 1

1n

1 1 1 '

n n n

In E[( ' | ] in the double sum, terms with unequalsubscripts have expectation zero.

E[( '

n

j=1

X'X

X'X x x X'X

b - b - X

b - b -

====

β)( β)β)( β)β)( β)β)( β)

β)( β)β)( β)β)( β)β)( β)− −

=

− − −

ε

σ σ = =

∑1 1

n 2i j i2 i 1

1 1 12 2

1 1 1| ] 'E[ | ]

n n n

1 1 1 1

n n n n n n

X X'X x x X X'X

X'X X'X X'X X'X

====

Limite de probabilidade

Danielle Carusi Machado - UFF - Econometria 2/2009

Convergência em média quadrática

E[b|X]=β para qualquer X.Var[b|X]�0 para um X específico

b converge para β

b é consistente

Danielle Carusi Machado - UFF - Econometria 2/2010

Limite de probabilidade

=

− −

=

= + × ε

= × ε =

=

= =

1n

i ii 1

1 1n

i ii 1

1

1

1 1n n

1 1 1 1n n n n

1 1P lim( ) p lim

n n

1 1 1 p lim plim plim

n n n

b X'X x

b - X'X x X'X X'

b - X'X X'

X'X X' X'X

ββββ

β εβ εβ εβ ε

β εβ εβ εβ ε

εεεε−

=

=

1

1

1plim

n

1 p lim assuming well behaved regressors.

n

1What must be assumed to get p lim ?

n

X'

Q X'

X' 0

εεεε

εεεε

εεεεEste plim deverá ser zero

Danielle Carusi Machado - UFF - Econometria 2/2010

A inversa é uma função contínua da matriz original.

Resultados Assintóticos

−=

+ × ε ∑

n1i ii 1

1n

What is the mean of this random vector?

What is its variance?Do they 'converge' to something? We use

this method to find the probability limit.What is the asymptotic distribu

Q xββββ

tion?

Danielle Carusi Machado - UFF - Econometria 2/2010

Qual a média desta variável aleatória?

Qual sua variância?

Esta soma converge para algo? Podemos achar o limite de probabilidade.Qual a distribuição assintótica?

Limite de probabilidade

Danielle Carusi Machado - UFF - Econometria 2/2010

wpQbp

wwn

xnn

X

n

Xp

n

i

i

n

i

ii

limlim

11'

'lim

111

−==

+=

===

∑∑ββββ

εεεεεεεε

εεεε

Devemos encontrar o plim do último termo:

Para isto, devemos formular algumas hipóteses.

Hipótese crucial do modelo

O que devemos assumir para que plim(1/nX’ε)=0?

1) xi = vetor aleatório com média e variâncias finitas e com distribuições idênticas.

2) εi = variável aleatória com uma distribuição constante com média e variância finitas e E(εi)=0

3) xi e εi são estatisticamente independentes. wi = xiεi = uma observação em uma amostra aleatória, com matriz de covariância constante e o vetor de média igual a zero.

converge para sua esperança.∑ iwn

1

Danielle Carusi Machado - UFF - Econometria 2/2010

Page 10: Econometria - Danielle Carusi Machado · PDF file2 Variância do estimador de MQO Forma mais geral Definaa matriz X quecontém umaconstante e K-1 variáveis explicativas A variância

10

Limite de probabilidade

Danielle Carusi Machado - UFF - Econometria 2/2010

0)(1

)(1

)1

()(

0)( exata aexpectativ a forma Desta

0

)(

111

====

=

=

=

=

=

∑∑∑=== i

i

i

i

i

i

i

iix

iii

xi

ixi

wEn

wEn

wn

EwE

wE

xExE

xxEE

xwEEwE

εεεε

εεεε

Pela hipótese de exogeneidade e pela lei das expectativas iteradas:

Limite de probabilidade

Danielle Carusi Machado - UFF - Econometria 2/2010

( )[ ] ( )[ ]( )[ ]

[ ]

( ) [ ]

( )[ ]

=

===

=

+=

+=

n

X´X

n

2var

n

X´X

n

21|'´

1)´/(var

I 2|' usamos termoprimeiro ocalcular ara

0var

varvar)var(

EXwE

nXXEX

nXwwEX

w

XEP

XwE

XwEX

wEw

σσσσ

σσσσεεεεεεεε

σσσσεεεεεεεε

Pela decomposição da variância:

Limite de probabilidade

Danielle Carusi Machado - UFF - Econometria 2/2009

( )[ ]

ββββββββ

εεεε

σσσσσσσσ

=+=

=

∞→==

=

==

− 0.lim

0'

plim

:forma desta zero, para quadrática

média em converge zero, para converge variânciasua e zero é média a Como

0.0)var(lim.suficiente

será Q para converge X/n)(X' plim que de hipótese A constante. matriz uma

paraconvergir parênteses entre esperança a se zero para irá aA variânci

''var)var(

:(1) em (2) doSubstituin

1

22

Qbp

n

X

ww

n

Qw

n

XXE

nn

XX

nE

XwEw

EMQ é consistente!!

Distribuição assintótica

=

= + × ε

∑1

n

i ii 1

1 1n n

The limiting behavior of is the same as that of the statistic that results when the moment matrix is replaced by its limit. Weexamine the behavior of the modified

b X'X x

b

ββββ

−=

+ × ε ∑

n1i ii 1

sum

1n

Q x β β β β

Danielle Carusi Machado - UFF - Econometria 2/2010

O comportamento limite de b é o mesmo da estatística resultante da substituição da matriz de momentos pelo seu limite. Examinamos o comportamento da seguinte soma modificada:

Distribuição assintótica

� b � β em probabilidade. Como descrever estadistribuição?� Não tem uma distribuição limite

� Variância b � 0� Como estabilizar a variância? Var[√n b] ~ σ2Q-1 is O(1)� Mas, E[√n b]= √n β que diverge

� √n (b - β) � é uma variável aleatória com média e variância finitas (transformação que estabiliza)

� b aproximadamente β +1/ √n vezes a variávelaleatória.

Danielle Carusi Machado - UFF - Econometria 2/2010

Distribuição limite

√n (b - β) = √n (X’X)-1X’ε

= √ n (X’X/n)-1(X’ε/n)No limite, isto é igual a (plim):

√ n Q-1(X’ε/n)Q é uma matriz positiva definida fixa.

Comportamento depende da variável aleatória√ n (X’ε/n)

Danielle Carusi Machado - UFF - Econometria 2/2010

Page 11: Econometria - Danielle Carusi Machado · PDF file2 Variância do estimador de MQO Forma mais geral Definaa matriz X quecontém umaconstante e K-1 variáveis explicativas A variância

11

Distribuição no limite: Normal

Danielle Carusi Machado - UFF - Econometria 2/2009

( )

iiiii

iii

QxxEx

xw

nw

wEwnXn

22 )'()var(

:a igual variânciae zero média têm vetoresEstes

:tesindependen aleatórios vetores de média a é

acima. aleatória variávelda limite ãodistribuiç a

obter para TLC doFeller -Lindeberg versãoausar Podemos

)(')1

(

σσσσσσσσεεεε

εεεε

εεεε

==

=

−=

Distribuição no limite: Normal

Danielle Carusi Machado - UFF - Econometria 2/2009

QQ

QQn

xn

xn

nwnwn

QxxExS

n

ni

iiii

iiiii

22

22

22

lim

)var(1

)1

var()var()var(

)'()var(e

σσσσσσσσ

σσσσσσσσ

εεεεεεεε

σσσσσσσσεεεε

=

==

===

==

∑∑

Distribuição no limite: Normal

Danielle Carusi Machado - UFF - Econometria 2/2009

{ }

( )

( )( )21

12111

2

2

,0)(

,0'1

,0'1

. a igual variância

e zero média com osdistribuíd tesindependen vetoressão

:)( vetor o para TLC o aplicarmos para elementos todos Temos

σσσσββββ

σσσσεεεε

σσσσεεεε

σσσσ

εεεε

−−−−

→−

QNbn

QQQQNXn

Q

QNXn

Q

x

wn

d

d

d

i

ii

Distribuição assintótica

Danielle Carusi Machado - UFF - Econometria 2/2009

( ){ }

TLC. do iaconsequênc com distúrbios dos enormalidad da

depende não EMQ do aassintótic enormalidad :importante Resultado

,~

:que temos finita

variânciae zero média com osdistribuíd tementeindependen são Se

tesindependen sobservaçõe com b de aassintótic ãoDistribuiç :Teorema

,0)(

21

2

21

→−

nQNb

QNbn

i

d

σσσσββββ

σσσσ

εεεε

σσσσββββ

Consistência de s2

= =− − −

→−

=

2

2

1 1 n 1s

n K n K n K nn

1n K

1 1 1p lims plim plim ( )

n n n

1 1 1 1plim plim plim ( ) p lim

n n n n

1plim

n

What must be a

-1

-1

-1

e'e 'M 'M

'M ' 'X X'X X'

' 'X X'X X'

' 0'Q 0

ε ε = ε εε ε = ε εε ε = ε εε ε = ε ε

ε ε = ε ε − ε εε ε = ε ε − ε εε ε = ε ε − ε εε ε = ε ε − ε ε

= ε ε ε ε = ε ε ε ε = ε ε ε ε = ε ε ε ε

= ε ε − = ε ε − = ε ε − = ε ε −

ε = σ2 21ssumed to claim plim = E[ ] ?

n'ε εε εε εε ε

Danielle Carusi Machado - UFF - Econometria 2/2009

Consistência de s2

Danielle Carusi Machado - UFF - Econometria 2/2009

12

12

1212

)'(var

var

)'

(lim

−−

=

=

=

XXsbest

Qn

b

Qn

XXsp

σσσσ

σσσσ

Page 12: Econometria - Danielle Carusi Machado · PDF file2 Variância do estimador de MQO Forma mais geral Definaa matriz X quecontém umaconstante e K-1 variáveis explicativas A variância

12

Eficiência assintótica

Danielle Carusi Machado - UFF - Econometria 2/2009

Um estimador é assintoticamente eficiente se é

consistente, assintoticamente normalmente distribuído, e

tem uma matriz de covariância que não é maior que uma

matriz de covariância de qualquer outro estimador

consistente e com distribuição assintótica normal.