68
Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6 Métodos Quantitativos Introdução à Análise de Regressão Prof. Dr. Miguel Rivera-Castro Universidade Salvador SSA - Bahia Brasil Maio 2016 [email protected] UNIFACS – SSA Prof. Dr. Miguel Rivera-Castro

Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

  • Upload
    others

  • View
    5

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

Métodos QuantitativosIntrodução à Análise de Regressão

Prof. Dr. Miguel Rivera-Castro

Universidade SalvadorSSA - Bahia

Brasil

Maio 2016

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 2: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

Outline

Revisão de conceitos básicos

Distribuição amostral dos estimadores OLS

Teste de hipóteses sobre um parâmetro populacional

Intervalos de Confiança

Teste de hipótese sobre uma c.I dos parâmetros

Modelo com restrições

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 3: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

Revisão de conceitos básicos

I Motivação (Objetivos-problemas-hipóteses)I Background Teórico e Literatura EmpíricaI MetodologiaI DadosI ResultadosI ImplicaçõesI Conclusões

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 4: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

Vantagens de regressão múltipla:

I Permite controlar o efeito simultâneo de muitos fatores so-bre a variável dependente.

I Permite inferir causalidade.

I Permite construir modelos melhores para prever a variáveldependente.

I É mais flexível.

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 5: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

O modelo com duas variáveis independentes

Um exemplo é o seguinte modelo:

Wagei = β0 + β1educi + β2experi + εi , i = 1, ...,n (1)

I onde Wagei é o salário do indivíduo i , educi é a educação do in-divíduo i e experi é o número de anos de experiência de trabalhodo indivíduo i . O tamanho da amostra é n.

I Wage está determinado pelas duas variáveis explicativas ou in-dependentes (educação e experiência), e por outro fator não ob-servado que se chama erro (ε).

I Estamos interessados no efeito de educ sobre wage, quando semantêm fixos todos os demais fatores que afetam a wage; querdizer, estamos interessados no parâmetro β1.

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 6: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

O modelo com duas variáveis independentes

Se a comparamos com uma regressão simples na que wage se ex-plique com educ, a Eq. (1) remove a exper do termo de erro e a colocaexplicitamente na equação. Portanto, β2 mede o efeito ceteris paribusda exper sobre Wage. Hipótese do modelo:

I H1: Existe uma relação linear de dependência dada pela equação (1);

I H2: E(εi |educi ,experi ) = 0 ∀i . Esta hipótese pode ser falsa seo modelo está mal especificado, quer dizer, p.ex., se omitirmosuma variável importante ou se há erros de medição. Portanto, seesta hipótese é certa dizemos que as variáveis independentessão exógenos, caso contrário, eles são endógenas;

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 7: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

O modelo com duas variáveis independentes

I H3: Var(εi |educi ,experi) = σ2 ∀i . Se isso não é verdade,diz-se que há heterocedasticidade;

I H4: Cov(εi , εj |educi ,experi) = 0 ∀i , j , i 6= j .I H5: As variáveis independentes são estocásticas, mas

Cov(εi ,educi) = Cov(εi ,experi) = 0 ∀1

, caso contrário há endogeneidade;I H6: Na amostra nenhuma das variáveis independentes é

constante e não existe uma correlação linear perfeita entreelas.

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 8: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

O modelo com k variáveis independentes

I A análise de regressão múltipla permite que muitos fatoresobservados afetem a variável dependente.

I No exemplo anterior também poderíamos incluir experiên-cia de trabalho, anos de antiguidade no emprego atual, me-didas das atitudes e incluso variáveis demográficas comonúmero de irmãos ou nível de educação da mãe como var-iáveis explicativas.

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 9: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

O modelo com k variáveis independentes

O modelo de regressão lineal múltipla geral é:

yi = β0 + β1x1i + β2x2i + ...+ βkxki + εi , i = 1, ...,n (2)

I O número de parâmetros é k + 1;I β0 é a constante;I β1 mede o efeito, ceteris paribus, de uma mudança unitária

de x1 em y . Uma interpretação parecida se lhes dá aosoutros parâmetros (as pendentes), mas não à constante;

I ε é o termo de erro e inclui a outros fatores que não apare-cem no modelo.

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 10: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

O modelo com k variáveis independentes

O modelo anterior pode ser escrita na forma matricial como:

Y = Xβ + ε (3)

onde Y é um vetor de longitude nx1, X é uma matriz de nx(k +1), β é um vetor de longitude (k + 1)x1 e ε é um vetor de nx1,quer dizer:

Y =

y1y2...

yn

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 11: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

O modelo com k variáveis independentes

β =

β1β2...βn

ε =

ε1ε2...εn

X =

1 x1,1 x2,1 ... x1,k1 x2,1 x2,2 ... x2,k. . . . .. . . . .. . . . .1 xn,1 x2,n ... xn,k

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 12: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

O modelo com k variáveis independentes

O modelo de regressão lineal múltipla geral é:De novo, as hipóteses clássicas são:

I A relação entre a variável dependente Y e a(s) variáveis(s)independente(s) Xi é lineal;

I E(ε|Xi) = 0;I Var(ε|Xi) = σ2I;I Os erros estão não correlacionados, de tal forma que:

Cov(εi , εj |Xi) = 0 ∀i 6= j ;

I Os regressores são estocásticos e não estão correlaciona-dos com o termo de erro;

I O rango de X é k + 1 < n.

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 13: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

Figure:

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 14: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

O modelo com k variáveis independentes

Cálculo das estimativas OLSA equação estimada OLS é:

yi = β0 + β1x1i + β2x2i + ...+ βkxki

O método de mínimos quadrado ordinários (OLS) calculaestimadores para minimizar a soma dos resíduos ao quadrado.Isto é, dadas n observações de y e as variáveisindependentes, os estimadores β0, β1, ..., βk se calculamsimultaneamente de tal forma que:

n∑i=1

(y1)−

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 15: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

O modelo com k variáveis independentes

Cálculo das estimativas OLSA equação estimada OLS é:

yi = β0 + β1x1i + β2x2i + ...+ βkxki

O método de mínimos quadrado ordinários (OLS) calculaestimadores para minimizar a soma dos resíduos ao quadrado.Isto é, dadas n observações de y e as variáveisindependentes, os estimadores β0, β1, ..., βk se calculamsimultaneamente de tal forma que:

n∑i=1

(y1)− β0 + β1x1i − β2x2i + ...+ βkxki ,

Seja mí[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 16: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

O modelo com k variáveis independentes

Cálculo das estimativas OLSEm forma matricial é

Min(Y− Xβ)′(Y− Xβ)

Do problema de minimização temos:

β = (X’X)−1X’Y = (X’X)−1X’(Xβ + ε) = β + (X’X)−1)X’ε

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 17: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

O modelo com k variáveis independentes

Cálculo das estimativas OLSConsiderando o caso k = 2 variáveis independentes,

yi = β0 + β1x1i + β2x2i :

β1 = (n∑

i=1

r1iyi )/(n∑

i=1

r21i )

onde r1i são os resíduos da regressão de x1 sobre x2 e

β0 = y − β1x1 − β2x2

Chamaremos a β0 o estimador OLS da constante e a β1, β2 osestimadores OLS das pendentes (correspondentes ás variáveisindependentes x1 e x2.

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 18: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

No seguinte exemplo:

ln(wage)i = β0 + β1educi + β2experi + β3tenurei + εi ,

I O número de observações é n = 526I (β2 interpretação): Se o número de anos de experiência

aumenta em um ano, então o salário mudará, em média,(β2 · 100%). A mesma interpretação se aplica ao resto deparâmetros, mas não à pendente.

Os valores e resíduos obtidos por OLS são:

ln( ˆwage)i = β0 + β1educi + β2experi + β3tenurei

eεi = ln(wage)i − ln( ˆwage)i

εi ln(wage)i = β0 + β1educi + β2experi + β3tenurei

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 19: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

Os valores e resíduos obtidos por OLS tem algumaspropriedades importantes que são extensões diretas do casode uma variável:

I A média amostral dos resíduos é zero;I A covariância da amostra entre cada variável

independente e seus resíduos é zero. Portanto, acovariância da amostra entre os valores obtidos por OLS eos resíduos OLS é zero;

I O ponto (ln ¯wage, ¯educ, ¯exper , ¯tenure) sempre está sobrea reta de regressão OLS.

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 20: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

Seja o modelo geral:

yi = β0 + β1x1i + β2x2i + ...+ βk xki + εi

Bondade de ajuste: Igual que na regressão simples, podemos definira soma total de quadrados (SST ), a soma de quadrados explicada(SSE), e a soma de quadrados residual (SSR),como:

SST =n∑

i=1

(yi − y)2,

SSE =n∑

i=1

(yi − y)2 e

SSR =n∑

i=1

εi .

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 21: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

SST = SSE + SSR. (4)

Em outras palavras, a variação total de {yi} é a soma das variaçõestotais de {yi} e de {εi}. Supondo que a variação total de y não ézero, como é o caso a menos que yi seja constante na amostra,podemos dividir (4) por SST e obter:

SSR/SST + SSE/SST = 1.

Igual que no caso de regressão simples, o R2 se define como

R2 = SSE/SST = 1− SSR/SST , (5)

e se interpreta como a proporção da variação amostral de yi que seexplica pelo modelo. Por definição, R2 é um número compreendidoentre zero e um.

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 22: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

Pode-se demostrar também que R22 é igual ao coeficiente de corre-lação ao quadrado entre os yi verdadeiros e os estimados yi .

R2 = ρ2y,y =

(∑n

i=1(yi − y)(yi − y))2

(∑n

i=1(yi − y2)(∑n

i=1(yi − y)2)

R2 =β′X ′Y − ny2

Y ′Y − ny2

Um fato importante sobre R2 é que nunca diminui, e habitualmente au-menta quando outra variável independente é adicionado à regressão.Isto faz com que não seja muito útil para decidir se uma ou mais var-iáveis devem ou não ser incluídas no modelo. O fator que deve decidirse uma variável explicativa deve estar no modelo é o fato de que avariável explicativa tenha um efeito parcial diferente não nulo sobre yna população.

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 23: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

Condicional aos valores das variáveis independentes, a matrizde covariâncias condicional de β é igual a

Var β = σ2(X ′X )−1

O estimador β é eficiente se é de variância mínima dentro daclasse dos estimadores lineares insesgados.

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 24: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

Teorema de GAUS-MARKOVDado um vetor qualquer de constantes w, o estimador linealinsesgado de variância mínima de w’β no modelo de regressãoclássica é w’β , onde β é o estimador de mínimos quadrados.O estimador β é consistente se converge em probabilidade a β,(o qual anotamos (p lim β = β), quer dizer, se

limn−→∞

E(β) = β e,

limn−→∞

VaR(β) = 0

.

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 25: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

Figure: Consistência

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 26: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

Figure: Consistência

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 27: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

Figure: Consistência

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 28: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

Distribuição amostral dos estimadores OLS

I Temos dado um conjunto de hipóteses baixo as quais oestimador OLS é insesgado;

I Temos deduzido a variância dos estimadores OLS, isto éútil para conhecer sua precisão;

I Mas, para fazer inferência estatística, precissamos conhecera distribuição na amostragem dos estimadores;

I A distribuição dos estimadores OLS depende da distribuiçãodo erro ε.

I H7: O erro populacional ε é independente das variáveisexplicativas x1, x2, ..., xk e segue uma distribuição normalcom média zero e variância σ2 : ε ∼ Normal(0, σ2).

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 29: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

I Esta hipótese é mais forte que qualquer uma das hipótesesanteriores, de tal forma que, sob ela

E(εi |x1i , x2i , ..., xki) = E(εi) = 0

eVar(εi |x1i , x2i , ..., xki) = Var(εi) = σ2

I As hipóteses (H1, ...,H7) juntas se chamam as hipótesesclássicas do modelo de regressão linear (CLM). Sob a hipóteseCLM, os estimadores OLS β1, β2, ..., βk , são os estimadoresde mínima variância e insesgados dentre todos os esti-madores, não somente entre os quais estão linear em yi .

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 30: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

I Uma forma abreviada de resumir as hipóteses populacionaisCLM é:

yi |xi ∼ Normal(β0 + β1x1i + ...+ βkxki , σ2),

onde xi = (x1i , x2i , ..., xki).

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 31: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

Teorema (1)

I Com base nos pressupostos CLM, subordinada aos valoresde amostrais das variáveis independentes,

βj ∼ Normal(βj ,Var(βj))

onde

Var(βj) =σ2

SSTj(1− R2j ),

onde SSTj =∑n

i=1(xji − xj)2 e R2

j é o R2 da regressão dexj nas demais variáveis independentes. Então:

βj − βj

σβj

∼ Normal(0,1)

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 32: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

Teste de hipóteses sobre um parâmetro populacional

I Seja o modelo para a população:

yi = β0 + β1x1i + β2x2i + ...+ βkxki + εi

,I que cumpre as hipóteses clássicas.I Lembre-se que βj são características desconhecidas da pop-

ulação, e nunca teremos a certeza de seus verdadeiros val-ores.

I No entanto, podemos fazer uma hipótese sobre o valor deβj e então usar inferência estatística para contrastar a nossahipótese.

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 33: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

I Para construir os testes de hipóteses, precisamos do seguinteresultado:

Teorema (2)Sob as hipóteses CLM:

βj − βj

σβj

∼ tn−k−1,

onde k +1 é o número de parâmetros desconhecidos no modelopopulacional yi = β0 +β1x1i +β2x2i +...+βkxki +εi (k parâmetrosde pendente e a constante β0).

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 34: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

Diferências entre os Teorema (1) e (2)

I O Teorema (1) demonstra que, com base nas hipóteses CLM,βj−βjσβj

∼ Normal(0,1) ; mas agora estimamos o desvio padrão

de erros σ (σ =√

SSR/(n − k − 1)), o que implica que a dis-tribuição é o quociente entre uma N(0,1) e uma χ2

n−k−1 indepen-dentes, quer dizer, uma distribuição t de Student com n − k − 1graus de liberdade.

I O Teorema (2) é importante porque nos permite contrastar hipóte-ses de que os βj . Na maioria das aplicações, o interesse funda-mental está em contrastar a hipótese nula

H0 : βj = 0,

onde j corresponde a qualquer das k variáveis independentes.

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 35: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

Significado da hipótese nula

I βj mede o efeito parcial de xj sobre (o valor esperado de)y , depois de haver controlado todas as outras variáveis in-dependentes, quer dizer, depois de haver levado em conta(x1, x2, .., xk ), xj não tem efeito sobre o valor esperado dey .

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 36: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

Como exemplo, tomemos a equação do salario

ln(wage)i = β0 + β1educi + β2experi + β3tenurei + εi

A hipótese nulaH0 : β1 = 0

Significa que, depois de ter em consideração a antiguidade e exper-iência, o número de anos de educação (educ) não tem efeito sobre osalário por hora. Esta é uma hipótese interessante na economia. Sefor verdade, isso implica que a educação de uma pessoa anterior aopresente emprego não afeta o salário. Si β1 > 0, portanto a educaçãoanterior contribui a produtividade e, portanto, ao salário.

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 37: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

O estatístico de teste se chama quociente t (ou teste t) e vem dadopor:

tβj≡

βj

σβj

.

Necessitamos uma forma mais geral da estatística t para contrastaroutras hipóteses sobre βj .Suas características são:

I O quociente t é simples de calcular dado βj e seu desvio padrão;

I Sendo que σβjsempre é positivo, tβj

tem o mesmo sinal que βj ;

I Para um valor dado de σβj, um valor maior de βj leva a valores

maiores de tβj;

I βj nunca é exatamente zero, seja ou não certa H0.

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 38: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

I A pergunta é: A que distancia está βj de zero? Um βj muito longede zero adiciona evidência contra H0 : βj = 0;

I Os valores de tβjsuficientemente longe de zero darão como re-

sultado a rejeição de H0;

I A regra de rejeição concreta depende da hipótese alternativa edo nível de significância escolhido;

I Obter uma regra para rejeitar com um certo nível de significância(a probabilidade de rejeitar H0 quando é certa) requer o conhec-imento da distribuição amostral de tβj

sob H0.

I Estamos contrastando hipóteses sobre os parâmetros da popu-lação. Não estamos contrastando hipótese sobre as estimativasde uma amostra particular.

H0 : βj = 0 ou H0 : 0.434 = 0

I Estas hipóteses não tem sentido

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 39: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

Testes frente a hipóteses alternativas unilateraisPara obter uma regra de rejeição de H0, temos que especificar ahipótese alternativa que nos interessa. Seja uma alternativa unilat-eral da forma:

H1 : βj > 0

As alternativas a H0 da forma H1 : βj < 0 não se consideram. A regrade rejeição é que H0 se rejeita em favor de H1 ao nível de significânciado 5% se:

tβj> c,

onde c é o percentil 95 de uma distribuição t com n − k − 1 graus deliberdade. Se a hipótese alternativa é H1 : βj < 0 a regra de rejeiçãoé tβj

< −c.

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 40: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

Alternativas bilateraisNas aplicações, é frequente contrastar a hipótese nula H0 : βj = 0frente a uma alternativa bilateral do tipo,

H1 : βj 6= 0.

Sob esta alternativa, xj tem um efeito ceteris paribus sobre y semespecificar se o efeito é positivo ou negativo. Esta é a alternativa ad-equada quando o sinal de βj não está bem determinado pela teoria.Mesmo que o sinal é conhecido sob a alternativa, um contraste bilat-eral é muitas vezes prudente.Quando a alternativa é bilateral, nos interessa o valor absoluto doestatístico t .

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 41: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

Alternativas bilateraisA regra de rejeição para H0 : βj = 0 frente a H1 : βj 6= 0 é:

|tβj| > c,

onde c é um valor crítico adequado. Para encontrar c, de novo es-pecificamos um nível de significância, p. ex. 5%. Para um contrastebilateral, c é escolhido de modo a tornar a área de cada cauda dadistribuição t de 2.5%.Contraste de otras hipótese sobre βj H0 : βj = 0 é a hipótese maiscomum, mas a vezes estaremos interessados em contrastar

H0 : βj = aj

onde aj é nosso valor de hipótese de βj , então a estatística t apropri-ado é

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 42: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

t =βj − aj

σβj

t mede a quantos desvios padrão está βj de aj .Um exemplo:Seja um modelo simples que relacione o número anual de delitos noscampus universitários (crime) com a matricula de estudantes (enroll):

ln crimet = β0 + β1 ln enrollt + εt .

Este é um modelo de elasticidade constante, onde β1 é a elasticidadedos delitos com respeito à matricula.

I A hipótese nula poder?a ser H0 : β1 = 1. Isso significa que umaumento de 1% na matricula leva, em média, a um aumento de1% nos delitos.

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 43: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

O modelo estimado é:

ln crimet = −6.63(1.03)+1.27(0.11) ln enrollt , onde : n = 97,R2 = 0.585

O quociente t é:

t =1.27− 1

0.11= 2.45

Sendo que β1 = 1.27, podemos pensar se ha evidencia para rejeitara hipótese nula frente a alternativa H1 : β > 1 e, sendo que o valorcrítico da t com 95 graus de liberdade é de 1.66 (usando gl iguala 120), então, claramente rejeitamos H0 em favor de h1 ao nível designificância de 5%.

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 44: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

Cálculo dos valores p nos testes da t

I Em lugar de contrastar com distintos níveis de significância, émais informativo calcular o nível de significância mínimo ao qualse teria rejeitado a hipótese nula. Eeste nível é chamado p-valor;

I O p-valor do seguinte teste H0 : βj = 0 frente a H1 : βj 6= 0 éP|T | > t onde T indica uma variável aleatória com distribuiçãot e n − k − 1 graus de liberdade e t indica o valor numérico daestatística de teste;

I O p-valor também é a probabilidade de observar uma estatísticat tão extrema como seria possível se a hipótese nula fosse certa.Isto significa que valores p pequenos trazem pouca evidênciaadicional contra a hipótese nula.

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 45: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

Com gl = 40 e t = 1.85, o p-valor se calcula assim:p-valor= P(|T | > 1.85) = 2P(T > 1.85) = 2(.0359) = .0718,onde P(T > 1.85) é a superfície à direita de 1.85 em uma distribuiçãot com 40 gl.

Figure:

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 46: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

Suponhamos, por exemplo, que contrastamos H0 : βj = 0 frentea H1 : βj > 0. Si βj < 0, o p-valor é maior que 0.50, o qualnunca faria que rejeitássemos H0 em favor de H1. Se βj > 0,então t > 0 e o p-valor é, simplesmente, a probabilidade de queuma variável aleatória t com os graus de liberdade adequadosseja maior que t .

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 47: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

Intervalos de Confiança

Os intervalos de confiança também são chamam de estimações porintervalo, porque eles dão um intervalo de valores prováveis para oparâmetro da população, e não apenas uma estimativa pontual. Ointervalo é

CI = [βj − c · σβj+ c · σβj

].

Se tivessemos muitas amostras aleatórias, e se calcula-se o inter-valo de confiança com cada amostra, então, o parâmetro populacional(que é desconhecido) βj estaria dentro do intervalo de confiança CI no95% das amostras.Para a única amostra que temos na prática, com a qual construímoso CI, não sabemos se βj está de verdade dentro do intervalo. Nossaesperança é que a amostra seja uma das de 95% cujo CI contém aoβj , mas não temos garantia disto.

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 48: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

Precissamos de três valores para construir o CI:

I βj ;

I σβj;

I c.

Um exemplo:Um modelo que explique o preço de um bem em termos de suas car-acterísticas se chama modelo de precificação hedônica. A equação aseguir é um modelo de preços hedônicos para os preços de habitação;as características são:

I A metragem quadrada (sqrft);

I O número de dormitórios (bdrms), e

I O número de banheiros (bthrms).

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 49: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

Muitas vezes os preços (e algumas variáveis explicativas) aparecemem forma de logaritmos. Utilizando n = 19 observações de casas queforam vendidas em Waltham, Massachusetts, em 1990, a equaçãoestimada (com desvios padrão entre parênteses do lado dos coefi-cientes estimados) é:

ln ˆpricei = 7.46[1.15] + 0.634[0.184] ln sqrfti − 0.066[0.059]bdrmsi +

0.158[0.075]bthrmsi .

n = 19; R2 = 0.806

Sendo que price e sqrft aparecem ambas em forma logarítmica, aelasticidade do preço com respeito aos pés quadrados é 0.634, querdizer, mantendo fixos o número de dormitórios e banheiros, um au-mento de 1% em pés quadrados aumenta o preço previsto da habitaçãoem um 0.634%.

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 50: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

Um intervalo de confiança ao 95% para a elasticidade da população(βln sqrft ), dado que c vale 2.131 (o percentil 97.5 da distribuição t com15 gl) é:

[0.634− 2.132 · 0.184; 0.634 + 2.132 · 0.184]

Desde que o zero não esteja neste intervalo de confiança, rejeitamosH0 : βln sqrft = 0 frente a hipótese alternativa bilateral ao nível de sig-nificância de 5%.

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 51: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

Teste de hipótese sobre uma c.I dos parâmetros

Para ilustrar o caso geral, vamos ver um modelo simples para com-parar o desempenho econômico da educação nas escolas univer-sitárias de primeiro ciclo e em faculdades universitárias. A populaçãoé constituída por trabalhadores que concluíram o ensino médio, e omodelo é:

ln wagei = β0 + β1jci + β2univi + β3experi + εi ,

onde jc é o número de anos que frequentou a uma escola de primeirociclo e univ é o número de anos que frequentou uma faculdade.

A hipótese de interesse é se um ano em uma escola universitária valeo mesmo que um ano em uma faculdade: isto se expressa como

H0 : β1 = β2

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 52: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

A alternativa de interesse é unilateral: um ano em uma escola univer-sitária vale menos que um ano em uma faculdade. Isto se expressacomo

H1 : β1 < β2.

Podemos reescrever H0 : β1 − β2 = 0 e H1 : β1 − β2 < 0. Neste casopodemos usar

t =β1 − β2

σβ1−β2

A regra de rejeição é da forma t < −c, onde c é um valor positivo quese toma da distribuição t adequada.

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 53: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

σβ1−β2é igual a:√

(Var(β1) + Var(β2)− 2Cov(β1, β2))

exemplo:

ln wagei = β0 + β1jci + β2univi + β3experi + εi ,

ln ˆwagei = 1.4723[0.021]+0.0667[0.0068]jci +0.0769[0.0023]univi +0.0049[0.00016]experi

n = 6763; R2 = 0.222

t =β1 − β2

σβ1−β2

=

√−0.0102

0.006822 + 0.002322 − 2Cov(β1, β2)

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 54: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

Modelo com restrições

Até agora só temos lidado com hipótese que consistem em uma únicarestrição. Muitas vezes, queremos testar várias hipóteses sobre osparâmetros. Começaremos com um caso destacado, contrastar seum conjunto de variáveis independentes não têm efeito parcial sobreuma variável dependente.modelo sem restrições

ln salaryi = β0+β1yearsi +β2gamsyri +β3bavgi +β4hrunsyri +β5rbisyri +εi ,

onde salary é o salário total em 1993, years é o número de anos naliga, gamesyr é o número médio de partidas jogadas no ano, bavg é amédia de carreiras/bateio (por exemplo, bavg=250), hrunsyr é quad-rangulares (home runs) por ano, e rbisyr são as carreiras batidas porano.

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 55: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

Queremos testar, por exemplo, a hipótese nula de que, uma vez queos anos na liga e os jogos por ano tem sido controlados, as variáveisque medem o rendimento (bavg, hrunsyr, e rbisyr) não influenciam nosalário, ou seja:

H0 : β3 = 0, β4 = 0, β5 = 0

A hipótese nula consta de três restrições de exclusão: Se for verdade,então bavg, hrunsyr , e rbisyr não têm efeito sobre ln salary depois deque os anos e gamesyr são controlados. A hipótese alternativa é:

H1 : H0 não é certa.

H1 é cumprido se pelo menos um dos β3, β4 ou β5 é diferente de zero

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 56: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

Como contrastamos H0 frente a H1?Não podemos utilizar um teste t porque este não pode por restriçõesem mais de um parâmetro. Ademais, o uso do estatístico t diferentepara contrastar uma hipótese múltipla pode induzir a erros. Neces-sitamos um método para contrastar conjuntamente as restrições deexclusão.Seja a seguinte estimativa:

ln ˆsalary i = 11.20[0.289]+0.0689[0.012]yearsi +0.0126[0.0026]gamsyri

+0.00098[0.0011]bavgi +0.0144[0.016]hrunsyri +0.0108[0.0072]rbisyri

n = 353; SSR = 183.186; R2 = 0.6278

onde SSR é a soma dos resíduos ao quadrado.

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 57: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

Esta regressão nos diz:

I years e gamesyr são estatisticamente significativas;

I bavg, hrunsyr , e rbisyr são não estatisticamente significativasfrente a uma hipótese alternativa bilateral ao nível de significân-cia de 5%;

I Portanto, baseando-nos nas três estatísticas t , parece que nãopodemos rejeitar H0,... isto é falso!.

Para ver este, temos que desenvolver um contraste de restrições múlti-plas. Resulta que a soma de resíduos ao quadrado e o R2 nos dãouma base muito cômoda para contrastar hipóteses múltiplas.

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 58: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

Como as estimativas OLS minimizam a soma de residuos ao quadrado,a SSR sempre aumenta quando quitamos variáveis ao modelo. Aquestão é se este aumento é bastante grande, em relação à SSR domodelo que tem todas as variáveis, como para rejeitar a hipótese nula.Impondo a hipotese nula

H0 : β3 = 0, β4 = 0, β5 = 0 obtemos:

modelo restringido

ln salaryi = β0 + β1yearsi + β2gamsyri + εi

e o modelo ajustado é:

ln ˆsalary i = 11.22[0.11]+0.0713[0.0125]yearsi +0.0202[0.0013]gamsyri

n = 353; SSR = 198.311; R2 = 0.5971.

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 59: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

A SSR do modelo restringido é maior que a SSR do modelo semrestrições e o R2 do modelo restringido é menor que o R2 do modelosem restrições. A pergunta é se a SSR que passa do modelo semrestrições ao restringido (de 183.186 a 198.311) é bastante grandecomo para rejeitar a hipótese nula. A resposta depende do nível designificado do contraste. Portanto, necessitamos uma estatística deteste adequada.

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 60: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

Seja o modelo geral:modelo sem restrições

yi = β0 + β1x1i + β2x2i + ...+ βk xki + εi , i = 1, ...,n.

hipótese nulaH0 : β1 = β2 = ... = βq = 0,

onde q < k .modelo restringido

yi = β0 + βq+1x(q+1)i + ...+ βk xki + εi , i = 1, ...,n.

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 61: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

O estatístico F é:F =

(SSRr − SSRnr )/qSSRnr/(n − k − 1)

,

onde SSRr é a soma dos quadrados dos resíduos do modelo re-stringido e SSRnr é a soma de quadrados de resíduos do modelo semrestrições.

I A estatística F sempre é não negativo;

I q=número de restrições;

I O denominador de F é simplesmente o estimador insesgado deσ2 = Var(ε) no modelo sem restrições;

I Pode-se demostrar que, baixo H0 (e supondo que se cumpremas hipóteses CLM), F se distribui como uma variável aleatória Fcom (q,n − k − 1) graus de liberdade.

F ∼ F(q,n−k−1)

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 62: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

Se F é suficientemente grande rejeitamos H0 a favor de H1. Seja c opercentil 95 da distribuição F(q,n−k−1). Este valor critico depende de q(os gl do numerador) e de (n−k−1) (os gl do denominador). Portanto,rejeitamos H0 a favor de H1 ao nível de significância escolhido se

F > c.

Se for rejeitada H0, então dizemos que x1, ..., xq são conjuntamenteestatisticamente significativas ao correspondente nível de significân-cia. Este contraste por se só não nos permite dizer qual(is) das var-iáveis tem um efeito parcial sobre e;Se a hipótese nula não se rejeita, implica que, as variáveis não sãoconjuntamente significativas, que em muitos casos justifica remove-las o modelo.

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 63: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

Agora podemos contrastar se, depois de controlar years e gamesyr ,as variáveis bavg, hrunsyr , e rbisyr não têm efeito algum sobre ossalários dos jogadores. O teste F é

F =(198.311− 183.186)/3

183.186/347≈ 9.55.

Este número supera mais o que o valor cr?tico ao 5% na distribuiçãoF com 3 e 347 graus de liberdade, portanto, rejeitamos a hipótese deque bavg, hrunsyr , e rbisyr não têm efeito sobre o salário

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 64: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

Relação entre os estatísticos F e tQue acontece se aplicamos a estatística F ao caso de testar umaúnica variável independente?

Se pode contrastar H0 : β1 = 0 com um teste F como antes.

Ambos métodos são semelhantes, quer dizer, F = t2 e quando existeapenas uma restrição de exclusão t2

n−k−1 ∼ F1,(n−k−1). Porém, a es-tatística t é mais flexível para contrastar hipótese simples porque sepode usar para contrastar frente a alternativas unilaterais.

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 65: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

Além disso, como

R2r = 1− SSRr

SSTe

R2εr = 1− SSRnr

SST,

podemos escrever o estatístico F em função de R2s como:

F =(R2

nr − R2r )/q

(1− R2nr )/(n − k − 1)

Como R2nr > R2

r , F sempre é positivo

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 66: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

Relação entre os estatísticos F e tEm contrastes com a F , o p-valor se define como:

p − valor = P(F > F ),

onde, F é uma variável aleatória com (q,n−k−1) graus de liberdadee F é o valor concreto da estatística de teste O p-valor é, de novo,

a probabilidade de observar um valor de F que seja, ao menos, tãogrande como o que observamos, supondo que a hipótese nula sejaverdadeira.

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 67: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

O estatístico F para a relevância geral da regressãoA hipótese nula é que as pendentes são zero

H0 : β1 = β2 = ... = βk = 0,

e a alternativa é que ao menos um dos βj é diferente de zero.Há k restrições e o modelo restringido é:

yi = β0 + εi

O R2 que se obtém ao estimar este modelo é zero e, portanto, o es-tatístic F fica:

F =R2/k

(1− R2)/(n − k − 1),

onde R2 é o R2 não restringido.

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro

Page 68: Métodos Quantitativos - Introdução à Análise de Regressãomadmunifacs.files.wordpress.com/2016/05/mc3a9todos-quantitativos-parte_1.pdfSe a comparamos com uma regressão simples

Parte 1 Parte 2 Parte 3 Parte 4 Parte 5 Parte 6

Se não podemos rejeitar a hipótese nula, então não há evidencia deque nenhuma das variáveis independentes ajude a explicar y .

[email protected] UNIFACS – SSA

Prof. Dr. Miguel Rivera-Castro