13
Regressªo Linear Mœltipla: informaıes qualitativas e variÆveis binÆrias, dicotmicas ou "dummy" Aula 20 Prof. MoisØs A. Resende Filho Introduªo Econometria (ECO 132497) 26 de maio de 2014 MoisØs Resende Filho (ECO/UnB) (Wooldridge, cap. 7) 26/05/2014 1 / 13

capitulo07 - econometria 1

Embed Size (px)

DESCRIPTION

curso econometria 1 professor moises resende filho. para graduacao em economia

Citation preview

Page 1: capitulo07 - econometria 1

Regressão Linear Múltipla: informações qualitativas evariáveis binárias, dicotômicas ou "dummy"

Aula 20

Prof. Moisés A. Resende Filho

Introdução à Econometria (ECO 132497)

26 de maio de 2014

Moisés Resende Filho (ECO/UnB) (Wooldridge, cap. 7) 26/05/2014 1 / 13

Page 2: capitulo07 - econometria 1

Descrevendo informações qualitativas

• No trabalho empírico, há a possibilidade de se incorporar fatoresqualitativos aos modelos de regressão.• Fatores qualitativos, frequentemente, aparecem na forma deinformação binária que pode ser capturada com o uso de variáveis"categóricas ou qualitativas"binárias.• Alguns exemplos de fatores qualitativos que aparecem na forma deinformação binária: casado = {sim ou não}; gênero = {masculino oufeminino); possui computador = {sim ou não}; religião = {católico ou nãocatólico}; adota tecnologia ou plano econômico = {sim ou não}; raça ={branco ou não branco}; transporte utilizado = {individual ou coletivo};curso superior = {sim ou não}.• Em econometria, as variáveis binárias ou dicotômicas são tambémchamadas de variáveis "dummy".

Moisés Resende Filho (ECO/UnB) (Wooldridge, cap. 7) 26/05/2014 2 / 13

Page 3: capitulo07 - econometria 1

Uma única variável dummy independente

• Considere o modelo de determinação do salário-hora:

salarioh = β0 + δ0feminino + β1educ + u (1)

em que a variável binária feminino assume o valor um se o indivíduo é dosexo feminino e zero, caso contrário.• Assumindo RLM.4 (média condicional zero) ouE (u|feminino, educ) = 0, temos que:E (salarioh|feminino=1, educ)− E (salarioh|feminino = 0, educ) = δ0, ousimplesmente, queE (salarioh|feminino, educ)− E (salarioh|masculino, educ) = δ0.• Portanto, δ0 mede a diferença no salário-hora esperado demulheres e homens de iguais níveis de escolaridade.• Haverá discriminação contra mulheres se δ0 < 0 e, contra homens, seδ0 > 0.

Moisés Resende Filho (ECO/UnB) (Wooldridge, cap. 7) 26/05/2014 3 / 13

Page 4: capitulo07 - econometria 1

Uma única variável dummy

• Considerado β0 > 0, β1 > 0 e discriminação contra as mulheres, ouseja, δ0 < 0:

• Este é um exemplo de uso de uma variável "dummy"de intercepto.Moisés Resende Filho (ECO/UnB) (Wooldridge, cap. 7) 26/05/2014 4 / 13

Page 5: capitulo07 - econometria 1

Uma única variável dummy

• Por que não incluir duas variáveis binárias, uma para homens e outrapara mulheres, por exemplo, especificando o modelo:

salarioh = β0 + δ0feminino + δ1masculino + β1educ + u (2)

em que a variável binária masculino assume o valor um se o indivíduo é dosexo masculino e zero, caso contrário?• Considere uma base de dados, por exemplo, para n = 4:

Obs. salarioh feminino masculino feminino+masculino educ1 0, 5 1 0 1 52 2 0 1 1 23 30 1 0 1 54 10 1 0 1 20

• Como feminino +masculino = 1 e o modelo possui intercepto, então, ahipótese RLM.3 (colinearidade imperfeita) será violada, o queimpossibilita a estimação do modelo por MQO.Moisés Resende Filho (ECO/UnB) (Wooldridge, cap. 7) 26/05/2014 5 / 13

Page 6: capitulo07 - econometria 1

Uma única variável dummy

• Perceba que introduzir a variável masculino é redundante se a variávelfeminino já foi inserida no modelo, pois as duas variáveis dão a mesmainformação: o sexo do indivíduo;• Em geral, para se evitar a armadilha da variável dummy, o número devariáveis dummy a incluir no modelo deve ser igual ao número decategorias menos um.• No modelo

salarioh = β0 + δ0feminino + β1educ + u (3)

a categoria ou grupo base é "homem", pois quando feminino = 0, estáse caracterizando um indivíduo do sexo masculino.

Moisés Resende Filho (ECO/UnB) (Wooldridge, cap. 7) 26/05/2014 6 / 13

Page 7: capitulo07 - econometria 1

Uma única variável dummy

• E se o modelo fosse especificado com "mulher"como categoria base.tal que:

salarioh = α0 + γ0masculino + β1educ + u (4)

a categoria ou grupo base é "mulher", pois quando masculino = 0,está se caracterizando um indivíduo do sexo feminino.• Substituindo feminino = (1−masculino) em (3), temos

salarioh = β0 + δ0(1−masculino) + β1educ + u

= (β0 + δ0)− δ0masculino + β1educ + u

Com isso:

Na especificação do modelo em (4), α0 ≡ (β0 + δ0); γ0 ≡ −δ0;Na especificação do modelo em (3), β0 ≡ (α0 + γ0); δ0 ≡ −γ0;

Moisés Resende Filho (ECO/UnB) (Wooldridge, cap. 7) 26/05/2014 7 / 13

Page 8: capitulo07 - econometria 1

Uma única variável dummy

• Alternativamente, pode-se especificar o modelo sem intercepto

salarioh = θ0masculino + θ1feminino + β1educ + u (5)

em que θ0 é o intercepto para a categoria "homem"e θ1, o intercepto paraa cagetoria "mulher".

Desvantagens da especificação (5):

R2 não é uma boa medida de ajuste para modelos sem intercepto;Testar se há discriminação contra mulheres requer testar a hipóteseH0 : θ0 − θ1 = 0 contra H0 : θ0 − θ1 > 0, o que exige obterep (θ0 − θ1), o que é mais trabalhoso.

• As interpretações dos coeficientes das variáveis dummy não mudam semais variáveis explicativas são inseridas no modelo, por exemplo:

salarioh = β0 + δ0feminino + β1educ + β2exper + β3perm+ u

Moisés Resende Filho (ECO/UnB) (Wooldridge, cap. 7) 26/05/2014 8 / 13

Page 9: capitulo07 - econometria 1

Quando a variável dependente é log(y)

log(preço) = −1.35(0.65)

+ 0.168(0.038)

log(tamterr) + 0.707(0.093)

log(arquad) (6)

+0.027(0.029)

qtdorm+ 0.054(0.045)

colonial

n = 88,R2 = 0.649

em que colonial recebe o valor um se a casa for de estilo colonial e zero,caso contrário.• Como não faz sentido falar de variação infinitesimal para uma variávelbinária, deve-se calcular a estimativa exata do efeito de colonial sobre opreço da casa:

%∆preço = 100 ∗ [exp (0, 054 ∗ ∆colonial)− 1]= 100 ∗ [exp (0, 054 ∗ 1)− 1] = 5, 5485%

• Contudo, neste exemplo, note que a aproximação (0, 054 ∗ 100 = 5, 4%)não traria muito problema!Moisés Resende Filho (ECO/UnB) (Wooldridge, cap. 7) 26/05/2014 9 / 13

Page 10: capitulo07 - econometria 1

No Stata: digite na janela de comandos

*Instala o pacote o ado "bcuse"ssc install bcuse

*Carrega a base de dados a ser utilizada (WAGE1.RAW)bcuse wage1, clear

*Deleta séries desnecessáriasdrop nonwhite married numdep smsa northcen south west construc ndurman trcommpu

trade services profserv profocc clerocc servocc lwage expersq tenursq

*Traduz os nomes da variáveis para o portuguêsrename wage salarioh

rename female feminino

rename tenure perm

*Estima salarioh = β0 + δ0feminino + ureg salarioh feminino

*Estima salarioh = β0 + δ0feminino + β1educ + β2exper + β3perm+ ureg salarioh feminino educ exper perm

test ( educ exper perm)

Moisés Resende Filho (ECO/UnB) (Wooldridge, cap. 7) 26/05/2014 10 / 13

Page 11: capitulo07 - econometria 1

Resultados e interpretação

       _cons   ­1.567939   .7245511    ­2.16   0.031    ­2.991339    ­.144538        perm    .1410051   .0211617     6.66   0.000     .0994323    .1825778       exper    .0253959   .0115694     2.20   0.029     .0026674    .0481243        educ    .5715048   .0493373    11.58   0.000     .4745802    .6684293    feminino   ­1.810852   .2648252    ­6.84   0.000    ­2.331109   ­1.290596

    salarioh       Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]

   Total  7160.41429   525  13.6388844 Root MSE      =  2.9576           Adj R­squared =  0.3587

Residual  4557.30771   521   8.7472317 R­squared     =  0.3635   Model  2603.10658     4  650.776644 Prob > F      =  0.0000

           F(  4,   521) =   74.40Source        SS       df       MS              Number of obs =     526

            Prob > F =    0.0000       F(  3,   521) =   67.64

( 3)  perm = 0( 2)  exper = 0( 1) educ = 0

.     test ( educ exper perm)

Moisés Resende Filho (ECO/UnB) (Wooldridge, cap. 7) 26/05/2014 11 / 13

Page 12: capitulo07 - econometria 1

Resultados e interpretação

salarioh = −1, 57(0,72)

− 1, 81(0,26)

feminino + 0, 57(0,049)

educ +

+0, 025(0,012)

exper + 0, 141(0,021)

perm

• Cada coeficiente é estatisticamente individualmente significante a 5%.• A estimativa do coeficiente de feminino diz que a diferença média entreo salário-hora de mulheres e homens é −1, 81.• Em média, o salário-hora de mulheres com escolaridade, experiênciaprofissional e tempo de permanência no atual emprego iguais aos doshomens é $1, 81 dólares menor.• Rejeita-se H0 : β1 = β2 = β3 = 0 pelo teste F, com p-valor = 0,0000.

Moisés Resende Filho (ECO/UnB) (Wooldridge, cap. 7) 26/05/2014 12 / 13

Page 13: capitulo07 - econometria 1

Resultados e interpretação

• Pelo modelosalarioh = 7, 10

(0,21)− 2, 51(0,30)

feminino

Como não se está controlando para fatores outros além de gênero, essemodelo não serve para testar discriminação quanto ao gênero nomercado de trabalho;A média do salário-hora dos homens na amostra é $7, 10;A média do salário-hora das mulheres na amostra é(7, 10− 2, 51) = $4, 59;A diferença entre o salário estimado de mulheres e homens na amostraé −$2, 51, ou seja, nessa amostra mulheres ganham menos quehomens.Mas isso não pode ser tomando como evidência empírica a favorda hipótese de discriminação contra mulheres no mercado detrabalho.

Moisés Resende Filho (ECO/UnB) (Wooldridge, cap. 7) 26/05/2014 13 / 13