25
Aula 14 Introdução ao Stata 05 de julho de 2013

Aula 14 Introdução ao Stata 05 de julho de 2013. Modelos com dados ordenados A variável dependente pode cair em múltiplas categorias exclusivas mas com

Embed Size (px)

Citation preview

Page 1: Aula 14 Introdução ao Stata 05 de julho de 2013. Modelos com dados ordenados A variável dependente pode cair em múltiplas categorias exclusivas mas com

Aula 14

Introdução ao Stata05 de julho de 2013

Page 2: Aula 14 Introdução ao Stata 05 de julho de 2013. Modelos com dados ordenados A variável dependente pode cair em múltiplas categorias exclusivas mas com

Modelos com dados ordenados

• A variável dependente pode cair em múltiplas categorias exclusivas mas com uma natureza ordenada.

• A distância entre as categorias é desconhecida.

• Exemplos: pesquisas de opinião.• Modelos probit ou logit ordenados.

Page 3: Aula 14 Introdução ao Stata 05 de julho de 2013. Modelos com dados ordenados A variável dependente pode cair em múltiplas categorias exclusivas mas com

• Resultado de yi é uma das m alternativas.

• J = 1.... m alternativas que são ordenadas.• Modelo de variável latente:• Para uma única observação i: • Irei escolher m se:

jyi

Modelos com dados ordenados

Page 4: Aula 14 Introdução ao Stata 05 de julho de 2013. Modelos com dados ordenados A variável dependente pode cair em múltiplas categorias exclusivas mas com

Exemplo

• Você considera que uma mãe trabalhar garante uma relação segura entre mãe e filho?– (SD) discorda totalmente– (D) discorda– (A) Concorda– (SA) Concorda totalmente

• Variável latente: propensão das mães em concordar que mães que trabalham são boas mães.

Page 5: Aula 14 Introdução ao Stata 05 de julho de 2013. Modelos com dados ordenados A variável dependente pode cair em múltiplas categorias exclusivas mas com

Exemplo

Page 6: Aula 14 Introdução ao Stata 05 de julho de 2013. Modelos com dados ordenados A variável dependente pode cair em múltiplas categorias exclusivas mas com

Exemplo

• Probabilidade de y ser igual a m:

Page 7: Aula 14 Introdução ao Stata 05 de julho de 2013. Modelos com dados ordenados A variável dependente pode cair em múltiplas categorias exclusivas mas com

Exemplo: estado de saúde

• Y=1 ruim• Y=2 bom• Y=3 excelente

Page 8: Aula 14 Introdução ao Stata 05 de julho de 2013. Modelos com dados ordenados A variável dependente pode cair em múltiplas categorias exclusivas mas com

Comando ologit

/cut2 .9513097 .2054301 .5486741 1.353945

/cut1 -1.39598 .2061301 -1.799987 -.9919722

ndisease -.0549905 .0040692 -13.51 0.000 -.0629661 -.047015

linc .2836537 .0231098 12.27 0.000 .2383593 .3289481

age -.0292944 .001681 -17.43 0.000 -.0325891 -.0259996

hlthstat Coef. Std. Err. z P>|z| [95% Conf. Interval]

Log likelihood = -4769.8525 Pseudo R2 = 0.0720

Prob > chi2 = 0.0000

LR chi2(3) = 740.39

Ordered logistic regression Number of obs = 5574

Significativos, categorias não podem ser colapsadas.

Page 9: Aula 14 Introdução ao Stata 05 de julho de 2013. Modelos com dados ordenados A variável dependente pode cair em múltiplas categorias exclusivas mas com

Efeito marginal

• Qual efeito de mudar a variável xr sobre a probabilidade de escolher a alternativa j:

ndisease -.0136704 .00101 -13.50 0.000 -.015655 -.011686 11.2053

linc .070515 .00575 12.26 0.000 .05924 .08179 8.69693

age -.0072824 .00042 -17.43 0.000 -.008101 -.006463 25.5761

variable dy/dx Std. Err. z P>|z| [ 95% C.I. ] X

= .53747616

y = Pr(hlthstat==3) (predict, outcome(3))

Marginal effects after ologit

Page 10: Aula 14 Introdução ao Stata 05 de julho de 2013. Modelos com dados ordenados A variável dependente pode cair em múltiplas categorias exclusivas mas com

ndisease -.0121792 .0008643 -14.09 0.000 -.0138732 -.0104852

linc .0628232 .0049561 12.68 0.000 .0531094 .072537

age -.0064881 .0003379 -19.20 0.000 -.0071503 -.0058258

excellent

ndisease .0078561 .0005773 13.61 0.000 .0067246 .0089875

linc -.0405234 .0032951 -12.30 0.000 -.0469816 -.0340651

age .0041851 .0002214 18.90 0.000 .0037511 .004619

good

ndisease .0043232 .0003376 12.81 0.000 .0036615 .0049848

linc -.0222998 .0018975 -11.75 0.000 -.0260188 -.0185808

age .002303 .0001506 15.29 0.000 .0020078 .0025982

poor_or_fair

variable Coef. Std. Err. z P>|z| [95% Conf. Interval]

y = Pr(hlthstat)

Average partial effects after ologit

. margeff , predict

Page 11: Aula 14 Introdução ao Stata 05 de julho de 2013. Modelos com dados ordenados A variável dependente pode cair em múltiplas categorias exclusivas mas com

Modelo de regressão censurada

• A variável y é censurada, somente observamos seus valores acima ou abaixo de um determinado limite.

• Gastos iguais a zero, o dado é censurado à esquerda abaixo de um determinado limite L.

Page 12: Aula 14 Introdução ao Stata 05 de julho de 2013. Modelos com dados ordenados A variável dependente pode cair em múltiplas categorias exclusivas mas com

ExemplosSoluções de canto

1. Quantidade de dinheiro doado para caridade: muitas pessoas não fazem este tipo de doação. Uma parcela expressiva dos dados será igual a zero.

2. Horas trabalhadas pelas mulheres: muitas mulheres não trabalham. Uma fração significativa tem horas de trabalho igual a zero.

Modelo Tobit é usado para modelar estas situações

12

Page 13: Aula 14 Introdução ao Stata 05 de julho de 2013. Modelos com dados ordenados A variável dependente pode cair em múltiplas categorias exclusivas mas com

Exemplo: oferta de trabalho feminina

• Suponha que queremos estimar o efeito da educação x nas horas trabalhadas de mulheres casadas y.

• O modelo tobit é escrito a partir de uma variável latente y*, que é parcialmente observada pelo pesquisador:

y*=β0+β1x+u e u~N(0,σ2) 13

Page 14: Aula 14 Introdução ao Stata 05 de julho de 2013. Modelos com dados ordenados A variável dependente pode cair em múltiplas categorias exclusivas mas com

Exemplo: oferta de trabalho feminina

• Se y* é positiva, y* é igual ao total de horas trabalhadas : y.

• Se y* é negativo, as horas trabalhadas, y, se igualam a zero.

• Por hipótese, u é normalmente distribuído.

14

Page 15: Aula 14 Introdução ao Stata 05 de julho de 2013. Modelos com dados ordenados A variável dependente pode cair em múltiplas categorias exclusivas mas com

Exemplo: oferta de trabalho feminina

O modelo pode ser escrito como: yi*=β0+β1xi+ui …………………..(1)

tal que yi=yi* if yi*>0

yi=0 if yi*≤0

e ui~N(0,σ2)

15

Horas trabalhadas

O subscrito i denota a i-ésima observação. A equação (1) satisfaz as hipóteses do modelo linear clássico.

Page 16: Aula 14 Introdução ao Stata 05 de julho de 2013. Modelos com dados ordenados A variável dependente pode cair em múltiplas categorias exclusivas mas com

16

y*, y

Educ

Quando y* é negativo, horas trabalhadas são iguais a zero.

Ilustração gráfica

Page 17: Aula 14 Introdução ao Stata 05 de julho de 2013. Modelos com dados ordenados A variável dependente pode cair em múltiplas categorias exclusivas mas com

Exemplo: oferta de trabalho feminina

• A variável, y*, pode ser negativa, mas se negativa, horas trabalhadas são iguais a zero.

• O modelo Tobit considera o fato de que muitas mulheres não trabalham, logo, horas trabalhadas são iguais a zero para muitas.

17

Page 18: Aula 14 Introdução ao Stata 05 de julho de 2013. Modelos com dados ordenados A variável dependente pode cair em múltiplas categorias exclusivas mas com

Modelo Tobit

• Censura à esquerda

• Censura à direita

Page 19: Aula 14 Introdução ao Stata 05 de julho de 2013. Modelos com dados ordenados A variável dependente pode cair em múltiplas categorias exclusivas mas com

19

MQO e Tobit

• As estimativas dos coeficientes Tobit tem o mesmo sinal dos estimados por MQO.

• As estimativas Tobit são maiores que MQO contudo isto não é o efeito marginal direto pois dependerá do valor de x.

• Temos que considerar as estimativas dos efeitos marginais.

• Com relação à significância, os resultados são bem parecidos.

Page 20: Aula 14 Introdução ao Stata 05 de julho de 2013. Modelos com dados ordenados A variável dependente pode cair em múltiplas categorias exclusivas mas com

Efeitos parciais(efeitos marginais)

• Os parâmetros estimados βj medem o efeito de xj em y*.

• Contudo, na solução de canto, estamos interessados no efeito de xj sobre y.

• Devemos estimar o efeito sobre o valor esperado de y.

20

Page 21: Aula 14 Introdução ao Stata 05 de julho de 2013. Modelos com dados ordenados A variável dependente pode cair em múltiplas categorias exclusivas mas com

Efeitos parciais(efeitos marginais)

• A esperança de y dado x é dada por:

E(y|x)=P(y>0)E(y|y>0,x) +P(y=0)E(0|y=0,x) =P(y>0)E(y|y>0,x) …………..(1)

21

zero

Page 22: Aula 14 Introdução ao Stata 05 de julho de 2013. Modelos com dados ordenados A variável dependente pode cair em múltiplas categorias exclusivas mas com

Efeito marginal

• Logo, existem duas formas de computar o efeito parcial de x sobre a esperança condicional de y:

22

O efeito de x sobre as horas de trabalho daqueles que estão trabalhando.

O efeito total de x nas horas trabalhadas.

)()|(

.2

)()(1),0|(

.1

101

1010101

x

x

xyE

xxx

x

xyyE

Page 23: Aula 14 Introdução ao Stata 05 de julho de 2013. Modelos com dados ordenados A variável dependente pode cair em múltiplas categorias exclusivas mas com

Efeito marginal

• Ambos efeitos parciais dependem de x. Logo, eles diferem para as observações diferentes dos dados.

• Contudo, precisamos saber o efeito total ao invés do efeito específico para uma observação do dado.

• Da mesma forma que nos modelos Probit e logit models, existem duas formas de computar o efeito parcial total:

23

Page 24: Aula 14 Introdução ao Stata 05 de julho de 2013. Modelos com dados ordenados A variável dependente pode cair em múltiplas categorias exclusivas mas com

Efeito marginal total

• Efeito parcial na média: coloca a média das variáveis explicativas (PEA).

• Média do efeito parcial (APE): computa o efeito parcial para cada indivíduo no banco de dados e depois tira a média destes efeitos individuais.

24

Page 25: Aula 14 Introdução ao Stata 05 de julho de 2013. Modelos com dados ordenados A variável dependente pode cair em múltiplas categorias exclusivas mas com