11
Variáveis Censuradas e Truncadas CE 731 – Econometria II Prof. Alexandre Gori Maia Instituto de Economia - UNICAMP 1 Ementa Modelo Tobit para Variável Dependente Censurada Modelo para Variável Dependente Truncada Bibliografia Wooldridge (2003). Pp. 565-572; 578-584 (Cap. 17.2; 17.4). Pindyck & Rubinfeld (2004). Pp. 374-379 (Cap. 11.3). Gujarati (2006). Pp. 497-500 (Cap. 15.11). Hill; Griffiths & Judge (2003). Pp. 439-440 (Cap. 18.5).

Variáveis Censuradas e Truncadas · relação entre as notas de matemática e a ... do mesmo é de 100 reais. Para podermos estabelecer as ... essa relação, o que não seria possível

  • Upload
    buiminh

  • View
    215

  • Download
    0

Embed Size (px)

Citation preview

Variáveis Censuradas e TruncadasCE 731 – Econometria II

Prof. Alexandre Gori Maia

Instituto de Economia - UNICAMP

1

Ementa

Modelo Tobit para Variável Dependente Censurada

Modelo para Variável Dependente Truncada

Bibliografia

Wooldridge (2003). Pp. 565-572; 578-584 (Cap. 17.2; 17.4).

Pindyck & Rubinfeld (2004). Pp. 374-379 (Cap. 11.3).

Gujarati (2006). Pp. 497-500 (Cap. 15.11).

Hill; Griffiths & Judge (2003). Pp. 439-440 (Cap. 18.5).

No caso da censura, há alguma limitação

imposta à mensuração da variável dependente,

impedindo que observemos valores inferiores

(censura à esquerda) ou superiores (censura à

direita) da variável dependente. As observações

permanecem na amostra.

Y

X

Censura

TruncamentoY

X

No caso do truncamento, há alguma limitação

imposta à mensuração da variável dependente,

impedindo que observemos observações com

valores inferiores (truncamento à esquerda) ou

superiores (truncamento à direita) da variável

dependente. Assim, essas observações não

farão parte da amostra.

Censura e Truncamento• Embora muitas vezes se confundam, censura e truncamento apresentam definições estatísticas distintas:

2

Seja a relação entre as horas que esposas trabalharam fora

de casa em um determinado ano e seus respectivos anos de

estudo. Enquanto que algumas esposas possuem valores

positivos para a jornada anual (Y>0) , outras apresentam

valores nulos por se dedicarem exclusivamente às

atividades do lar.

Nessa situação, podemos supor que há uma censura à

esquerda para a variável dependente jornada, dada a

impossibilidade de se observar valores negativos para a

jornada. Desconsiderar as diferenças entre os dois

conjuntos de esposas (com jornada nula e positiva) levaria a

estimativas viesadas e inconsistentes da relação entre as

variáveis.

Censura à esquerda

Seja a relação entre as avaliações de um exame de aptidão

escolar (escala de 200 a 800) e as notas de matemáticas dos

alunos. O problema é que não necessariamente alunos com

a avaliação máxima (800) ou mínima (200) apresentam o

mesmo grau de aptidão.

Nessa situação fica evidente a censura da variável

dependente, já que não é possível observar valores

superiores a 800 ou inferiores a 200 para esta. Entretanto,

como não há nenhum caso de observações com valores

iguais a 200, a censura à esquerda poderia ser

desconsiderada nesse caso.

Censura à direita e à esquerda

Variável Dependente Censurada

3

4

Seja a relação entre a avaliação de aptidão (200-800) e as notas de matemática de alunos do ensino fundamental americano:

A amostra limita-se a observar avaliações de aptidão

entre 200 (avaliação mínima) e 800 (avaliação

máxima).

eMatemáticaAptidão 10

Aplicando MQO:

eMatemáticaAptidão ˆ68,63,299 *)*(**)*(*

Aplicando ajuste para dados censurados:

eMatemáticaAptidão ˆ14,78,278 ******

Caso desejassemos estimar a relação entre as notas de

matemática e a avaliação de aptidão, devemos

considerar que a censura à variável dependente impede

que a amostra diferencie alunos com avaliação máxima

ou mínima de aptidão.

O modelo Tobit propõe-se a estimar relações com

variáveis dependentes censuradas. Resumidamente,

trata as observações com valores censurados

diferentemente das demais.

Verifique que as estimativas do modelo para dados censurados consideram a possibilidade avaliações

superiores a 800 e uma maior variação marginal da aptidão em função do conhecimento de

matemática, uma aproximação para o real comportamento dos dados caso não houvesse a censura das

avaliações em 800.

As estimativas do modelo Tobit podem ser

consideradas não viesadas, enquanto que as

de MQO seriam viesadas e inconsistentes.

Modelo Tobit - Exemplo

O modelo Tobit, em reconhecimento a seu desenvolvimento pelo economista

prêmio Nobel James Tobin, é um caso especial de ajuste para dados

censurados.

Considere o seguinte ajuste: *

10*

iii eXY

Onde Yi* pode representar, por exemplo, o salário da pessoa ou o gasto com a

compra de um automóvel. Dizemos que Yit* é uma variável latente pois para

pessoas desocupadas ou que não possuem carro ela não pode ser observada e se

iguala a 0. Diante disso, a variável Yit observada é dada por:

00

0

*

**

ii

iii

YparaY

YparaYY

O ajuste de fato observado seria então dado por:

iii eXY 10

A restrição imposta aos dados observados acaba tornando as estimativas de

MQO para a equação (2) viesadas. Para corrigir esse problema, o modelo Tobit

trata distintamente valores censurados da amostra e, aplicando, MV ou MQ2E,

obtém estimativas consistentes (no caso do MQ2E) e não viesadas (no caso da

MV).

(1)

(2)

Modelo Tobit - Definição

5

A censura afeta a estimativa de valores médios e

variabilidade do regressando. As relações

estimadas por MQO serão viesadas e

inconsistentes.

Modelo Tobit - Estimação

6

Y

X

βxiiXYE ]|[

Os coeficientes de um modelo Tobit não são, entretanto,

diretamente comparáveis aos de MQO, já que se

referem a outro regressando: βxiiXYE ]|[ *

A interpretação dos coeficientes de um modelo Tobit passa pela compreensão de

dois estágios de análise: i) cálculo da probabilidade de ocorrência de valores

não censurados; ii) estimativa para do modelo para os valores não censurados.

Considerando, por exemplo, que a censura seja à esquerda no valor zero,

teríamos:

],0|[]|0[]|[ iiii YYEYPYE xxx

]/)[(]|0[ βxx iiYP representação de uma função Probit com

regressores ponderados pelo erro padrão .

Onde:

]/)[(],0|[ βxβxx iiiiYYE

() é é chamada de Razão Inversa de Mills

(IMR), já que pode também ser expressa pela

razão de duas distribuições normais.

Variável Censurada –PROC QLIM

7

• O dataset Aptidao contém informações sobre a avaliação de aptidão do aluno (aptidao), notas médias de matemática (math), notas médias de leitura (read) e se o aluno estudou em escola pública (public);

• A variável dependente aptidao é censura à esquerda no valor de 200 e à direita no valor de 800;

• O modelo TOBIT para variáveis dependentes censuradas é estimado no SAS com o procedimento QLIM, apropriado para variáveis dependentes limitadas;

• Neste procedimento, devemos utilizar o comendo ENDOGENOUS, que especifica a limitação da variável dependente, e a opção CENSORED, que define a censura na variável. Adicionalmente, devemos definir o limite inferior (LB) ou superior (UB) da censura;

O primeiro procedimento estimará os

coeficientes pelo MQO.

O procedimento QLIM ajustará um modelo

TOBIT com censura à esquerda no valor de 200

(LB=200) e à direita no valor de 800 (UB=800)

Uma amostra contém informações de alunos de uma

turma especial, formada apenas por aqueles que

conseguem avaliação de desempenho superior a 40.

Suponha que, a partir dessa amostra, deseje-se estudar a

relação entre as notas de matemática e a avaliação de

desempenho do aluno.

Caso não consideremos que alunos com avaliação de

desempenho inferior a 40 foram excluídos da amostra,

estaremos obtendo estimativas viesadas da real relação

entre as notas de matemática e a avaliação de

desempenho dos alunos.

Truncamento à esquerda

Suponha que desejamos avaliar a influência da

experiência profissional no rendimento de agricultores

familiares em condição de vulnerabilidade. Nossas

análises baseariam-se em uma amostra de beneficiários

de um determinado programa social, cuja renda per capita

máxima para fazer parte do mesmo é de 100 reais.

Para podermos estabelecer as relações para o conjunto da

população de pobres, devemos considerar que nossa

amostra exclui aqueles com renda per capita superior a

100. Ou seja, há um truncamento à direita das

observações. As relações serão viesadas se

desconsiderarmos esse fato.

Truncamento à direita

8

Variável Truncada - Exemplo

9

Seja a relação entre as avaliações de desempenho dos alunos e suas notas de matemática:

A amostra limita-se a alunos com avaliação de

desempenho superior a 40. Em outras palavras, a

variável depedente (avaliação de desempenho)

apresenta truncamento à esquerda.

eMatemáticaAvaliação 10 Aplicando MQO:

eMatemáticaAvaliação ˆ55,58,24 ******

Aplicando ajuste para dados truncados:

eMatemáticaAvaliação ˆ87,74,10 ******

Caso desejássemos estimar a relação entre as notas de

matemática e a avaliação de desempenho para o

conjunto da população, seria fundamental considerar a

exclusão de alunos com avaliação inferior a 40.

O modelo de regressão com dados truncadas obteria

estimativas não viesadas para essa relação, o que não

seria possível utilizando MQO.

Verifique que as estimativas do modelo para dados truncados consideram a possibilidade avaliações

inferiores a 40 e uma maior variação marginal da avaliação em função do conhecimento de

matemática, uma aproximação para o real comportamento dos dados caso não houvesse a exclusão de

observações com valores inferiores a 40.

Variável Truncada - Exemplo

Variável Truncada - Exemplo• O dataset desempenho contém informações sobre a avaliação de desempenho dos alunos (achiv), suas notas de matemática (mathscor), línguas (langscor) e sexo (female);

• Apenas alunos com desempenho superior a 40 fazem parte da amostra;

• O modelo para variáveis truncadas também é estimado no SAS com o procedimento QLIM. Devemos agora utilizar o comendo ENDOGENOUS, com a opção TRUNCATED, que define o truncamento na variável dependente. Adicionalmente, devemos definir o limite inferior (LB) ou superior (UB) do truncamento;

No primeiro procedimento, obteremos as

estimativas de MQO, com relações

viesadas entre notas de matemática e

avaliação de desempenho.

No segundo procedimento, corrigidos o

truncamento da variável dependente com o

ajuste do modelo TOBIT.

Exercício

11

1) O arquivo Dados_CombustivelRenovavel.XLS contém informações sobre o consumo de combustíveis renováveis e PIB de países. Pede-se:

a) Ajuste, por MQO , o consumo de combustível renovável como uma função do PIB;

b) Ajuste agora considerando a censura da variável dependente (países que não consomem combustível renovável) e compare as estimativas com as de MQO;

c) Crie um arquivo auxiliar eliminando os países com consumo inferior a 1000 toneladas para o consumo renovável. Ajuste o modelo para variáveis truncadas e compare as estimativas com as de MQO;