Upload
buiminh
View
215
Download
0
Embed Size (px)
Citation preview
Variáveis Censuradas e TruncadasCE 731 – Econometria II
Prof. Alexandre Gori Maia
Instituto de Economia - UNICAMP
1
Ementa
Modelo Tobit para Variável Dependente Censurada
Modelo para Variável Dependente Truncada
Bibliografia
Wooldridge (2003). Pp. 565-572; 578-584 (Cap. 17.2; 17.4).
Pindyck & Rubinfeld (2004). Pp. 374-379 (Cap. 11.3).
Gujarati (2006). Pp. 497-500 (Cap. 15.11).
Hill; Griffiths & Judge (2003). Pp. 439-440 (Cap. 18.5).
No caso da censura, há alguma limitação
imposta à mensuração da variável dependente,
impedindo que observemos valores inferiores
(censura à esquerda) ou superiores (censura à
direita) da variável dependente. As observações
permanecem na amostra.
Y
X
Censura
TruncamentoY
X
No caso do truncamento, há alguma limitação
imposta à mensuração da variável dependente,
impedindo que observemos observações com
valores inferiores (truncamento à esquerda) ou
superiores (truncamento à direita) da variável
dependente. Assim, essas observações não
farão parte da amostra.
Censura e Truncamento• Embora muitas vezes se confundam, censura e truncamento apresentam definições estatísticas distintas:
2
Seja a relação entre as horas que esposas trabalharam fora
de casa em um determinado ano e seus respectivos anos de
estudo. Enquanto que algumas esposas possuem valores
positivos para a jornada anual (Y>0) , outras apresentam
valores nulos por se dedicarem exclusivamente às
atividades do lar.
Nessa situação, podemos supor que há uma censura à
esquerda para a variável dependente jornada, dada a
impossibilidade de se observar valores negativos para a
jornada. Desconsiderar as diferenças entre os dois
conjuntos de esposas (com jornada nula e positiva) levaria a
estimativas viesadas e inconsistentes da relação entre as
variáveis.
Censura à esquerda
Seja a relação entre as avaliações de um exame de aptidão
escolar (escala de 200 a 800) e as notas de matemáticas dos
alunos. O problema é que não necessariamente alunos com
a avaliação máxima (800) ou mínima (200) apresentam o
mesmo grau de aptidão.
Nessa situação fica evidente a censura da variável
dependente, já que não é possível observar valores
superiores a 800 ou inferiores a 200 para esta. Entretanto,
como não há nenhum caso de observações com valores
iguais a 200, a censura à esquerda poderia ser
desconsiderada nesse caso.
Censura à direita e à esquerda
Variável Dependente Censurada
3
4
Seja a relação entre a avaliação de aptidão (200-800) e as notas de matemática de alunos do ensino fundamental americano:
A amostra limita-se a observar avaliações de aptidão
entre 200 (avaliação mínima) e 800 (avaliação
máxima).
eMatemáticaAptidão 10
Aplicando MQO:
eMatemáticaAptidão ˆ68,63,299 *)*(**)*(*
Aplicando ajuste para dados censurados:
eMatemáticaAptidão ˆ14,78,278 ******
Caso desejassemos estimar a relação entre as notas de
matemática e a avaliação de aptidão, devemos
considerar que a censura à variável dependente impede
que a amostra diferencie alunos com avaliação máxima
ou mínima de aptidão.
O modelo Tobit propõe-se a estimar relações com
variáveis dependentes censuradas. Resumidamente,
trata as observações com valores censurados
diferentemente das demais.
Verifique que as estimativas do modelo para dados censurados consideram a possibilidade avaliações
superiores a 800 e uma maior variação marginal da aptidão em função do conhecimento de
matemática, uma aproximação para o real comportamento dos dados caso não houvesse a censura das
avaliações em 800.
As estimativas do modelo Tobit podem ser
consideradas não viesadas, enquanto que as
de MQO seriam viesadas e inconsistentes.
Modelo Tobit - Exemplo
O modelo Tobit, em reconhecimento a seu desenvolvimento pelo economista
prêmio Nobel James Tobin, é um caso especial de ajuste para dados
censurados.
Considere o seguinte ajuste: *
10*
iii eXY
Onde Yi* pode representar, por exemplo, o salário da pessoa ou o gasto com a
compra de um automóvel. Dizemos que Yit* é uma variável latente pois para
pessoas desocupadas ou que não possuem carro ela não pode ser observada e se
iguala a 0. Diante disso, a variável Yit observada é dada por:
00
0
*
**
ii
iii
YparaY
YparaYY
O ajuste de fato observado seria então dado por:
iii eXY 10
A restrição imposta aos dados observados acaba tornando as estimativas de
MQO para a equação (2) viesadas. Para corrigir esse problema, o modelo Tobit
trata distintamente valores censurados da amostra e, aplicando, MV ou MQ2E,
obtém estimativas consistentes (no caso do MQ2E) e não viesadas (no caso da
MV).
(1)
(2)
Modelo Tobit - Definição
5
A censura afeta a estimativa de valores médios e
variabilidade do regressando. As relações
estimadas por MQO serão viesadas e
inconsistentes.
Modelo Tobit - Estimação
6
Y
X
βxiiXYE ]|[
Os coeficientes de um modelo Tobit não são, entretanto,
diretamente comparáveis aos de MQO, já que se
referem a outro regressando: βxiiXYE ]|[ *
A interpretação dos coeficientes de um modelo Tobit passa pela compreensão de
dois estágios de análise: i) cálculo da probabilidade de ocorrência de valores
não censurados; ii) estimativa para do modelo para os valores não censurados.
Considerando, por exemplo, que a censura seja à esquerda no valor zero,
teríamos:
],0|[]|0[]|[ iiii YYEYPYE xxx
]/)[(]|0[ βxx iiYP representação de uma função Probit com
regressores ponderados pelo erro padrão .
Onde:
]/)[(],0|[ βxβxx iiiiYYE
() é é chamada de Razão Inversa de Mills
(IMR), já que pode também ser expressa pela
razão de duas distribuições normais.
Variável Censurada –PROC QLIM
7
• O dataset Aptidao contém informações sobre a avaliação de aptidão do aluno (aptidao), notas médias de matemática (math), notas médias de leitura (read) e se o aluno estudou em escola pública (public);
• A variável dependente aptidao é censura à esquerda no valor de 200 e à direita no valor de 800;
• O modelo TOBIT para variáveis dependentes censuradas é estimado no SAS com o procedimento QLIM, apropriado para variáveis dependentes limitadas;
• Neste procedimento, devemos utilizar o comendo ENDOGENOUS, que especifica a limitação da variável dependente, e a opção CENSORED, que define a censura na variável. Adicionalmente, devemos definir o limite inferior (LB) ou superior (UB) da censura;
O primeiro procedimento estimará os
coeficientes pelo MQO.
O procedimento QLIM ajustará um modelo
TOBIT com censura à esquerda no valor de 200
(LB=200) e à direita no valor de 800 (UB=800)
Uma amostra contém informações de alunos de uma
turma especial, formada apenas por aqueles que
conseguem avaliação de desempenho superior a 40.
Suponha que, a partir dessa amostra, deseje-se estudar a
relação entre as notas de matemática e a avaliação de
desempenho do aluno.
Caso não consideremos que alunos com avaliação de
desempenho inferior a 40 foram excluídos da amostra,
estaremos obtendo estimativas viesadas da real relação
entre as notas de matemática e a avaliação de
desempenho dos alunos.
Truncamento à esquerda
Suponha que desejamos avaliar a influência da
experiência profissional no rendimento de agricultores
familiares em condição de vulnerabilidade. Nossas
análises baseariam-se em uma amostra de beneficiários
de um determinado programa social, cuja renda per capita
máxima para fazer parte do mesmo é de 100 reais.
Para podermos estabelecer as relações para o conjunto da
população de pobres, devemos considerar que nossa
amostra exclui aqueles com renda per capita superior a
100. Ou seja, há um truncamento à direita das
observações. As relações serão viesadas se
desconsiderarmos esse fato.
Truncamento à direita
8
Variável Truncada - Exemplo
9
Seja a relação entre as avaliações de desempenho dos alunos e suas notas de matemática:
A amostra limita-se a alunos com avaliação de
desempenho superior a 40. Em outras palavras, a
variável depedente (avaliação de desempenho)
apresenta truncamento à esquerda.
eMatemáticaAvaliação 10 Aplicando MQO:
eMatemáticaAvaliação ˆ55,58,24 ******
Aplicando ajuste para dados truncados:
eMatemáticaAvaliação ˆ87,74,10 ******
Caso desejássemos estimar a relação entre as notas de
matemática e a avaliação de desempenho para o
conjunto da população, seria fundamental considerar a
exclusão de alunos com avaliação inferior a 40.
O modelo de regressão com dados truncadas obteria
estimativas não viesadas para essa relação, o que não
seria possível utilizando MQO.
Verifique que as estimativas do modelo para dados truncados consideram a possibilidade avaliações
inferiores a 40 e uma maior variação marginal da avaliação em função do conhecimento de
matemática, uma aproximação para o real comportamento dos dados caso não houvesse a exclusão de
observações com valores inferiores a 40.
Variável Truncada - Exemplo
Variável Truncada - Exemplo• O dataset desempenho contém informações sobre a avaliação de desempenho dos alunos (achiv), suas notas de matemática (mathscor), línguas (langscor) e sexo (female);
• Apenas alunos com desempenho superior a 40 fazem parte da amostra;
• O modelo para variáveis truncadas também é estimado no SAS com o procedimento QLIM. Devemos agora utilizar o comendo ENDOGENOUS, com a opção TRUNCATED, que define o truncamento na variável dependente. Adicionalmente, devemos definir o limite inferior (LB) ou superior (UB) do truncamento;
No primeiro procedimento, obteremos as
estimativas de MQO, com relações
viesadas entre notas de matemática e
avaliação de desempenho.
No segundo procedimento, corrigidos o
truncamento da variável dependente com o
ajuste do modelo TOBIT.
Exercício
11
1) O arquivo Dados_CombustivelRenovavel.XLS contém informações sobre o consumo de combustíveis renováveis e PIB de países. Pede-se:
a) Ajuste, por MQO , o consumo de combustível renovável como uma função do PIB;
b) Ajuste agora considerando a censura da variável dependente (países que não consomem combustível renovável) e compare as estimativas com as de MQO;
c) Crie um arquivo auxiliar eliminando os países com consumo inferior a 1000 toneladas para o consumo renovável. Ajuste o modelo para variáveis truncadas e compare as estimativas com as de MQO;