46
ECONOMETRIA Prof. Patricia Maria Bortolon, D. Sc.

Econometria)Modelos Escolha Qualitativa

Embed Size (px)

DESCRIPTION

modelos

Citation preview

  • ECONOMETRIA

    Prof. Patricia Maria Bortolon, D. Sc.

  • Modelos de Escolha Qualitativa

    Fonte: GUJARATI; D. N. Econometria Bsica: 4 Edio.

    Rio de Janeiro. Elsevier- Campus, 2006

  • Modelos de escolha qualitativa

    Varivel dependente: binria

    Varivel independente: mtricas ou binrias

    Exemplos:

    Probabilidade de falncia

    Probabilidade de sinistro

    Probabilidade de aderir a segmento diferenciado de governana corporativa

    Probabilidade de abrir capital

  • Modelos de escolha qualitativa

    Quando Y quantitativo, atravs dos modelos de regresso linear estimamos o valor esperado ou

    valor mdio, dados os valores das variveis

    independentes

    Quando Y qualitativo, o objetivo encontrar a probabilidade de que algo acontea

    Modelos de Probabilidade

    ),...,,( 21 kiiii XXXYE

  • O que vamos estudar:

    Como estimar modelos de escolha qualitativa? Podemos usar MQO?

    H problemas especiais de inferncia?

    Como medir a qualidade do ajustamento? Podemos usar o R2?

    Como interpretar os coeficientes do modelo?

  • O que no vamos estudar...

    ... mas so extenses do assunto:

    Dados contveis ou eventos raros como varivel dependente = processos de probabilidade de Poisson. ex.: no. de artigos

    publicados por um docente, no. de patentes registradas por uma

    empresa, etc...

    Modelos logit e probit ordinais. Ex.: quando a varivel dependente nvel de escolaridade, ou variveis em termos de escala do tipo

    Likert (concordo totalmente a discordo totalmente)

    Modelos logit e probit multinomiais: quando a varivel de resposta tem mais de duas categorias mas no so ordenadas ou

    hierarquizadas.

    Modelos de durao: ex.: o que determina a durao de uma lmpada; a sobrevivncia de micro-empresas. Esses casos so

    tratados em Anlise de Sobrevivncia.

  • Modelos de Escolha Qualitativa

    H trs abordagens para formular um modelo probabilstico para uma varivel de escolha

    binria:

    O modelo de probabilidade linear

    O modelo logit

    O modelo probit

  • Modelo de Probabilidade Linear

    iii uXY 21

    1 = tem casa prpria

    0 = c. c.

    Renda familiar

    um modelo linear de probabilidade porque:

    iiii XYXYE |1Pr

  • Modelo de Probabilidade Linear

    Supondo E(ui)=0, para obter estimadores no tendenciosos. A varincia de Yi tem a seguinte distribuio

    de probabilidade:

    Yi Prob.

    0 1 Pi

    1 Pi

    Total 1

    Se Pi = probabilidade de que Yi = 1

    Dist. de Probabilidade Binomial

    (np ; np(1-p))

    1)|(0 ii XYE

    Podemos usar MQO?

  • Modelo de probabilidade linear

    Problemas na utilizao de MQO

    1. Ausncia de normalidade dos termos de erro ui. Porque

    assim como Yi, ui tambm assumem dois valores:

    Yi ui Prob.

    Qdo. Yi = 1 1 1 2Xi Pi

    Qdo. Yi = 0 1 2Xi 1 - Pi

    iii XYu 21

    Tambm segue distribuio binomial

    => ui no se distribuem normalmente

  • Modelo de probabilidade linear

    Problemas na utilizao de MQO

    Entretanto, lembre que a medida que o tamanho da amostra aumenta a distribuio binomial

    converge para a Normal.

    Portanto, no caso de grandes amostras, a inferncia estatstica dos modelos de

    probabilidade linear segue os procedimentos

    habituais de MQO sob premissa de normalidade.

  • Modelo de probabilidade linear

    Problemas na utilizao de MQO

    2. Varincias heterocedsticas dos termos de erro.

    Como ui segue distribuio binomial com mdia Pi e varincia igual a Pi(1-Pi), vemos que a varincia depende da mdia

    A varincia de ui depende, em ltima instncia, dos valores de X e, portanto, no homocedstica.

    Estimadores de MQO no tendenciosos, porm no so eficientes.

    Soluo: mnimos quadrados ponderados (MQP)

    iiii

    iii

    XXYEP

    PPu

    21)|(

    )1()var(

    iiii

    i

    i

    i

    i

    ii

    i

    PXXw

    w

    u

    w

    X

    ww

    Y

    1P )|E(Y1)|E(Y onde iii

    21

  • Modelo de probabilidade linear

    Problemas na utilizao de MQO

    3. Impossibilildade de satisfazer 0 E(Yi | Xi) 1

    Problema real da estimativa por MQO!!!

    No h como garantir que se situe entre 0 e 1.

    Duas formas de agir:

    Calcular os e os que forem < 0 considerar = 0 e os que forem > 1 considerar = 1

    Usar tcnica que garanta que as probabilidades condicionais de Yi se situem entre 0 e 1 (logit e

    probit)

    iY

    iY

  • Modelo de probabilidade linear

    Problemas na utilizao de MQO

    4. O valor de R2 como medida da qualidade do

    ajustamento questionvel

    X

    Yest.

    1

    R2 estar muito abaixo de 1

    (em geral entre 0,2 e 0,6)

    Do ponto de vista lgico o Modelo de Probabilidade Linear pressupe que

    Pi = E(Y = 1| X) aumenta linearmente com X, isto , o efeito marginal ou

    incremental de X permanece constante.

  • Modelo de probabilidade linear

    Problemas na utilizao de MQO

    No exemplo da amostra de 40 famlias e os dados de renda e casa prpria (Gujarati, Cap. 15) temos:

    Quando X aumenta uma unidade (US$ 1.000) a prob. de ter casa prpria aumenta sempre na mesma quantia de

    0,10.

    Independe da renda ser US$8.000, US$10.000 ou US$22.000

    O que seria esperado?

    Que a nveis muito baixos ou muito altos a probabilidade de ter casa prpria no fosse to afetada.

    ii XY 1021,09457,0

  • Modelo de probabilidade linear

    Problemas na utilizao de MQO

    Precisamos de um modelo de probabilidade que tenha duas caractersticas:

    1. A medida que Xi aumenta Pi = E(Yi = 1| Xi) aumenta

    mas nunca sai da faixa 0 1

    2. A relao entre Pi e Xi no linear, se aproxima de

    zero a taxas cada vez menores medida que Xi se

    reduz, e se aproxima de 1 a taxas cada vez menores

    medida que Xi aumenta muito.

  • Modelo de probabilidade linear

    Problemas na utilizao de MQO

    Precisamos de uma curva sigmide, ou em S, semelhante a FDA de uma v.a.:

    Em geral so escolhidos os modelos (1) logstico e (2) normal, o primeiro dando origem ao modelo

    logit e o sengundo ao probit (ou normit).

    X0

    1 FDA

  • Modelo Logit

    O modelo de probabilidade linear no caso da casa prpria era:

    A Funo de Distribuio Logstica

    iiii XXYEP 21)|1(

    )( 211

    1)|1(

    iXiii eXYEP

  • Modelo Logit

    Resumindo e chamando Zi = 1 + 2Xi teremos:

    Problema: Pi no linear em X e em => no podemos usar MQO

    Soluo: linearizar

    10

    11

    1

    1 quando

    01

    1 quando

    11

    1

    i

    ii

    ii

    Z

    Z

    Zi

    P

    e

    PZ

    ePZ

    e

    e

    eP

  • Modelo Logit

    i

    i

    i

    i

    Z

    Z

    Z

    Z

    i

    i e

    e

    e

    e

    P

    P

    1

    11

    1iZi

    Z

    Z

    i

    eP

    e

    eP

    1

    11

    111

    A razo de chances a favor da

    posse da casa prpria.

    Pi = 0,8 => h 4 chances contra 1

    a favor de a famlia possuir casa

    prpria.

    i

    i

    ii

    i

    i

    ii

    XP

    PL

    ZP

    PL

    211

    ln

    1ln

    Tirando o logaritmo:

    Denominado Logit

  • Modelo Logit - Caractersticas

    1. Quando passa de 0 a 1 (isto , quando Z varia de - a +), o logit L varia de - a +. As probabilidades so limitadas entre 0 e 1, os logits no.

    2. Embora L seja linear em X as probabilidades no o so.

    3. Podemos incluir quantos regressores forem necessrios.

    4. O coeficiente angular mede a variao de L em resposta

    a uma unidade de variao em X, isto , nos diz o

    quanto o logaritmo das chances favorveis ao evento de

    interesse variam em resposta a uma unidade de variao

    na varivel independente.

    5. O intercepto d as chances favorveis quando a varivel

    independente igual a zero. Como na regresso linear

    pode no ter sentido prtico.

  • Modelo Logit - Caractersticas

    6. Se quisermos no as chances favorveis ao

    evento de interesse mas a prpria probabilidade

    do evento isso pode ser feito pela expresso:

    7. A relao linear no entre Pi e Xi, e sim entre o

    logaritmo da razo de chances e Xi.

    Z

    Z

    Zi e

    e

    eP

    11

    1

  • Modelo Logit - Estimao

    1. Dados em nvel individual

    A estimativa por MQO invivel

    Imagine Pi = 1 se a famlia tem casa prpria

    Pi = 0 c.c.

    Ao calcular os logits para estimar o modelo

    Ao invs de MQO usar Mxima Verossimilhana para estimar os parmetros

    ii

    i

    ii uX

    P

    PL

    21

    1ln

    c.c. 1

    0ln

    prpria casa temfamlia a se 0

    1ln

    i

    i

    L

    L

    Expresses no

    fazem sentido

  • Modelo Logit Dados Agrupados - Estimao

    1. Dados agrupados ou replicados

    Com os Pi possvel obter os logits estimados

    Podemos usar MQO?

    No!!

    X

    US$ mil

    Ni ni

    6 40 8

    8 50 12

    10 60 18

    ... ... ...

    relativa frequncia a

    i

    ii

    N

    nP

  • Modelo Logit Dados Agrupados - Estimao

    possvel demonstrar que, se Ni for suficientemente grande e cada observao em

    uma dada classe de renda Xi se distribui

    independentemente como uma varivel binomial,

    ento:

    Usar MQP

    Estimativa da varincia:

    )1(

    1,0~

    iii

    iPPN

    Nu

    )1(

    1 2

    iii PPN

  • Modelo Logit Dados Agrupados - Estimao

    Etapas para estimao da regresso logit:

    1. Para cada nvel de renda:

    2. Para cada nvel de renda obter o logit:

    i

    i

    N

    nP

    i

    ii

    P

    PL

    1

    ln

  • Modelo Logit Dados Agrupados - Estimao

    Etapas para estimao da regresso logit:

    3. Transformamos:

    ado transformerro de termo

    ado transform

    ado transform

    )1(

    :onde

    em

    1ln

    *

    *

    *

    21

    *

    21

    21

    i

    ii

    ii

    iiii

    iiii

    iiiiiii

    ii

    i

    ii

    v

    XX

    LL

    PPNw

    vXwL

    uwXwwLw

    uXP

    PL

  • Modelo Logit Dados Agrupados - Estimao

    Etapas para estimao da regresso logit:

    4. Estimamos por MQO sem intercepto.

    5. Avaliar coeficiente pelos mtodos tradicionais de

    intervalo de confiana ou teste de hipteses.

    Lembrando que as concluses sero vlidas se as

    amostras forem grandes.

    Exemplo da casa prpria com dados agrupados na pag.

    485 do Gujarati.

  • Modelo Logit Dados Agrupados - Interpretao

    Interpretao do logit: para uma unidade (US$1000) de aumento na renda o logaritmo ponderado das chances favorveis posse da casa

    prpria aumenta em 0,08 unidade.

    Interpretao das chances: tomando o antilogaritmo do logit estimado, obtemos Pi / (1 Pi), isto , a razo de chances.

    9642,0

    )56675,14()43619,14(

    )00539,0()11046,0(

    07862,059474,1

    2

    **

    R

    t

    ep

    XwL iii

    *

    *

    07862,059474,1

    07862,059474,1

    1

    ii

    ii

    Xw

    Xw

    i

    i

    ee

    eP

    P

  • Modelo Logit Dados Agrupados - Interpretao

    e0,07862 = 1,0817

    Para cada unidade de aumento da renda ponderada, as chances ponderadas favorveis a posse da casa prpria aumentam em cerca

    de 8,17%.

    *

    *

    07862,059474,1

    07862,059474,1

    1

    ii

    ii

    Xw

    Xw

    i

    i

    ee

    eP

    P

    Se tomarmos o anti-logaritmo do j-simo coeficiente angular, subtramos 1 dele

    e multiplicamos o resultado por 100, obtemos a variao percentual das chances

    em favor de um aumento de uma unidade no j-simo regressor.

  • Modelo Logit Dados Agrupados - Interpretao

    Clculo das probabilidades: no nosso exemplo, se quisermos calcular a probabilidade de ter casa prpria

    se a renda X = 20 (US$20.000).

    02226,0

    09311,0

    6506,8307862,01825,459474,1

    6506,83

    1825,4

    07862,059474,1

    *

    *

    *

    *

    **

    i

    ii

    i

    i

    i

    i

    iii

    w

    LL

    L

    L

    X

    w

    XwL

  • Modelo Logit Dados Agrupados - Interpretao

    Clculo das probabilidades: no nosso exemplo, se quisermos calcular a probabilidade de ter casa prpria

    se a renda X = 20 (US$20.000).

    4944,01

    0225,11

    Portanto,

    1

    ln02226,0

    02226,0

    02226,0

    02226,0

    02226,0

    *

    e

    eP

    eP

    P

    P

    P

    w

    LL

    i

    i

    i

    i

    i

    i

    ii

    Dada a renda de US$20.000, a

    probabilidade de que a famlia tenha

    uma casa prpria de cerca de 49%.

  • Modelo Logit Dados Agrupados - Interpretao

    Clculo da variao da probabilidade: envolve no apenas 2, mas tambm o nvel de probabilidade em relao ao qual a variao medida.

    Para o nvel de renda de US$20.000 teremos dP/dX = 0,01965

    )1(2 iii

    PPdX

    dP

  • Modelo Logit Dados No Agrupados

    Como Yi = 1 ou 0, nestes casos, teremos que recorrer a procedimentos de estimao no lineares usando o mtodo da mxima verossimilhana.

    um mtodo para grandes amostras, e os erros-padro estimados so assintticos

    Ao invs da estatstica t usamos a estatstica z.

    O R2 no adequado como medida de ajustamento. O Eviews apresenta o R2 de McFadden que tambm

    varia entre 0 e 1.

    Outra medida de ajustamento o Count R2.

  • Modelo Logit Dados No Agrupados

    Fvero et. al. apresentam outras medidas de ajustamento:

    Pseudo R2

    Cox & Snell R2

    Nagelkerke R2

    Teste qui-quadrado: para avaliar se h diferenas significativas entre o esperado e o observado

    Hosmer Lemeshow Goodness of fit Test: outra medida do poder preditivo do modelo

  • Modelo Logit Dados No Agrupados

    Para testar a significncia do modelo como um todo o equivalente ao teste F da regresso

    mltipla a estatstica da razo de

    verossimilhana. Esta estatstica segue a

    distribuio qui-quadrado com g.l. igual ao no. de

    variveis explanatrias (o intercepto no conta).

  • Modelo Logit Dados No Agrupados -Interpretao

    Gujarati usa um exemplo sobre previso de notas de alunos, com Y =1 se a nota A e Y = 0 c.c.

    GPA = pontuao mdia; TUCE = pontuao no incio do curso; PSI = 1 se utilizado novo mtodo de ensino.

    O modelo e os resultados foram:

    40419,15)3(3740,0

    0255,05014,00252,00082,0

    3786,20951,08261,20213,13

    1

    2

    4321

    dfcLRstatistiMcFaddenR

    valuesp

    PSITUCEGPAL

    uPSITUCEGPAP

    PL

    iiii

    iiii

    i

    ii

  • Modelo Logit Dados No Agrupados -Interpretao

    Os regressores em conjunto tem impacto positivo sobre a nota final pois LR = 15,40 cujo valor p de cerca de 0,0015, muito pequeno.

    As trs variveis tm efeito positivo sobre o logit embora TUCE seja no significativo.

    O coeficiente 2,8261 de GPA signfica que para cada aumento de 1 na nota mdia o logit estimado aumenta, em mdia cerca de 2,83 un.

    A interpretao em relao s chances faz-se tomando o antilogaritmo dos coeficientes. Ex.: o antilog. de PSI 10,7897 (e2,3786). Estudantes submetidos ao novo mtodo de ensino tm cerca de dez vezes mais chances de tirar uma nota A.

    40419,15)3(3740,0

    0255,05014,00252,00082,0

    3786,20951,08261,20213,13

    1

    2

    4321

    dfcLRstatistiMcFaddenR

    valuesp

    PSITUCEGPAL

    uPSITUCEGPAP

    PL

    iiii

    iiii

    i

    ii

  • Modelo Logit Dados No Agrupados -Interpretao

    Para obter a probabilidade de um estudante ter nota A, observa-se os dados deste estudante (GPA, TUCE e PSI) e calcula-se Li, ou seja, o

    logit estimado. Ex.: logit estimado igual a 0,8178

    Para obter a probabilidade usa-se a expresso:

    40419,15)3(3740,0

    0255,05014,00252,00082,0

    3786,20951,08261,20213,13

    1

    2

    4321

    dfcLRstatistiMcFaddenR

    valuesp

    PSITUCEGPAL

    uPSITUCEGPAP

    PL

    iiii

    iiii

    i

    ii

    6937,01

    1

    11

    1

    8178,0

    eP

    e

    e

    eP

    i

    Z

    Z

    Zi

    A probabilidade estimada do estudante tirar

    nota A aproximadamente 69%.

    Como o observado foi Y = 1 para este estudante

    podemos assumir que a previso est prxima.

  • Modelo Probit

    Utiliza ao invs da funo logstica acumulada a funo de distribuio acumulada (FDA) da

    normal.

    Para o exemplo da casa prpria:

    0 2

    2

    2

    )(

    22

    1)(

    XX

    eXF

    )()()|1( 2121 iiii XFXZPXYPP

  • Modelo Probit Dados Agrupados -Interpretao

    Resultados do modelo probit para o exemplo da casa prpria: 1 = -1,0166 e 2 = 0,04846

    Para conhecer o efeito de uma variao unitria em X sobre a probabilidade de Y = 1, isto , ter casa prpria

    derivamos a equao anterior e:

    Onde a funo de densidade de probabilidade normal padro em

    Portanto, essa avaliao depender do valor de X

    221 )( ii

    i XfdX

    dP

    )( 21 iXf

    iX21

  • Modelo Probit Dados Agrupados -Interpretao

    Resultados do modelo probit para o exemplo da casa prpria: 1 = -1,0166 e 2 = 0,04846

    Para X = 6 teremos na funo de densidade normal f[-1,0166+0,04846(6)] = f(-0,72548).

    Para Z = -0,72548 a densidade normal de cerca de 0,3066, que multiplicado por 2 , dar 0,01485.

    Ou seja, partindo de um nvel de renda de US$6.000, quando a renda aumenta US$1.000 a probabilidade de

    uma famlia ter casa prpria aumenta em 1,4%.

  • Efeito marginal de uma variao unitria de um

    regressor nos vrios modelos de regressoModelo de Regresso

    Linear

    O coeficiente angular mede a variao do valor

    mdio do regressando para uma variao unitria no

    valor de um regressor, mantidas constantes as

    demais variveis.

    Modelo de Probabilidade

    Linear

    O coeficiente angular mede diretamente a variao

    da probabilidade de ocorrncia de um evento em

    consequncia de uma variao unitria no valor de

    um regressor, tudo o mais constante.

    Modelo Logit O coeficiente angular nos d a variao no logaritmo

    das chances dada uma variao unitria de um

    regressor. Entretanto, a taxa de variao na

    probabilidade de ocorrncia do evento dada por

    jPi(1-Pi), onde j o coeficiente do j-simo regressor e a avaliao de Pi leva em conta todas as variveis

    do modelo.

    Modelo Probit A taxa de variao da probabilidade mais

    complicada. Dada por jf(Zi), onde f(Zi) a funo de densidade da normal padro e Zi = 1+2X2i+...+kXki, ou seja, o modelo de regresso usado na anlise.

  • Entre os modelos logit e probit, qual o

    prefervel?

    Na maioria das aplicaes so bastante parecidos

    A distribuio logstica tem caudas mais gordas => a prob. condicional Pi aproxima-se de 0 ou 1

    mais lentamente

    Logit mais simples para interpretar!!

    Os coeficientes dos dois modelos no podem ser comparados diretamente. Embora a distribuio

    logstica padro e a normal padro tenham ambas

    mdia zero, suas varincias so diferentes.

  • Modelo Tobit

    No exemplo da casa prpria, se estivssemos interessados no na probabilidade da famlia ter casa prpria, mas sim na relao entre o montante gasto para adquiri-la em relao a variveis scio-econmicas.

    Dilema: se a famlia no tem casa prpria no h dados sobre o montante gasto!!

    Amostra censurada: quando em parte da amostra s temos informaes sobre os regressores, mas no sobre o regressando.

    Tambm denominados modelos de regresso com varivel dependente limitada

  • Modelo Tobit - Estimao

    Podemos estimar a regresso usando apenas a parte da amostra para a qual temos dados da

    varivel dependente?

    No! Os estimadores seriam tendenciosos e inconsistentes.

    Soluo: mtodo da mxima verossimilhana

    Exemplo: pag. 498 Gujarati modelo dos casos extraconjugais de Ray Fair

    c. c. 0

    0 LD se 21

    iii uXY