Clase12-Heterocedasticidad

Embed Size (px)

Citation preview

  • 8/18/2019 Clase12-Heterocedasticidad

    1/33

    Heterocedasticidad

    Econometŕıa IClase 12

    Javiera Vásquez

    Centro de Microdatos

    Departamento de Economı́a

    Universidad de Chile

    [email protected]

    Octubre, 2010

    Javiera Vásquez Centro de Microdatos

    Clase 12

  • 8/18/2019 Clase12-Heterocedasticidad

    2/33

    Heterocedasticidad

    Contenidos

    1   HeterocedasticidadContrastes de Heterocedasticidad:Ejemplo: Estimación del Ahorro

    Javiera Vásquez Centro de Microdatos

    Clase 12

  • 8/18/2019 Clase12-Heterocedasticidad

    3/33

    Heterocedasticidad

    Heterocedasticidad

    La Heterocedasticidad surge cuando a pesar de que Cov(u i u  j )=0para i= j, las varianzas de cada observación son diferentes, esdecir,  Var (u  j ) = σ

    2 j  para j=1,...,n. La matriz de covarianzas en

    este caso es:

    E [uu ] = σ2Ω =

    σ21   · · ·   0...

      . . .  ...

    0   · · ·  σ2

    n

     = σ2

    ω1   · · ·   0...

      . . .  ...

    0   · · ·  ω

    n

    Javiera Vásquez Centro de Microdatos

    Clase 12

  • 8/18/2019 Clase12-Heterocedasticidad

    4/33

    Heterocedasticidad

    Heterocedasticidad

            0

            1        0        0        0

            0        0        0

            2        0        0        0        0        0        0

            3

            0        0        0        0        0        0

            4        0        0        0        0        0        0

          s      a        l      a      r        i      o

    8   10   12   14 16   18

    xx

    x xx x

    x xx

    x

    Figura 2: Distribución de los salarios para distintos niveles de educación.

    Recta de regesiónpoblacional (RRP)

    Escolaridad

    Javiera Vásquez Centro de Microdatos

    Clase 12

  • 8/18/2019 Clase12-Heterocedasticidad

    5/33

    Heterocedasticidad

    Heterocedasticidad

    La heterocedasticidad es un problema bastante recurrente,especialmente al trabajar con datos de corte transversal. Algunasrazones por las que  u i  puede variar son las siguientes:

    En los modelos de aprendizaje sobre errores, a medida que lagente aprende, sus errores de comportamiento son menores,aśı en este caso a medida que aumentan las horas de prácticade una cierta actividad, la varianza de los errores se reduce.

    A medida que aumentan los ingresos, la gente tiene más

    posibilidades de disponer de parte de ese ingreso de la formaque desee. Aśı en una regresión de ahorro contra ingreso, esposible que  σ2i   aumente en la medida que el ingreso aumenta.

    Javiera Vásquez Centro de Microdatos

    Clase 12

    H d i id d

  • 8/18/2019 Clase12-Heterocedasticidad

    6/33

    Heterocedasticidad

    Heterocedasticidad

    La Heterocedasticidad también puede surgir por la presenciade factores at́ıpicos, que es muy diferente a las restantesobservaciones.

    Al omitir variables relevantes, a parte del sesgo que seproduce en las estimaciones por esto, se produceHeterocedasticidad ya que este variable estará en el términode error y por lo tanto la varianza dependerá de ella.

    Otra fuente de Heterocedasticidad es la asimetŕıa en ladistribución de una o más variables explicativas incluidas en elmodelo, por ejemplo: ingreso, riqueza y educación.

    Javiera Vásquez Centro de Microdatos

    Clase 12

    H t d ti id d

  • 8/18/2019 Clase12-Heterocedasticidad

    7/33

    Heterocedasticidad

    Heterocedasticidad

    Como mencionamos anteriormente en presencia deHeterocedasticidad el estimador MCO seguirá siendo insesgado,pero no tendrá varianza ḿınima. El estimador que si cumple con lapropiedad de MELI es el de MCG. Este último estimador requiere

    conocimiento de la matriz Ω. Sin embargo, White (1980) hapropuesto una aproximación a la matriz de covarianzas delestimador MCO:

    Var (β̂ |X ) = (X X )−1(X σ2ΩX )(X X )−1

    que no requiere una representación especifica de la forma funcionalque adopta la heterocedasticidad, por lo que no tendremos riesgode asumir una forma funcional incorrecta.

    Javiera Vásquez Centro de Microdatos

    Clase 12

    Heterocedasticidad

  • 8/18/2019 Clase12-Heterocedasticidad

    8/33

    Heterocedasticidad

    Heterocedasticidad

    La sugerencia de White es que la varianza del estimador  ˆβ MCO   seexprese de la siguiente forma:

    Var (β̂ |X ) = n(X X )−1

    1

    nσ2X ΩX 

    (X X )−1

    se define:Σ =   n−1σ2X ΩX 

    =   n−1n

    i =1

    σ2i  x i x 

    la que se estima de la siguiente forma:

    Σ̂ = n−1n

    i =1

    û i 2x i x 

    Javiera Vásquez Centro de Microdatos

    Clase 12

    Heterocedasticidad

  • 8/18/2019 Clase12-Heterocedasticidad

    9/33

    Heterocedasticidad

    Heterocedasticidad

    White demuestra bajo condiciones generales que:

    Σ̂ = n−1n

    i =1û i 

    2x i x 

    p → Σ

    De esta forma, una estimación consistente de la matriz decovarianzas es:

    Var (β̂ |X ) = n(X X )−1Σ̂(X X )−1 (1)

    su comparación con  σ2(X X )−1 puede dar noción del grado deheterocedasticidad.

    Javiera Vásquez Centro de Microdatos

    Clase 12

    Heterocedasticidad

  • 8/18/2019 Clase12-Heterocedasticidad

    10/33

    Heterocedasticidad

    Heterocedasticidad

    La estimación de White de una matriz consistente conHeterocedasticidad es un resultado muy útil, ya que no se

    necesita saber la naturaleza de la Heterocedasticidad.Ante la duda de presencia de este problema es mejor ocupareste estimador ya que no produce alteraciones, y nos permitehacer inferencia correcta con o sin la presencia de

    Heterocedasticidad.

    Javiera Vásquez Centro de Microdatos

    Clase 12

    Heterocedasticidad

  • 8/18/2019 Clase12-Heterocedasticidad

    11/33

    Heterocedasticidad

    Contrastes de Heterocedasticidad

    1   El contraste de White:  La hipótesis nula es deHomocedasticidad. Esto es,  H 0:  σ

    2i   = σ

    2 ∀ i, bajo la hipótesis

    nula el estimador de la matriz de covarianzas de  β̂  es

    Var (β̂ |X ) =

     σ2(X X )−1, pero bajo la hipótesis alternativa es

    (1). Basado en la observación de esto, White propone un testque puede obtenerse al calcular nR2 de una regresión de û 2i contra todos los productos posibles entre las variablesexplicativas. Demuestra que nR 2 ∼ χ2J −1, donde J es elnúmero de regresores de esta ecuación.

    Consideremos el siguiente modelo:

    y i  = β 0 + β 1x i  + β 2z i  + u i 

    Javiera Vásquez Centro de Microdatos

    Clase 12

    Heterocedasticidad

  • 8/18/2019 Clase12-Heterocedasticidad

    12/33

    ete ocedast c dad

    Contrastes de Heterocedasticidad

    Los pasos para realizar el test de White son:

    1   Obtener  β̂  y los residuos de la estimación del modelo anteriorpor MCO  {û i }

    ni =1

    2   Correr una regresión de û 2i    sobre una constante,  x i ,  z i ,  x 

    2i   ,  z 

    2i 

    y  x i z i .

    3   Computar nR2 de la regresión anterior

    4   Para el nivel de significancia escogido, comparar nR2 con elvalor cŕıtico de una distribución chi cuadrado con 5 grados delibertad. Si nR2 excede el valor cŕıtico se rechaza la hipótesisnula de Homocedasticidad.

    Javiera Vásquez Centro de Microdatos

    Clase 12

    Heterocedasticidad

  • 8/18/2019 Clase12-Heterocedasticidad

    13/33

    Contrastes de Heterocedasticidad

    2   El contraste de Goldfeld y Quandt:  este contraste parte delsupuesto de que la magnitud de  σ2i    depende de cierta variablez i , la que generalmente es una variable explicativa pero no esnecesario. S

    Supongamos que dicha relación es positiva, es decir, paravalores más altos de  z i  mayor es  σ

    2i  .

    Las observaciones se dividen en dos grupos, bajo la hipótesis

    nula ambos grupos tienen la misma varianza, pero bajo laalternativa las varianzas difieren significativamente. Entoncesel contraste consiste en:

    Javiera Vásquez Centro de Microdatos

    Clase 12

    Heterocedasticidad

  • 8/18/2019 Clase12-Heterocedasticidad

    14/33

    Contrastes de Heterocedasticidad

    1   Ordenar las observaciones por los valores de la variable  z i , demenor a mayor.

    2   Omitir p observaciones en la mitad de la muestra, se sugiereno eliminar más de la tercera parte de las observaciones.

    3   Estimar dos veces el modelo original, una con las  n−p 

    2primeras observaciones muestrales y otra con las   n−p 

    2  últimas

    observaciones en la muestra. Notar que p debe ser losuficientemente peque–o de manera que   n−p 

    2  sea mayor al

    número de parámetros  k .

    4   Se calcula es estad́ıstico:

    û 2û 2

    û 1û 1∼ F m,m   con m =

      n − p 

    2  − k 

    Javiera Vásquez Centro de Microdatos

    Clase 12

    Heterocedasticidad

  • 8/18/2019 Clase12-Heterocedasticidad

    15/33

    Contrastes de Heterocedasticidad

    Si se sospecha que la varianza del error depende inversamentede  z i , entonces las observaciones se deben ordenar de mayor amenor.

    Si se llega a la conclusión de que el término de error delmodelo no presenta heterocedasticidad, podŕıa deberse a quehemos comenzado con una mala especificación del parámetroσ2i  , que quizás depende de un variable diferente a la quehemos supuesto.

    Por esta razón el contraste debeŕıa realizarse varias veces condistintas variables de las que tengamos sospechas puedadepender la varianza del término de error.

    Javiera Vásquez Centro de Microdatos

    Clase 12

    Heterocedasticidad

  • 8/18/2019 Clase12-Heterocedasticidad

    16/33

    Contrastes de Heterocedasticidad

    1   El contraste de Breusch y Pagan: supongamos que lavarianza del término de error de cada observación depende deun vector de variables  z i   de dimensión p, es decir:

    σ2i   = h(z 

    i α) = h(α0 + α1z 1i  + α2z 2i  + ... + αp z pi )

    Notemos que si todos los coeficientes  α’s excepto elcorrespondiente a  α0  fuesen cero, tendŕıamos una situación de

    Homocedasticidad.

    Javiera Vásquez Centro de Microdatos

    Clase 12

    Heterocedasticidad

  • 8/18/2019 Clase12-Heterocedasticidad

    17/33

    Contrastes de Heterocedasticidad

    Por lo tanto, si pudiéramos estimar los coeficientes  α0,  α1,...,αp  uncontraste para la hipótesis nula de Homocedasticidad es:

    H 0 :   α1 = α2 = ... =  αp  = 0

    Los pasos para realizar este contraste son:

    Javiera Vásquez Centro de Microdatos

    Clase 12

    Heterocedasticidad

  • 8/18/2019 Clase12-Heterocedasticidad

    18/33

    Contrastes de Heterocedasticidad

    1   Se estima por MCO el modelo original y se obtienen losresiduos correspondientes.

    2   Se obtiene la serie de residuos normalizados al cuadrado:

    ê 2i    =  û 2i 

    σ̂2u 

    i  = 1, ..., n donde    σ̂2u  = ni =1 û 

    2i 

    n

    3  Se estima una regresión de ê 2i    sobre una constante y lasvariables  z 1i ,  z 2i ,...,z pi  y se obtiene la suma explicada (SE) dedicha regresión.1

    4   Bajo la hipótesis nula de Homocedasticidad y dado elsupuesto de normalidad del término de error, la razón   SE 

    2  se

    distribuye χ2p .1Recordemos que la suma explicada de una regresión es igual ani =1(ŷ i  − y )

    2, cuando   y i  es la variable dependiente.

    Javiera Vásquez Centro de Microdatos

    Clase 12

    Heterocedasticidad

  • 8/18/2019 Clase12-Heterocedasticidad

    19/33

    Ejemplo

    Se estima la función de ahorro utilizando datos de 100 familias:

    sav i  = β 0 + β 1 · inc i  + +u i 

    donde  sav  es el ahorro familiar, y   inc  es el ingreso familiar.

    Javiera Vásquez Centro de MicrodatosClase 12

    Heterocedasticidad

  • 8/18/2019 Clase12-Heterocedasticidad

    20/33

    Ejemplo

    Javiera Vásquez Centro de MicrodatosClase 12

    Heterocedasticidad

  • 8/18/2019 Clase12-Heterocedasticidad

    21/33

    Ejemplo

       −      1      0      0      0      0

          0

          1      0      0      0      0

          2      0      0      0      0

          3      0      0      0      0

          A      h     o     r     r     o

    0 10000 20000 30000Ingreso

    Javiera Vásquez Centro de MicrodatosClase 12

    Heterocedasticidad

  • 8/18/2019 Clase12-Heterocedasticidad

    22/33

    Ejemplo

       −      1      0      0      0      0

          0

          1      0      0      0      0

          2      0      0      0      0

          3      0      0

          0      0

          R     e     s      i      d     u     a      l     s

    0 10000 20000 30000

    inc

    Javiera Vásquez Centro de MicrodatosClase 12

    Heterocedasticidad

  • 8/18/2019 Clase12-Heterocedasticidad

    23/33

    Ejemplo

    La estimación nos muestra que cada peso adicional de ingresose traduce en 0.15 pesos de ahorro, es decir, la propensiónmarginal a ahorrar es 0.15, el parámetro es estad́ısticamentesignificativo al 5 %.

    Los gráficos nos muestran la presencia de un problema deheterocedasticidad en este modelo, los errores dependen decomo se comporta el ingreso.

    La siguiente tabla muestra que las desviaciones estándar

    robustas son mayores que las OLS simple, indicando tambiénla presencia de heterocedasticidad.

    Javiera Vásquez Centro de MicrodatosClase 12

    Heterocedasticidad

  • 8/18/2019 Clase12-Heterocedasticidad

    24/33

    Ejemplo

    Javiera Vásquez Centro de MicrodatosClase 12

    Heterocedasticidad

  • 8/18/2019 Clase12-Heterocedasticidad

    25/33

    Ejemplo

    A continuación se realizan los test de heterocedasticidad. Donde se

    asume la siguiente estructura:

    V (u i |inc ) = σ2 · inc i 

    Javiera Vásquez Centro de MicrodatosClase 12

    Heterocedasticidad

  • 8/18/2019 Clase12-Heterocedasticidad

    26/33

    Ejemplo

    1. Test Breusch-Pagan: para realizar este test, primero de laestimación MCO del modelo de interés se obtienen los residuos,

    luego se computan los residuos normalizados (dividir cada residuoal cuadrado por el estimador de la varianza del error).

    Se estima una regresión entre los residuos generalizados y elingreso.

    Javiera Vásquez Centro de MicrodatosClase 12

    Heterocedasticidad

  • 8/18/2019 Clase12-Heterocedasticidad

    27/33

    Ejemplo

    SE

    Javiera Vásquez Centro de MicrodatosClase 12

    Heterocedasticidad

  • 8/18/2019 Clase12-Heterocedasticidad

    28/33

    Una vez realizada la estimación se construye el estad́ısticoSE 

    2  = 13,7, que resulta ser mayor al valor de tabla de una  χ21  al

    95 % de confianza (3.84).

    De esta forma, se rechaza la hipótesis nula de homocedasticidad.

    Javiera Vásquez Centro de MicrodatosClase 12

    Heterocedasticidad

  • 8/18/2019 Clase12-Heterocedasticidad

    29/33

    Ejemplo

    2. Test Goldfeld y Quandt:  es de esperar que la varianzadependa positivamente del nivel de ingreso, de esta forma,

    ordenamos las observaciones de menor a mayor nivel de ingreso yomitimos las 30 observaciones que ocupan los lugares centrales.

    Luego estimamos dos modelos cada uno con 35 observaciones, y secomputa el estad́ıstico  λ  igual a la división de la suma residual:

    Javiera Vásquez Centro de MicrodatosClase 12

    Heterocedasticidad

  • 8/18/2019 Clase12-Heterocedasticidad

    30/33

    Ejemplo

    Javiera Vásquez Centro de MicrodatosClase 12

    Heterocedasticidad

  • 8/18/2019 Clase12-Heterocedasticidad

    31/33

    Ejemplo

    Este estad́ıstico  λ(27,2) debe ser comparado con el valor de tabla

    de una distribución  F m,

    m  al 95 % de confianza, que es igual a 6.39.

    De esta forma, nuevamente se rechaza la hipótesis nula deHomocedasticidad.

    Javiera Vásquez Centro de MicrodatosClase 12

    Heterocedasticidad

  • 8/18/2019 Clase12-Heterocedasticidad

    32/33

    Ejemplo

    STATA computa el siguiente test de heterocedasticidadautomaticamente:

    Javiera Vásquez Centro de MicrodatosClase 12

    Heterocedasticidad

  • 8/18/2019 Clase12-Heterocedasticidad

    33/33

    Ejemplo

    Ambos tests nos confirman la presencia de heterocedasticidad, si laestructura de varianza asumida es correcta, podemos realizar laestimación Ḿınimos Cuadrados Generalizados Factibles (Mı́nimosCuadrados Ponderados) de la siguiente manera:

    Javiera Vásquez Centro de MicrodatosClase 12