Econometria Eco Medina

Embed Size (px)

Citation preview

  • 8/9/2019 Econometria Eco Medina

    1/41

     

    APUNTES DE CLASE

    FUNDAMENTOS DE ECONOMETRIA 

    ELABORADO POR:

    NANCY MEDINA CARRANCO 

    2000

  • 8/9/2019 Econometria Eco Medina

    2/41

     APUNTES DE CLASE

    FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco 

    2

    APUNTES DE CLASE

    FUNDAMENTOS DE ECONOMETRIA

    INTRODUCCION

    Actualmente la Econometría es una herramienta de análisis muy importante, inclusive

     para leer y entender la nueva teoría económica. Esta aplica métodos estadísticos y

    matemáticos al análisis de variables económicas y, sobre todo, a la relación de

    dependencia que puede existir entre las mismas.

    El objetivo último de este instrumento de investigación es estimar modelos que

     permitan captar el comportamiento de los individuos, fenómenos económicos o

    sociales, etc., a fin de predecir y hacer simulaciones sobre los mismos para establecer

     políticas económicas adecuadas, a nivel macroeconómico, políticas respecto a la

    empresa, a nivel microecnómico, proyecciones, etc..

    Por ejemplo, contribuiría a establecer cuál debería ser el precio mínimo o volumen de

     producción mínimo de una empresa, para lo cual se tomarían datos de las principales

    variables que determinan el comportamiento de la demanda del bien que se generaría

    con el proyecto, para luego definir un flujo de beneficios, sobre el que se haría un

    análisis de sensibilidad y/o riesgo.

    Si se desea inferir la valoración de un recurso natural que no tiene precio, se podría

    modelar el comportamiento de los individuos respecto a sus preferencias, de tal forma

    que después de hacer las manipulaciones matemáticas necesarias se llegue a un

    resultado del cambio en el bienestar de la población afectada en términos monetarios,

    utilizando para ellos aproximaciones como la variación compensada, la variación

    equivalente, el excedente del consumidor, etc..

    En la evaluación y formulación de proyectos se puede utilizar a la econometría para

     proyectar la oferta y la demanda del bien que se generaría con los mismos. Para el

    efecto, se estiman las funciones pertinentes utilizando las variables relevantes que

    explican su comportamiento, una vez estimada se realizan las predicciones directamente

    o través de tasas de crecimiento calculadas con base en las elasticidades (modelo

    doblemente logarítmico) y variaciones porcentuales de las variables que convenga.

    En economía agrícola si se trata de proyectar la producción o encontrar el óptimo físicoy económico es fundamental estimar funciones de producción y de costos, basadas en

    datos de producción e insumos (mano de obra, tierra, capital, etc.), que permitirían

     plantear en términos prácticos el problema del productor: la maximización de

     beneficios.

    En realidad, sería interminable citar ejemplos donde se puede utilizar a la econometría

    como herramienta de análisis básico.

    El propósito fundamental del análisis econométrico es hacer inferencias de una muestra

    hacia la población, esto es generalizar resultados. Para el efecto se requiere que el

    modelo estimado sea válido, es decir que cumpla con los supuestos y esté acorde con lateoría económica, por lo que una vez obtenidas las estimaciones se hacen pruebas de

  • 8/9/2019 Econometria Eco Medina

    3/41

     APUNTES DE CLASE

    FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco 

    3

    diagnóstico. Si los signos y magnitud de los parámetros estimados no están acordes con

    la teoría es necesario analizar el origen de estos resultados para corregir los posibles

    errores cometidos, para reformular o refutar una teoría, si ésta no se puede aplicar a

    nuestra realidad.

    Concepto y Objetivos de la Econometría

    Existen diversos conceptos  de econometría, a manera de ejemplo citaremos dos que

    recogen los elementos fundamentales de esta ciencia:

    Gerhard Tinter dice que, la econometría es el resultado de la adopción de una posición

    sobre el papel que juega la economía, consiste en la aplicación de la estadística

    matemática a los datos económicos con el objeto de proporcionar no solo un apoyo

    empírico a los modelos construidos por la economía matemática, sino una forma de

    obtener resultados numéricos.

    P. A. Samuelson define a la econometría como el análisis cuantitativo de los fenómenos

    económicos reales basados en el desarrollo simultáneo de la observación y la teoría,

    relacionados a través de apropiados métodos de inferencia.

    Tratando de construir una definición que considere algunos criterios de diferentes

    autores diríamos que la econometría es parte de los métodos cuantitativos de la

    economía, combina métodos matemáticos y estadísticos en la estimación de un modelo,

    el cual se ha establecido con base en la teoría económica que indica la relación de

    dependencia entre variables y debe ser validado utilizando a la inferencia estadística

    (pruebas de hipótesis) y contrastándolo con el enunciado de la teoría que se ha utilizado.

    Se puede decir que la econometría, por lo tanto, se resumen en cinco etapas:

    especificación, estimación, verificación predicción y recomendaciones de política.

    El objetivo de la econometría es verificar y establecer la relación de dependencia entre

    una variable dependiente y una o más variables independientes, a fin de obtener una

    función que permita realizar predicciones, formulación de políticas y simulaciones.

     Metodología

    Para explicar la metodología utilizada por la econometría es necesario primero definir lo

    que es un modelo.

    Un modelo  es una representación simplificada de un fenómeno económico o de la

    realidad a través de una(s) función(es) o ecuación(es). Cuando decimos que la

     producción de un bien depende del costo de los insumos, estamos resumiendo el

    fenómeno de la producción para un determinado bien.

    Explicitando los  pasos que debe seguir un análisis econométrico  se citaría los

    siguientes puntos:

  • 8/9/2019 Econometria Eco Medina

    4/41

     APUNTES DE CLASE

    FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco 

    4

    1. Consultar, en lo posible, toda la teoría existente con respecto al fenómeno que se

    desea analizar. Esto permite definir las variables (dependiente e independiente(s)) y

    su comportamiento en la explicación de un fenómeno, dando cuenta de la relación

    funcional.

    2. Con los resultados del paso anterior definimos una relación determinística entrevariables, esto significa que establecemos que los cambios en una de ellas se

    atribuyen o están explicados por modificaciones en una o más variables, sin dejar

    margen para un error. Es decir:

    Y = f (Xi) (i = 1, 2, 3 ... n)

    3. Con esta relación definimos la forma funcional que tendría. Para el efecto, se

    utilizan varios métodos como el diagrama de dispersión, en el caso de un modelo

    que tiene una sola variable dependiente, o simplemente ensayamos diferentes

    formas funcionales (cuadrática, cúbica, logarítmica, etc.) y verificamos cual es la

    que mejor se ajusta a los datos; por supuesto que la teoría también sugiere formas

    funcionales, por ejemplo los rendimientos marginales decrecientes expresan que

    una función de producción no sería lineal. Si, para el ejemplo, la forma funcional

    adecuada es una lineal tendríamos:

    Y = β0 + β1 X

    4. El modelo anterior es matemático o determinístico y hay que convertirlo a

    econométrico, para lo cual lo único que se debe hacer es agregarle el término de

    error, perturbación aleatoria o “canasta aleatoria”. Esto se debe a que,

    generalmente, cuando trabajamos con variables económicas y sociales siempre hay

    riesgo de cometer errores de medición; por otro lado, algunas variables son difícilesde cuantificar, o simplemente porque dada la definición misma de modelo y de su

    característica de que éste debe ser parsimonioso, no se incluyen todas las variables;

    a lo cual adicionaríamos los posibles errores en la forma funcional. El primer

    aspecto se evidencia cuando preguntamos, por ejemplo, cuál es el ingreso mensual

    de una persona, ésta nunca nos contesta con la verdad, hay tendencia a sobre o

    subestimar.

    Es esta la razón para decir que es una “canasta aleatoria”, porque contiene a todos

    los errores que fuere posible cometer. La aleatoriedad se debe a que hay la

     probabilidad y no la certeza de cometer una margen de error determinado; y, de que

    sus resultados no siempre se cumplan. En el ejemplo, el modelo econométricoquedaría expresado como:

    Y = β0 + β1 X + µ 

    5. Con este modelo nos servimos de procedimientos matemáticos y estadísticos para

    la estimación, los que se concretan en métodos básicos como: Mínimos Cuadrados

    Ordinarios (MCO), Máxima Verosimilitud (MV), Momentos, etc., los mismos que

    serán explicados posteriormente.

    6. Una vez estimado el modelo procedemos a validarlo contrastándolo con la teoríaeconómica para verificar si resultaron los signos esperados y las magnitudes

  • 8/9/2019 Econometria Eco Medina

    5/41

     APUNTES DE CLASE

    FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco 

    5

     previstas; adicionalmente verificamos si se cumplen o no los supuestos, que se

    resumen en la normalidad de los errores. Si una de las dos cosas falla significa que

    hubo algún error en la estimación y tenemos que volver a reiniciar todo el proceso

    hasta obtener un modelo adecuado a la realidad.

    7. Con el modelo validado procedemos a aplicarlo, ya sea para predicciones oformulación de política económica, básicamente.

    Cabe anotar que, los elementos de un modelo son: las ecuaciones, las variables y los

     parámetros.

    Las ecuaciones relacionan variables y pueden ser:

    - de comportamiento, cuando reflejan la conducta de diferentes agentes;

    - de definición, reflejan identidades contables;

    - tecnológicas, como las funciones de producción que expresan una técnica para

     producir;

    - institucionales, reflejan la voluntad política de los agentes rectores de una economía

    (impuestos, oferta monetaria, etc.); y,

    - de equilibro, por ejemplo las de oferta y demanda en un sistema de ecuaciones,

    donde no habría solución sin éstas.

    Las variables son aquellas que cambian de valor en diferentes observaciones. En un

    modelo éstas pueden ser:

    - endógenas, que se determinan dentro de un modelo. Generalmente, las conocemos

    como dependientes; y,- exógenas, que se determinan fuera del modelo. Se las conoce como independientes o

    explicativas.

    Los parámetros son valores fijos. En un modelo son los coeficientes que están ligados

    con la(s) variable(s) independiente(s) y son los que precisamente se trata de encontrar a

    través de su estimación.

    Los modelos pueden ser de diferente tipo, entre los cuales tenemos:

    - Uniecuacionales, cuando existe una sola ecuación;

    - Multiecuacionales, cuando tenemos más de una ecuación (modelos de ecuacionessimultáneas);

    - Dinámicos, cuando se incluye la variable tiempo; y,

    - Estáticos, cuando se utilizan para explicar un fenómeno en un determinado momento

    del tiempo.

    El proceso para el análisis econométrico se resume en el siguiente diagrama de flujo:

  • 8/9/2019 Econometria Eco Medina

    6/41

     APUNTES DE CLASE

    FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco 

    6

     

     Inferencia Estadística 

    Para hacer investigación es necesario familiarizarse con métodos cuantitativos que

     permitan hacerla más efectiva.

    La estadística comprende dos ramas fundamentales: la Estadística Descriptiva y la

    Inferencia Estadística. La primera se ocupa de la recopilación, organización y

     presentación de los datos. La segunda trata del desarrollo de los métodos de la teoría

    estadística (aplicación), a fin de hacer generalizaciones de una parte (muestra) a un todo

    (población).

    TEORIA ECONOMIA

    Revisión, análisis y definiciones

    MODELO MATEMATICO

    Determinístico

    MODELO ECONOMETRICO

    Probabilístico

    ESTIMACION DEL MODELO

    Métodos matemáticos y estadísticos

    VALIDACION DEL MODELO

    Viola los supuestos?

    Está acorde con la teoría?(signos y valores esperados)

    ES ADECUADO?  NO

    SI

    PREDICCIONES, PROYECCIONES

    FORMULACION DE POLITICAS

    PRUEBAS DE HIPOTESIS

    Aplicaciones de la teoría a la realidad

    DATOS

  • 8/9/2019 Econometria Eco Medina

    7/41

     APUNTES DE CLASE

    FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco 

    7

    La econometría utiliza a la inferencia estadística. La estadística descriptiva le interesa

    solo en la medida que ciertos resultados (estadísticos) resumen diferentes

    características de los datos (media, desviación estándar).

    La diferencia entre estadística descriptiva e inferencia consiste en que, en el ámbito de

    la primera los resultados obtenidos con los datos son un fin en sí mismo, mientras queen la segunda son solo un instrumento de análisis.

    Conceptos básicos

     Población.- se define como el conjunto de todas las observaciones (datos) posibles,

    medidas o resultados.

     Muestra.- conjunto de datos, medidas o resultados seleccionados a partir de la muestra.

    Generalmente, en econometría para la estimación de modelos utilizamos muestras

    obtenidas de acuerdo a algún mecanismo causal determinado, que se denomina

     probabilístico.

    Tanto las muestras como las poblaciones se describen a través de sus características

    numéricas, que en el caso de una población se denominaran parámetros y en el de una

    muestra estadísticos (medidas resumen).

    Dado que la estadística se interesa por los fenómenos que pueden ser medidos o

    contados es necesario conocer lo que es una variable y un atributo.

    Variable.- es aquella que toma diferentes valores en distintas observaciones.

     Atributo.- cuando el fenómeno no puede medirse pero si contarse. Un atributo es la

     presencia o ausencia de una característica determinada. Por ejemplo: sexo (masculino o

    femenino), educación (primaria, secundaria, superior), etc.

    Constante.- como su nombre lo indica es aquella que no cambia de valor de una

    observación a otra.

    Variable estocástica o aleatoria.- sus valores no pueden ser determinados antes de ser

    observados, ni controlados totalmente. Se caracterizan por tomar diferentes valores con

     probabilidades diferentes a la unidad. 

    Variable no aleatoria.- la que es totalmente controlable o al menos se puede predecir

    totalmente.

    Variable continua.- es aquella que toma cualquier valor sobre la recta numérica. Ej:

    tiempo, ingreso, temperatura, gasto, etc. 

    Variable discreta.- toman solo ciertos valores de la recta numérica, los mismos que

    están separados por intervalos de igual longitud. Ej: número de hijos, número de puntos

    obtenidos al lanzar un dado, etc.

  • 8/9/2019 Econometria Eco Medina

    8/41

     APUNTES DE CLASE

    FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco 

    8

    Distribución de frecuencias (muestra) y de probabilidades (población).- es la

    ordenación de datos de tal forma que se indique el número de observaciones

    correspondientes a cada valor de la variable (discreta) o de cada intervalo de valores  de

    la variable (continua).

    Naturaleza de la Inferencia Estadística 

    La inferencia se dedica a efectuar generalizaciones respecto a una población, con base

    en la información proporcionada por la muestra.

    Lo que hace a la aplicación de la inferencia un método científico es el hecho de que se

    toma en consideración la selección de la muestra y que expresa los resultados en

    términos de probabilidades.

    El objetivo del muestreo y de todo lo relacionado con la inferencia es efectuar juicios

    acerca de los parámetros de la población, basados en los estadísticos de la muestra.

    Los juicios son pronósticos dotados de cierto grado de confianza y pueden ser de dos

    tipos:

    1. Se refiere a la estimación de un parámetro, es decir estimadores (información

    resumida) que nos son más que fórmulas que describen un procedimiento para

    efectuar conjeturas acerca del valor de un determinado parámetro.

    2. Se refiere a la contrastación de una hipótesis respecto a un parámetro. Esto implica

    un supuesto previo respecto al valor del parámetro, para lo cual utilizamos un

    estadístico de prueba.

    Distribuciones Muestrales 

    La forma de saber en que medida se puede confiar en un pronóstico es conocer la

    conducta de la variable de análisis en todas las muestras posibles. Pues, se supone que

    existe un proceso desconocido que genera los datos, el cual se describe por medio de

    una distribución de probabilidades, que se caracteriza por algunos parámetros

    desconocidos.

    Estimador Perfecto 

    Es aquel que no tiene posibilidad de error. En otras palabras, su distribución muestral se

    concentra en un solo punto y éste coincide con el valor que se estima. Pero estos son

    infrecuentes dadas las características de las mediciones o datos.

    Sin embargo, para que los estimadores sean al menos buenos debe tener ciertas

     propiedades deseables:

    Insesgado.- es cuando la distribución muestral tiene una media que es igual al parámetro

    estimado, pues proporciona el resultado perfecto en promedio.

  • 8/9/2019 Econometria Eco Medina

    9/41

     APUNTES DE CLASE

    FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco 

    9

    Eficiente.- se refiere a la distancia entre los valores estimados y el promedio de la

    distribución, es decir al grado de dispersión entre los estimadores y el promedio que no

    es más que deben tener la varianza mínima.

    Consistentes.- referido a que a medida que se aumenta el tamaño de la muestra la

    distribución tiende a concentrarse más alrededor del promedio. 

    Comentarios Finales

    La econometría se puede utilizar en el estudio y análisis de una variedad de fenómenos

    económicos, sociales, políticos, etc., lo cual demuestra la importancia que tiene el

    manejo de este instrumento para, en particular, un economista.

    Se puede observar que para que la econometría genere resultados válidos es necesario

    entrar en un proceso iterativo hasta llegar a un modelo adecuado a la realidad.

  • 8/9/2019 Econometria Eco Medina

    10/41

     APUNTES DE CLASEFUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco 

    10

    CAPITULO I

    ANALISIS DE CORRELACION

    En este capítulo estudiaremos un tipo de análisis muy importante dentro del proceso de

    estimación de un modelo econométrico, el de correlación. 

    1.1 Definición e Interpretación

    El análisis de correlación busca medir o cuantificar el grado de asociación lineal entre

    variables continuas, sin tener en cuenta cual de las dos es la dependiente o

    independiente. Este análisis utiliza como herramienta básica el coeficiente de

    correlación (ρ en términos poblacionales y r en términos muestrales), que se lo puedeinterpretar por su signo y magnitud.

    Por su magnitud.- el coeficiente de correlación puede tomar valores entre más 1 y

    menos 1, es decir que el límite mínimo es -1 y el límite máximo es+1. Obviamente, mientras más se acerca a uno (valor absoluto)

    existe un mayor grado de asociación lineal entre variables y mientras

    más se acerca a cero es evidente que no existe este tipo de relación.

    Por su signo.- como habíamos mencionado el coeficiente de correlación puede

    tener valores positivos y negativos. Si el coeficiente tiene signo

    negativo se puede decir que existe una relación lineal inversa entre

    las dos variables y si es positivo se dice que existe una relación

    lineal directa entre las variables.

    Para calcularlo se utiliza la fórmula:

     X X Y Y 

     X X Y Y 

    i i

    i

    n

    i i

    i

    n

    i

    n=

    − −

    − −

    =

    ==

    ∑∑

    ( ) ( )

    ( ) ( )

    1

    2 2

    11

     

    Donde nos damos claramente cuenta que es el numerador el que determina el sigo de r.

    1.2 Características

    El coeficiente de correlación tiene las siguientes características:

    1. Sus valores están entre -1 y +1;

    2. Maneja a las variables simétricamente, esto es que considera tanto a X como Y

    como aleatorias y no las diferencia entre dependiente e independiente;

    3. Si su resultado fuera 0, significa que no existe relación lineal alguna entre las

    variables;

    4. Si su resultado fuera 1, significa que existe una asociación lineal perfecta entre las

    dos variables; y,5. Es la relación entre la covarianza entre X e Y y las varianzas de X y de Y.

  • 8/9/2019 Econometria Eco Medina

    11/41

     APUNTES DE CLASEFUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco 

    11

    Las principales Ventajas de este coeficiente es que es fácil de medir y de interpretar,

    todos los paquetes estadísticos lo proporcionan y la escala no afecta al resultado. El

    limitante es que solo mide la relación lineal entre dos variables.

    1.3 Aplicaciones

    Este tipo de análisis es muy importante para verificar si existe o no alguna relación

    lineal y si ésta es positiva o negativa. Por ejemplo, si se desea ver si se cumple: la ley de

    la demanda, interesa observa si existe una relación inversa entre la cantidad demandada

    y el precio; la ley de la oferta, se trata de ver si hay una relación directa entre la

    cantidad ofertada y el precio, etc.

    Para el efecto, se deben hacer pruebas de hipótesis1  respecto al coeficiente de

    correlación poblacional, tanto en la nula como en la alterna, con un nivel de

    significancia. El estadístico de prueba útil en este caso es:

    t r n

    r t n=

      − −

    −≈   −

    2

    1 22

    θ  

    Este estadístico tiene una distribución aproximadamente normal, en muestras pequeñas

    se distribuye con una t de student con n-2 grados de libertad, es decir que se debe

    contrastar con el valor teórico de esta distribución, de acuerdo al nivel de significancia

    seleccionado.

    El proceso para hacer una prueba de hipótesis se puede describir en los siguientes

     pasos:

    1. Planteamos la hipótesis nula y la hipótesis alterna2 que, en este caso, se refiere a si

    existe o no una la relación lineal, o al verificación de una relación directa o inversa

    entre dos variables. Es decir:

    Ho: ρxy = 0 (no ∃3 relación o asociación lineal entre las variables X y Y)

    Ha: ρxy ≠ 0 (∃ relación o asociación lineal entre las variables X y Y)

    Ho: ρxy ≤ 0 (no ∃ una relación o asociación lineal directa entre X y Y)Ha: ρxy > 0 (∃ una relación o asociación lineal directa entre las variables X y Y)

    Ho: ρxy ≥ 0 (no ∃ una relación o asociación lineal inversa entre X y Y)Ha: ρxy < 0 (∃ una relación o asociación lineal inversa entre las variables X y Y)

    2. Definimos un nivel de significancia4 (α) dependiendo del error tipo I que se prevécometer. Generalmente, se utiliza el 5%, pero su valor es establecido por el

    investigador.

    1 / Una hipótesis es un supuesto que se hace con respecto al verdadero valor poblacional.

    Una prueba de hipótesis no es más que la contrastación del valor muestral con el poblacional, para

    realizar inferencias con respecto al último.2 / Para una definición y discusión de estos conceptos véase el Apéndice 1.1.  

    3 / ∃ = existe

  • 8/9/2019 Econometria Eco Medina

    12/41

     APUNTES DE CLASEFUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco 

    12

     

    3. Se evalúa el estadístico de prueba o valor calculado, el cual simplemente es una

    fórmula que incluye el parámetro sobre el que se está realizando la prueba de

    hipótesis, en términos muestrales (r), y que tiene la distribución de probabilidades

    que se presume tiene el parámetro poblacional. En este caso se supone que tiene

    una distribución aproximadamente normal, para muestras pequeñas se asume unadistribución t de student. La fórmula pertinente es la que se presentó anteriormente.

    4. Buscamos el valor teórico, o el que le corresponde en la distribución de

     probabilidades, en la tabla correspondiente (distribución normal o t-student),

    considerando los grados de libertad, en este caso 2 porque perdemos dos valores al

    calcular las medias utilizadas para estimar r.

    5. Finalmente, contrastamos el valor calculado con el teórico sobre un gráfico de la

    distribución correspondiente, la cual se dividirá en una región crítica, o de rechazo

    de la hipótesis nula, y en una región de aceptación de la misma.

    Por ejemplo, en una empresa de comercialización de enciclopedias el salario de sus

    ejecutivos de ventas se relaciona directamente con el volumen de ventas logrado en un

     período determinado. Se desea verificar esta proposición para los siguientes datos

    disponibles:

    Salario (Y)

    (cientos de dólares)

    Ventas (X)

    (número de enciclopedias)

    4 30

    6 30

    5 407 50

    7 60

    1. Ho: ρxy ≤ 0 (no ∃ una relación o asociación lineal directa entre X y Y)Ha: ρxy > 0 (∃ una relación o asociación lineal directa entre las variables X y Y)

    2. α = 5%

    3. Calculamos el estadístico de prueba -> t calculado (tc)

    t cr n

    r t n=

      − −

    −≈   −

    2

    1 22

    θ  

    Para el efecto, necesitamos el valor de r que lo obtenemos con la fórmula:

    4 /  Para entender de mejor forma este concepto véase el Apéndice 1.1.

  • 8/9/2019 Econometria Eco Medina

    13/41

     APUNTES DE CLASEFUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco 

    13

      r 

     X X Y Y 

     X X Y Y 

    i i

    i

    n

    i i

    i

    n

    i

    n=

    − −

    − −

    =

    ==

    ∑∑

    ( ) ( )

    ( ) ( )

    1

    2 2

    11

     

    =>

     Y X Yi - Y Xi - X (Xi - X)(Yi -Y) (Yi -Y)2  (Xi -X)

    2

      4 30 -1,8 -12 21,6 3,24 144

      6 30 0,2 -12 -2,4 0,04 144

      5 40 -0,8 -2 1,6 0,64 4

      7 50 1,2 8 9,6 1,44 64

      7 60 1,2 18 21,6 1,44 324

    Sumatorias( )  29 210 52 6,8 680

    Promedios Y = 5.8 X = 42

    Aplicando la fórmula encontramos que r = 0,764705882.

    Cómo se interpreta este valor?. Su signo es positivo por lo que se diría que existe una

    relación directa entre el salario percibido por un vendedor y el volumen de ventas que

    logra el mismo. Por su magnitud, el grado de asociación lineal entre las variables es del

    76.5%, aproximadamente, que significa que existe asociación lineal entre las variables.

    Conocemos que n = 5 y θ = 0 (θ es el valor de la hipótesis).

    Calculamos tc:

    t c =  − −

    −=

    0 76471 5 2 0

    1 0 764712 05548

    2

    .

    ( . ).

    4. tt (t teórico) = t 5%, 5-2 gl (para una cola) = 2.353

    Observemos que hemos puesto el valor teórico de t con el 95% de confianza y 3

    grados de libertad para una cola. 95% porque el nivel de significancia α = 5% y el

    de confianza es simplemente 1- α. Una cola (y derecha) porque en la hipótesisalterna decimos que el valor de el coeficiente de correlación debe ser mayor que

    cero para que se cumpla esta hipótesis.

    5. Contrastamos el estadístico (tc) con el teórico (tt), el último valor es el que define

    la región crítica y la de aceptación.

  • 8/9/2019 Econometria Eco Medina

    14/41

     APUNTES DE CLASEFUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco 

    14

     

    Con esta contrastación concluimos:

    Como el tc está a la izquierda del tt, es decir en la región de aceptación de la

    hipótesis nula (A Ho) (no existe una relación directa entre salario y ventas), se

     puede decir con el 95% de confiabilidad que no existe una relación directa

    (positiva) entre el salario y las ventas.

    Cabe señalar que, cuando empezamos a plantear un modelo econométrico se debe

    efectuar análisis entre las variables para observar si existe o no relación entre ellas, de

    tal forma que la incorporación de una variable en un modelo esté sustentada. El

    coeficiente de correlación contribuye a definir la existencia o no de una asociación

    lineal entre dos variables de tipo continuo.

    Cuando se trata de variables categóricas, o de combinaciones entre categóricas y

    continuas se debe utilizar otro tipo de análisis, tales como el de contingencia.

    Por ejemplo, si disponemos de datos relativos al número de personas por estratos (bajo,

    medio y alto), quienes a su vez están divididas por el tipo de ingreso que perciben (bajo,

    medio y alto), como se indica en la siguiente tabla.

    TABLA DE DATOS 

    Ingresos Total

    Estrato Bajo Medio Alto

    Bajo 10 7 6 23

    Medio 9 11 12 32

     Alto 7 9 15 31

    Total 26 27 33 86

    Así, la columna total significa que en el grupo donde se ha levantado la encuesta existen

    23 personas de estrato bajo, 32 de medio y 31 de alto. De las 23 personas de estrato

     bajo, 10 tienen ingreso bajos, 7 medio y 6 altos, dentro de su estrato, y así

    sucesivamente. Se trata de establecer si existe alguna relación entre el estrato y el nivel

    de ingreso, para lo cual se debe calcular el estadístico de prueba Xc, debido a que tiene

    una distribución Chi-cuadrado, a través de la fórmula:

     X cO e

    e

    i j i j

    i j ji

    =  −

    ∑∑( )2

     

    Donde Oij es el valor observado y eij es el valor esperado, de la frecuencia.

    Construimos una tabla de contingencia, como se presenta a continuación:

    02.3532.055

    A HoR Ho

  • 8/9/2019 Econometria Eco Medina

    15/41

     APUNTES DE CLASEFUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco 

    15

     

    Ingresos Total

    Estrato Bajo Medio Alto

    Bajo 10 26*23/86 7 27*23/86 6 3*23/86 23

    Medio 9 26*32/86 11 27*32/86 12 33*32/86 32 Alto 7 26*31/86 9 27*31/86 15 33*31/86 31

    Total 26 27 33 86

    Donde, en cada celda se encuentra el valor observado (Oij), primer número, y el valor

    esperado (eij), segunda expresión. A continuación calculamos los eij en la siguiente

    tabla:

    Estrato ei,1  ei,2  ei,3 e1,j  6,953 7,221 8,826

    e2,j  9,674 10,047 12,279

    e3,j  9,372 9,733 11,895

     

    Por último procedemos a calcular cada elemento de la fórmula mencionada

    anteriormente y Xc, como se observa en la siguiente tabla:

    (Oi,1-(ei,1))2  (Oi,2-(ei,2))

    2  (Oi,3-(ei,3))

    (O1,j-(e1,j))2  1,33476 0,00676 0,90463

    (O2,j-(e2,j))2  0,04701 0,09049 0,00634

    (O3,j-(e3,j))2  0,60038 0,05514 0,81030

    Xc 3,85583

     

    Ahora realizamos la prueba de hipótesis:

    1. Ho:  X  2= 0 (no ∃ relación entre estrato y nivel de ingreso)Ha:  X  2 ≠ 0 (∃ relación entre estrato y nivel de ingreso)

    2. α = 5%

    3. Calculamos el estadístico de prueba -> Xc

    Xc = 3,85583 ∼  X  2 (i-1)*(j-1) gl 

    4. Xt (X teórico) = X 5%, 4 gl (para una cola) = 9.48773

    Observemos que hemos puesto el valor teórico de X con el 95% de confianza y 4

    grados de libertad, que se obtiene de (i-1)*(j-1) = (3-1)*(3-1)= 4.

    5. Contrastamos el estadístico (Xc) con el teórico (Xt), el último valor es el que define

    la región crítica y la de aceptación.

  • 8/9/2019 Econometria Eco Medina

    16/41

     APUNTES DE CLASEFUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco 

    16

     

    Con esta contrastación concluimos:

    Como el Xc está a la izquierda del Xt, es decir en la región de aceptación de la

    hipótesis nula (no existe relación entre el nivel de ingresos y el estrato), se puede

    decir con el 95% de confiabilidad que no existe relación entre el nivel de ingreso y

    el estrato.

    Observemos que la Chi-cuadrado ( X 2) tiene una forma diferente a la distribución t y

    normal, pues relaciona un cuadrado con otro número, por lo que nunca puede ser

    negativa y no es simétrica.

    3.86

    A HoR Ho

    9.488  X 2 

    f( X 2)

  • 8/9/2019 Econometria Eco Medina

    17/41

     APUNTES DE CLASE

    FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco 

    20

    CAPITULO II

    ANALISIS DE REGRESION 

    En este capítulo estudiaremos el análisis de regresión como base fundamental para la

    formulación de un modelo.

    1.1 Análisis de correlación versus análisis de regresión

    El análisis de regresión se utiliza para establecer una relación de dependencia o

    funcional, lo cual requiere la definición de una función. Es decir que, mientras el

    análisis de correlación mide el grado de asociación lineal, el análisis de regresión va

    más allá, busca definir la relación de dependencia de una variable con otra(s).

    Por otro lado, en tanto que el análisis de correlación maneja a las variables

    simétricamente (las dos son aleatorias), el de regresión lo hace asimétricamente, lo cual

    es uno de los supuestos básicos de un modelo, es decir supone que la variabledependiente es aleatoria y la(s) independiente(s) no aleatoria(s) o dada(s), fija(s) o

     predeterminada(s). Se observa que este análisis diferencia cuál es la variable

    dependiente y cuál es la independiente.

    Con el análisis de regresión ya nos introducimos en el mundo de los modelos

    econométricos.

    Históricamente el concepto de regresión se lo atribuye a Galton, quien observó que la

    estatura de los hijos de padres altos era baja y que la de hijos de padres bajos era alta,

     pero que en promedio se tendía a un valor determinado o promedio.

    En el análisis de regresión estimamos el valor medio de la variable dependiente con

     base en valores “fijos” de la variable(s) independiente(s), es decir que se puede decir

    que la función de regresión es la unión de las medias condicionales dado un valor

    determinado de la variable independiente.

    Gráfico No. 1

    Consumo (X)

    Ingreso (Y) E(Y\X) = f(X)

    150000  500000

    E(Y\X=500000

  • 8/9/2019 Econometria Eco Medina

    18/41

     APUNTES DE CLASE

    FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco 

    21

    En el Gráfico No. 2 observamos una regresión lineal simple. La linealidad puede estar

    dada desde el punto de vista de los parámetros y de las variables. En este documento

    vamos a trabajar siempre con la linealidad en los parámetros.

    1.2 Función de regresión lineal poblacional (FRP) y muestral (FRM)

    Gráficamente:

    Gráfico No. 2

    x

    x

    x

    x

    x x

    Observamos que a cada valor de X le corresponde un valor promedio de Y. La línea

    Y=β0 + β1X se conoce como línea o función de regresión poblacional (FRP), que no esmás que la unión de los valores promedios de Y o de las esperanzas1 condicionales2 de

    Y dado un Xi, con base en los valores poblacionales observados. Es decir, es el valor

    medio que toma Y dado un valor para X, que en términos matemáticos se representa

    como:

    E(Y/Xi)=  β0 + β1X

    Pero como las estimaciones se realizan con base en muestras y no poblaciones, lo que

    vamos a obtener es una función de regresión muestral (FRM). Esto debido a que,

    generalmente, no se cuenta con los datos poblacionales: para las series de tiempo

    muchas veces se dispone de una datos limitados en el tiempo; para series de corte

    transversal, ya sea por costos o tiempo, tampoco se dispone de todas las observaciones

    correspondientes a la población.

    Generalmente, cuando se trata de tomar datos directamente se hace un muestreo que puede ser aleatorio, estratificado, etc., debido a que el tiempo, así como los recursos,

     para el levantamiento de una encuesta son limitados. Es más, dependiendo del tipo de

    cálculo que se utilice para determinar el tamaño de la muestra, con anticipación nos

    fijamos un nivel de error y de confiabilidad.

    Actualmente, se define a la regresión simple como el establecimiento de una relación

    funcional entre la variable independiente y la(s) dependiente(s).

    1

     / El valor esperado de una variable no es más que un promedio ponderado, donde las ponderacionescorresponden a las probabilidades de que tome determinados valores.

    2 /  La esperanza condicional es el valor promedio condicionado a una determinada probabilidad.

     

    Y

    X

    Y = β0 + β1X (FRP)

    x1 x3x2 

    Y= 0 + 1X FRM

  • 8/9/2019 Econometria Eco Medina

    19/41

     APUNTES DE CLASE

    FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco 

    22

    La importancia de este tipo de análisis se observa en las aplicaciones de sus resultados,

    que como hemos mencionado hacen posible realizar simulaciones, formulación de

     políticas y predicciones, entre las principales.

    Ahora que, al predecir con la FRP cometemos un error µi, que es la diferencia o

    distancia existente entre el valor medio poblacional estimado para Y y el valorobservado para la misma variable. En este sentido, se puede decir que un modelo de

    regresión simple es una relación funcional entre una variable independiente y una

    dependiente, quedaría expresado como:

    E(Yi/Xi) = β0 + β1 Xi + µi 

    En tanto que, si predecimos con la FRM cometemos un error ei, que es un estimado

    considerado como la distancia existente entre la FRM y la FRP, es decir:

    E(Yi/X

    i) = β

    0 + β

    1 X

    i + e

    Entonces, tendríamos:

    Valores estimados

    de la muestra

    Valores

    poblacionales

    FRM FRP

    β0  β0 β1  β1 ei  ui 

    Yi  E(Yi\Xi)

    Características de la línea de regresión

    1. Pasa por los puntos formados por las observaciones de X y los valores promedio

    condicionales de Y ( X ,   Y);2. La media de los valores estimados es igual a la media de los valores observados

    Y=Y; y,

    3. La sumatoria de los errores estimados es igual a cero Σei = 0

    1.3 Método de estimación de la FRM

    Una vez definida la función se procede a estimar el modelo. Para el efecto existen

    diferentes métodos, entre los cuales el más conocido y el que utilizaremos en los

     primeros capítulos es el de Mínimos Cuadrados Ordinarios (MCO).

    Como observamos en el Gráfico No. 2, el valor promedio de Y no corresponde

    exactamente al valor poblacional, existe un margen de error (µi); por otro lado, haydiferencia entre la FRP y FRM, la cual es la que estimamos. Lo que intenta este método

    es justamente minimizar el error (distancia) entre las dos funciones. Puesto que:

  • 8/9/2019 Econometria Eco Medina

    20/41

     APUNTES DE CLASE

    FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco 

    23

      Y = β0 + β1 Xi + ei => ei = Y - (β0 + β1 Xi)

    Ahora que sería inútil minimizar la sumatoria de los errores, pues en promedio sabemos

    que éste es igual a cero. Pero si tiene sentido minimizar la sumatoria de los errores al

    cuadrado, esto es:

    min e Y X  ii

    n

    i

    n

    i

    = =∑ ∑= − +

    1

    0

    1

    1

    2[ ( )] β β   

    Aplicando el concepto de optimización, es decir intentamos encontrar el valor óptimo

    de los βi  para minimizar la sumatoria de los errores al cuadrado. Para el efecto,aplicamos conocimientos de cálculo diferencial, sacando las condiciones de primer

    orden (la primera derivada de la expresión con respecto a cada uno de los parámetros

    desconocidos (βs) será igual a cero) y de segundo orden (la segunda deriva de la

    expresión con respecto a cada uno de los βs es mayor que cero).

    ∂ 

    ∂ β 

    ∂ β β 

    ∂ β 

    ( )

    ( )

    ( ( ))

    ( )

    e Y X i

    i i

    2

    0 1

    2

    0=  − +

    =  

    ∂ 

    ∂ β 

    ∂ β β 

    ∂ β 

    2 2

    2

    2

    0 1

    2

    20

    ( )

    ( )

    ( ( ))

    ( )

    e Y X i

    i i

    =  − +

    〉  

    Al obtener las derivadas de primer orden encontramos dos ecuaciones con dos

    incógnitas, β0 β1, que al resolverlas nos dan como resultado lo que denominamos comoecuaciones normales, que a saber son:

    Y n X ii

    n

    i

    i

    n

    = =∑ ∑= +

    1

    0 1

    1

     β β   

     X Y X X i ii

    n

    i

    i

    n

    i

    i

    n

    = = =∑ ∑ ∑= +

    1

    0

    1

    1

    1

    2

     β β   

    Este sistema de ecuaciones es resuelto por cualquier método matemático (adición,substracción, igualación, suma y resta, etc.) para encontrar los valores de los parámetros

    desconocidos, que constituyen los estimadores de MCO. Una vez estimados definimos

    el modelo como:

    Y = β0 + β1 Xi 

    1.4 Supuestos del Modelo Clásico de Regresión Lineal Simple

    (MCRLS)

  • 8/9/2019 Econometria Eco Medina

    21/41

     APUNTES DE CLASE

    FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco 

    24

    Siempre se deben establecer supuestos sobre el modelo. Los más importantes o los que

    deben quedar explícitos son los relativos al término del error. Los supuestos que debe

    cumplir un modelo econométrico son:

    1. Recordemos que en la estimación de un modelo hay un margen de error, los cuales

     pueden ser positivos o negativos. El valor esperado o promedio estimado de lavariable dependiente, a través de la regresión muestral estará subestimado o

    sobrestimado con relación al valor poblacional. Por lo tanto, se espera que en

     promedio los errores sean cero, o el valor esperado de los errores es igual a cero,

    esto es:

     E X i i( / ) = 0

    Intuitivamente significa que los errores cometidos al estimar el modelo no afectan

    sistemáticamente al valor promedio de la variable dependiente, es decir que refleja

    el verdadero valor poblacional.

    2. Que los errores no están correlacionados, es decir que no existe autocorrelación en

    el modelo, esto es:

    Cov (µi, µ j) = 0 (i ≠ j) pues,

    Cov (µi, µ j) = E[ui - E(ui)] [u j- E(u j)]

    Cov (µi, µ j) = E(ui u j) = E(ui) E(u j) = 0 (i ≠ j)

    Intuitivamente significa que el valor de la observación i no influye en el de la j. Por

    ejemplo, en series de tiempo el pasado no explica al presente; en series de corte

    transversal significa que las variaciones de ingreso en un grupo de personas no

    explican los cambios en el consumo de otro grupo.

    3. Que la varianza es única, o el modelo es homocedástico, esto es:

    Var (µi) = E (µi)2 = σ2 

    Porque:

    Var (µi) = E [µi - E (ui)]2 = σ2 

    Intuitivamente significa que el crecimiento (decrecimiento) de la variable

    independiente no afecta o conlleva modificaciones en la varianza del error del

    modelo.

    4. Que las observaciones de la variable independiente no están correlacionadas con elerror, esto es:

    0 0

    0 0

    0

  • 8/9/2019 Econometria Eco Medina

    22/41

     APUNTES DE CLASE

    FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco 

    25

     

    Cov (Xi, µi) = 0

    5. Finalmente, se supone que el modelo está bien especificado. Es decir que, la forma

    funcional se ajusta a los datos y que se han incluido las variables relevantes. Esto

    implica que no cometemos sesgo de especificación.

    Estos cinco supuestos se pueden resumir en:

    µ ∼ N (0, σ2)

    Lo cual significa que, los errores se distribuyen normalmente con media cero y varianza

    σ2. Estos supuestos se deben cumplir porque de lo contrario estamos en problemas.

    Si un modelo lineal simple cumple con todos estos supuestos tenemos el MCRLS

    (Modelo Clásico de Regresión Lineal Simple). Según Markov si a este modelo

    aplicamos el método de estimación de MCO, los estimadores van a ser los Mejores

    Estimadores Lineales Insesgados (MELI).

    Sabemos que para que un estimador sea perfecto debe ser:

    1. Insesgado, lo que significa que en promedio los estimadores son igual al verdadero

    valor poblacional, lo que permite que las inferencias sean válidas. Esto es:

    E(βi) = βi

    2.  Eficiente, se refiere a la distancia entre los valores del estimador y el valor del

     parámetro, e implica que entre todos los estimadores se ha seleccionado aquel de

    varianza mínima (distancia mínima o de menor dispersión).

    3. Consistente, que no es más que un estimador se acerca cada vez más a su

    verdadero valor poblacional a medida que se aumenta el tamaño de la muestra, o

    tiende a concentrarse más alrededor del verdadero valor del parámetro.

    β  i

    βi1  βi2 

  • 8/9/2019 Econometria Eco Medina

    23/41

     APUNTES DE CLASE

    FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco 

    26

     

    Estas tres características están bajo el supuesto que se realizan estimaciones de

    diferentes modelos para diferentes muestras, obviamente esto es teórico, pues sabemos

    que en virtud de los costos, en la práctica, utilizamos una sola muestra.

    1.5 Errores de precisión de los estimadores, intervalos de confianza y

     pruebas de hipótesis

    Errores de precisión de los estimadores

    Conocemos que entre todos los estimadores se escoge aquel que cumple con las

     propiedades teóricas; sin embargo, en la práctica lo que estimamos es uno solo, con

     base en la muestra, por lo que es necesario considerar los errores que tienen éstos conrespecto al verdadero valor poblacional.

    Esta medida la conocemos como la desviación típica o estándar, que se define como una

    medida de dispersión de todos los valores estimados para un parámetro con respecto a

    su verdadero valor poblacional (valor promedio de estos estimadores, si cumple con la

     propiedad de ser insesgado) varianza.

    Esta es muy importante para calcular intervalos de confianza y para hacer pruebas de

    hipótesis respecto a los parámetros.

    Var S    S 

     X X 

    S S 

    i

    i

    n( ) ( )

    ( )

    ( ) ( ) β β β β 1 12

    2

    1

    2 1 1

    2= =

    => =

    =∑

     

    Var S  

    S X 

    n X X 

    S S 

    i

    i

    n

    i

    i

    n( ) ( )

    ( )

    ( ) ( ) β β β β 0 02

    2 2

    1

    1

    2 0 0

    2= =

    => ==

    =

    ∑ 

    βi 

  • 8/9/2019 Econometria Eco Medina

    24/41

     APUNTES DE CLASE

    FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco 

    27

    Donde: S2  es la varianza del modelo, es decir es la varianza del error (discrepancia

    entre la FRM y la FRP), que tan cerca está el valor estimado del verdadero

    valor poblacional:

    ei = Yi - Yi

    Intervalos de Confianza

    La estimación de un modelo da como resultado estimadores puntuales de los parámetros

    (un solo valor). En la práctica es muy arriesgado presentar los resultados de esta forma,

     pues la estimación se hace con base a una muestra, por otro lado hay el riesgo de no

    incluir todas las variables explicativas, por las razones que hemos venido mencionado, y

    de cometer errores de medición. En este sentido, es mejor presentar los resultados en

    forma de intervalos con cierto nivel de confianza, es decir decimos que la probabilidad

    de que el valor estimado se encuentre en un determinado intervalo con tal grado de

    confianza.

    Como los valores que se estiman son de los parámetros y del promedio de la variable

    dependiente, habrá intervalos de confianza para cada uno de los parámetros y para el

    valor promedio.

    Intervalo de confianza para los estimadores

    IC(βi) = Probabilidad[Límite inferior, Límite superior] = (1- α)% de confiabilidad

     IC ob t S t S i i n i i ni i( ) Pr [ * * ] ( )%/ , / , β β β β α α β α β  = − ≤ ≤ + = −− −2 2 2 2 1

    Intervalo de confianza para el valor esperado de la variable dependiente

     IC E Y ob Y t S Y Y t S i i n Y i i n Y  i i[ ( )] Pr [ * * ] ( )%/ , / ,= − ≤ ≤ + = −− −α α    α 2 2 2 2 1

    Donde:

    S S n

     X X 

     X X 

    i

    i

    ni= +

      −

    =∑

    2 0

    2

    2

    1

    1 ( )

    ( )

     

    Donde X0 es un valor dado para X, pues recordemos que el valor promedio de Y está

    condicionado a un valor de X.

    Pruebas de hipótesis

    Las pruebas de hipótesis son un poderoso instrumento para definir y establecer

    conclusiones generales respecto a una población. El proceso de una prueba de hipótesis

    es el siguiente:

  • 8/9/2019 Econometria Eco Medina

    25/41

     APUNTES DE CLASE

    FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco 

    28

    1) Se deben  formular la hipótesis, que son supuestos que se realizan con respecto al

    verdadero valor poblacional. Decimos hipótesis porque son dos: la nula y la alterna.

    La última apoya a la tesis del investigador y la primera simplemente es lo contrario.

    Se comienza por la hipótesis alterna debido que se conoce la probabilidad de error

    tipo I (α), que surge cuando se rechaza la hipótesis nula siento ésta verdadera; la

     probabilidad de error tipo II (β) no se conoce, éste se genera cuando se acepta lahipótesis nula siendo esta falsa.

    Esto debido a que se supone que existe una distribución de probabilidades para cada

    uno de los parámetros estimados.

     b) Al probar una hipótesis buscamos rechazar la hipótesis nula, lo que permite tener

    evidencia para apoyar el supuesto establecido en la alterna. De esta forma, el

    investigador prefija el nivel de probabilidad de error tipo I, es decir el margen de

    error de rechazar la hipótesis nula siendo verdadera. En definitiva,  fijamos un nivel

    de significancia (  

     ) que está a discreción del investigador.

    c) Para probar la hipótesis se necesario contrastar dos valores, por lo cual se calcula un

    estadístico de prueba con base en el valor del parámetro estimado, sobre el que se

    está realizando la prueba, y en los valores planteados en la prueba de hipótesis (θ).

    d) Una vez obtenido el valor calculado se lo compara con el valor teórico de la

    distribución,  el cual se consulta en las tablas respectivas, utilizando los grados de

    libertad que constan en la tabla anterior.

    e) Se procede a graficar la distribución correspondiente, en ésta es el valor teórico o de

    tablas el que divide a la región crítica (de rechazo de la hipótesis nula) y a la deaceptación de la hipótesis nula. Sobre este gráfico se observa donde cae el valor

    calculado, si en la de rechazo o en la de aceptación.

    Si cae en la región crítica (de rechazo), se procede a concluir  que con el 1- α % deconfiabilidad hay evidencia suficiente para decir que se cumple lo que se enuncia en

    la hipótesis alterna (ojo: no cuando se rechaza la hipótesis nula se acepta

    automáticamente la alterna). Si cae en la de aceptación se concluye que con el 1- α % de confiabilidad se prueba lo que se enuncia en la hipótesis nula.

    Las dos pruebas de hipótesis centrales, fundamentales, y que en todo modelo se deben

    realizar son la de relevancia y la de dependencia, cuyos estadísticos de prueba utilizados

    son los que se presentan a continuación:

    Estadístico de prueba

    (valor calculado)

    Parámetro Prueba de hipótesis Distribución

    t S 

    c

    i

    i

    =  −∃ β θ 

     β 

      βi - Relevancia

    - Específicas

    t (Student) con n-k-1 g l

     F   CMR

    CME c =  

    Razón de

    cuadrados

    - Dependencia glo-

     bal, el modelo es

    “bueno”

    F (Fisher) con k gl para

    el numerador y n-k-1

     para el denominador

  • 8/9/2019 Econometria Eco Medina

    26/41

     APUNTES DE CLASE

    FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco 

    29

     

     Prueba de Relevancia: se refiere a probar la importancia de una variable en la

    explicación del comportamiento de la variable dependiente.

    Si es importante se supone que el coeficiente que la

    acompaña (βi  ) es estadísticamente diferente de cero, por lo

    tanto la prueba de hipótesis planteada es:

    Ho: βi  = 0Ha: βi  ≠  0

    El estadístico de prueba es el que consta en la primera fila de la tabla anterior.

     Prueba de Dependencia Global : se refiere a probar que todas las variables en su

    conjunto explican a la variable dependiente, es

    decir si todos los βi estimados son estadísticamente

    diferentes de cero. La prueba de hipótesis planteada es:

    Ho: β1  = β2  = β3  ... = βk   = 0Ha: β1  ≠ 0, β2 ≠  0, β3 ≠ 0 ... βk  ≠  0

    El estadístico de prueba es el que consta en la tercera fila de la tabla anterior.

    Cuál es el origen del estadístico F? lo deduciremos a partir de la Tabla de Análisis de

    Varianza (ANOVA)

    Fuente devariación

    Grados delibertad (gl)

    Suma de Cuadrados(SC)

    CuadradoMedio (CM)

    F calculado(Fc)

    Regresión 1 SCR =  β 1 ( )( ) X X Y Y i i− −∑   SCR/1Error n-2 SCE = Σei = SCT - SCR SCE/(n-2) CMR/CME

    Total n-1SCT = ( )Y Y i −∑

    2

     SCT/(n-1)

    Análisis de los resultados y forma de presentar el modelo

    Los resultados de un modelo estimado se debe presentar de la siguiente forma:

    Yi = β0 + β1 Xi(Sβ0) (Sβ1)

    t = (tcβ0) (tcβ1)

    R 2 = # %

    Fgl = #

    El análisis de los resultados comienza por la interpretación de los coeficientes

    estimados, tanto por su signo como por su magnitud. Respecto a la última, en una

    regresión lineal éstos reflejan variaciones marginales, es decir cuál será el cambio, en

    términos absolutos, experimentado por la variable dependiente (Y), frente a un cambio

    dado en la variable dependiente (X). El signo mostrara una relación directa o inversa de

    la variable dependiente con respecto a la independiente.

  • 8/9/2019 Econometria Eco Medina

    27/41

     APUNTES DE CLASE

    FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco 

    30

     

    Luego se realizan las dos pruebas de hipótesis centrales mencionadas anteriormente y,

    de ser necesario o interés del investigador, también se hacen pruebas específicas.

    Por ejemplo: se desea estimar un modelo de regresión simple de la demanda del bien X,

     para lo cual se dispone de 12 observaciones de ésta variable y del precio del mismo bien. El resultado obtenido después de correr el modelo en el paquete estadístico TSP es

    como se presenta a continuación:

    Dxi = 25.2686 - 1.061 Pxi

    (0.4194) (0.0338)

    t = (61.25) (-31.35)

    R 2 = 0.9899 = 98.99%

    F1,10 = 982.72

    Interpretemos los coeficientes β0 y β1. β0 =25.2686, representa a la intersección de lalínea de regresión con el eje Y, es decir que cuando X vale cero Y toma éste valor y

    diríamos que si el precio del bien X es cero, la demanda de este mismo bien es de

    25.2686 kilos. β1, en este caso, es la pendiente de la línea de regresión y expresa que siel precio del bien X aumenta (disminuye) en una unidad la demanda disminuye

    (aumenta) en 1.061 kilos, es decir que existe una relación inversa entre las dos

    variables.

    La prueba de hipótesis de relevancia seguiría el siguiente procedimiento:

    1. Ho: β1  = 0 (Px no es relevante para explicar las variaciones de Dx)

    Ha: β1  ≠  0 (Px es relevante para explicar las variaciones de Dx)

    Planteamos así las hipótesis porque si el parámetro en análisis fuera estadísticamente

    (no matemáticamente) igual a cero, la variable Px no influiría de ningún modo en los

    cambios de Dx, pues Yi = β0  + 0 Px.

    2. α = 5%

    3. El estadístico de prueba sería:

    tcS =

      − β θ 

     β 

    1

    1

      ∼ tn-2 gl 

    Donde: β1  = es el estimador , θ = es el valor de la prueba de hipótesis y Sβ1  = es ladesviación típica del estimador.

    =>

    -1.061 - 0

    tc = --------------- ≅ -31.34830.03384

    4. El tt = t α%, n-2 gl  = t 5%, 10 gl (para dos colas)  = 2.228

  • 8/9/2019 Econometria Eco Medina

    28/41

     APUNTES DE CLASE

    FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco 

    31

     

    Es una prueba de dos colas, lo cual se determina con base en el signo establecido

    en la hipótesis alterna, pues no interesa si es mayor o menor que cero, lo

    importante es que sea estadísticamente diferente de cero.

    5. Ahora contrastamos el tc con el tt, observamos que el tc es totalmente superior altt. es decir cae en la zona de rechazo de la hipótesis nula por lo que se pude

    concluir que: con el 95% de confianza hay suficiente evidencia para decir que

    Px si es relevante para explicar a Dx.

    La prueba de hipótesis de dependencia.

    1. Ho: β1  = 0 (no existe dependencia o el modelo no es “bueno”)Ha: β1  ≠  0 (existe dependencia o el modelo es “bueno”)

    Se observa que en este caso la de relevancia coincide con la dependencia por existir una

    sola variable independiente.

    2. α = 5%

    3. El estadístico de prueba sería:

     Fc  CNR

    CME =   ∼ Fk,n-k-1 gl 

    =>

    Fc ≅ 982.72 (según los resultados obtenidos en el TSP)

    4. El Ft = F α%, k, n-k-1 gl  = F 5%, 1, 10 gl = 4.96

    k son los grados de libertad del numerador y n-k-1 los del denominador.

    5. Ahora contratamos el Fc con el Ft, observamos que el Fc es superior al Ft, es

    decir cae en la zona de rechazo de la hipótesis nula por lo que se pude concluir

    que: con el 95% de confianza hay suficiente evidencia para decir que el modelo

    estimado es “bueno” o existe dependencia.

    A Ho R HoR Ho

    A Ho R Ho

    4.96 982.72 F

    f(F)

  • 8/9/2019 Econometria Eco Medina

    29/41

     APUNTES DE CLASE

    FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco 

    32

     

    Una prueba de hipótesis específica es cuando planteamos, por ejemplo, probar que si Pxaumenta en una unidad la demanda no disminuye en 2 unidades.

    1. Ho: β1  = -2 (si Px aumenta en una unidad la demanda disminuye en 2 unidades)Ha: β1  ≠  -2 (si Px aumenta en una unidad la demanda no disminuye en 2 unidades)

    Planteamos así las hipótesis porque:

     β 12

    1= =

     −∆

     Dx

     Px 

    2. α = 10%

    3. El estadístico de prueba sería:

    tcS 

    =  − β θ 

     β 

    1

    1

      ∼ tn-2 gl 

    =>

    -1.061 - (-2)

    tc = --------------------- ≅  27.750.03384

    4. El tt = t α%, n-2 gl  = t 10%, 10 gl (para dos colas)  = ± 1.812

    Es una prueba de dos colas, lo cual se determina con base en el signo establecido

    en la hipótesis alterna, pues no interesa si es mayor o menor que cero, lo

    importante es que sea estadísticamente diferente de cero.

    5. Ahora contrastamos el tc (27.75) con el tt (±  1.812), observamos que el tc

    (27.75) es mayor que tt (+1.812). Es decir cae en la zona de rechazo de lahipótesis nula por lo que se pude concluir que: con el 95% de confianza hay

    suficiente evidencia para decir que si Px aumenta en una unidad la demanda no

    disminuye en dos unidades.

    A HoR HoR Ho

    + 1.812- 1.81227.75

  • 8/9/2019 Econometria Eco Medina

    30/41

     APUNTES DE CLASE

    FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco 

    33

    CAPITULO III

    APUNTES ADICIONALES RESPECTO A

    REGRESION SIMPLE 

    3.1 Por qué es conveniente plantear modelos con intercepto?

    Un modelo sin intercepto se conoce como regresión a través del origen, de tal forma que

    β0 = 0, lo que significa que la línea de regresión pasa por el origen y, por lo tanto, elmodelo quedaría expresado como:

    Yi = β1 Xi + ui

    Es preferible plantear un modelo con intercepto ya que como se observa en el siguiente

    cuadro tiene sus ventajas:

    Concepto Modelo sin intercepto Modelo con intercepto

     Expresión

    matemáticaYi = β1 Xi + ui Yi = β0 + β1 Xi +ui

    Sumatoria de

    los errores

    La sumatoria de los errores no

    necesariamente es igual a cero

    La sumatoria de los errores

    siempre es igual a cero

    Coeficiente de

    determinación

    R 2 puede ser en algunos casos

    negativo

    R 2 siempre es positivo, porque

    asume implícitamente que β0 está presente en el modelo

    R 2 no puede ser adecuado para

    estos modelos

    R 2 si es adecuado

     β 0   No existe Puede no ser estadísticamente

    significativo

    Se evidencia, entonces, que es conveniente plantear siempre un modelo con intercepto,

    ya que si en realidad el intercepto es estadísticamente no significativo se interpretaría

    como una regresión en el origen; en tanto que si es estadísticamente significativo y

     plantemos sin intercepto cometeríamos un error de especificación, es decir se viola el

    quinto supuesto, mencionando con anterioridad.

    Por ejemplo si tenemos 10 observaciones de consumo e ingreso y corremos modelos

    lineales en el TSP, primero con intercepto y luego sin intercepto, obtenemos los

    siguientes resultados:

    Y = 3.64 + 0.0888 X

    (0.6191) (0.0106)

    t= (5.8798) (8.3757)

    R 2 = 0.8976 = 89.76%

    F1,8 =70.152

    Y = 0.144 X

    (0.010)t= (14.32)

  • 8/9/2019 Econometria Eco Medina

    31/41

     APUNTES DE CLASE

    FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco 

    34

    R 2 = 0.4552 = 45.52%

    Observamos que R 2  disminuye drásticamente y, por lo tanto, hay mayor poder

    explicativo con el primero (89.76%). Fc no ha sido posible calcularlo por el supuesto

    que implícitamente el intercepto es parte del modelo. Aunque la variable independiente

    tiene un tc mayor en el segundo modelo que en el primero, se pierden otros parámetrosestadísticos que validan el modelo con mayor certeza.

    3.2 Unidades de escala

    Es importante notar que las unidades de escala afectarán la interpretación de los

    coeficientes obtenidos, en la medida que está sea diferente para la variable

    independiente y para la dependiente. Así, si tenemos el modelo original como:

    Yi = β0 + β1 Xi +ui

    Y los modelos afectados por la escala como:

    Yi* = β0 + β1 Xi* +ui

    Yi* = β0 + β1 Xi +ui

    Yi = β0 + β1 Xi* +ui

    Donde: Yi* = Yi* = a Yi

    Xi* = Xi* = a Xi

    Es decir, las dos variables están afectadas por la misma escala, por ejemplo expresadas

    en miles de sucres (divididas para mil). Utilizando las diferentes expresiones de cálculo para los coeficientes y para los errores estándar, correspondientes, así como para el

    coeficiente de determinación.

     β 11

    2

    1

    1

    2

    1

    = =

    − −

    =

    =

    =

    =

     x y

     x

     X X Y Y 

     X X 

    i i

    i

    n

    i

    i

    n

    i i

    i

    n

    i

    i

    n

    ( ) ( )

    ( )

    ,  β β 0 1= −Y X  

    S  X 

    n x

    i

    i

     β 

    σ 

    0

    2 2

    2=

      ∑∑

    , S  xi

     β 

    σ 1

    2

    2=

    ∑ 

     R r 

     X X Y Y 

     X X Y Y 

    i i

    i

    n

    i i

    i

    n

    i

    n

    2 2 1

    2 2

    11

    = =

    − −

    − −

    =

    ==

    ∑∑

    ( )

    ( ) ( )

    ( ) ( )

    , σ 22

    2=

    ∑ en

  • 8/9/2019 Econometria Eco Medina

    32/41

     APUNTES DE CLASE

    FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco 

    35

     

    Aplicando estas expresiones para calcular los diferentes parámetros se verían afectados

    como se presenta en siguiente cuadro:

    Parámetr 

    oYi* = β0*+ β1*Xi*

    +ui

    Yi* = β0*+ β1*Xi+ui

    Yi = β0*+ β1*Xi*+ui

    β0* a β0  a β0  β0 

    β1* β1  a β1  (1/a) β1 

    Sβ0* a Sβ0  a Sβ0  Sβ0 

    Sβ1* Sβ1  a Sβ1  (1/a) Sβ1 

    S* a S a S S

    R 2* R 2  R 2  R 2 

    En el primer caso, donde, por ejemplo, a las dos variables se las a dividido por mil

    observamos que únicamente el intercepto se ve afectado por lo que se interpretaría

    dividido por mil. Para el segundo caso, donde solo a la variable independiente se la

    expresa en miles, todos los parámetros deberían ser divididos por mil para su

    interpretación. Finalmente, para el último caso en el que se afecta únicamente a la

    variable independiente los resultados del coeficiente de la misma y de su respectivo

    error estándar deberían ser multiplicado por mil para su interpretación.

    Concluiríamos que la escala no afecta los resultados, pero que a la hora de interpretar si

    se debe tener en cuenta este aspecto.

    Qué pasaría si las escalas de medición que afectan a las variables son diferentes?, esto

    es si a la variable independiente se la expresa en miles y la dependiente en millones y

    viceversa.

    Por ejemplo, con las mismas observaciones de consumo e ingreso y con a=5, tenemos

    los siguientes resultados:

    Y = 3.64 + 0.0888 X(0.6191) (0.0106)

    R 2 = 0.8976

    S2 = 0.7370

    Y* = 18.20 + 0.44381 X => β0*= 5*3.64=18.2 ; β1*= 5*0.888 ≈ 0.444 

    (3.095) (0.05298) => Sβ0*=5*0.619≈3.095; Sβ1*=5*0.0106≈ 0.053

    R 2 = 0.8976 => Es igual 

    S2 = 18.4256 => S2*= 25*0.7370 ≈ 18.4256 

    Y = 3.64 + 0.01775 X* => β0*= 3.64=3.64 ; β1*= 0.888/5 ≈ 0.01775 (0.6191) (0.0021) => Sβ0*=0.619≈0.6191; Sβ1*=0.0106/5≈ 0.021 

  • 8/9/2019 Econometria Eco Medina

    33/41

     APUNTES DE CLASE

    FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco 

    36

    R 2 = 0.8976 => Es igual 

    S2 = 0.7370 => S2*= 0.7370≈ 0.7370 

    Y* = 18.2 + 0.888 X* => β0*= 5*3.64=18.2 ; β1*= 0.888 ≈ 0.888 

    (3.095) (0.0106) => Sβ0*=5*0.619≈3.095; Sβ1*=0.0106≈ 0.0106 

    R 2 = 0.8976 => Es igual 

    S2 = 18.4256 => S2*= 0.7370*25≈ 18.425 

    En los resultados anteriores observamos que las estimaciones de la tabla se cumplen, es

    decir que los coeficientes obtenidos son afectados en la medida que la variable

    independiente o la dependiente cambien de escala. 

    3.3. Modelos simples no lineales

    Hasta aquí hemos revisado modelos simples de tipo lineal; sin embargo, es importante

    analizar aquellos no lineales, entre los que tenemos el doblemente logarítmico, lossemilogarítmicos y los inversos.

    3.3.1 Modelo doblemente logarítmico:

    Matemáticamente se expresa como:

    Yi = β0 Xiβ1 e µ 

    Donde e es la base de los logaritmos neperianos o naturales. Este modelos se lo puede

    linealizar utilizando las propiedades de los logaritmos. Así, si aplicamos logaritmos alos dos miembros de la función obtenemos:

    ln Yi = ln β0 + β1 ln Xi + µ 

    Observamos que se convierte en un modelo doblemente logarítmico, pues se estima con

     base en las observaciones de X y de Y, pero no originales sino de sus logaritmos. A esta

    función se la conoce también como Cobb Douglas y es muy importante pues nos

     permite obtener elasticidades directamente, es decir los βs estimados son elasticidades.

    La interpretación correspondiente es que ante un cambio de un 1% (o 100%) de la

    variable X cual es el cambio en términos de porcentaje para la variable Y. Recordemosque en lineal la interpretación de los βs era relativa a las variaciones marginales entérminos de valores absolutos, esto es ante un cambio de 1 unidad de la variables X cual

    es cambio experimentado, en términos absolutos, por la variable Y.

    El supuesto fundamental para aplicar el método de estimación de MCO es que el

    modelo sea lineal en los parámetros más no en las variables, por lo tanto el modelo

     presentado puede estimarse a través de este método.

    Las características:

  • 8/9/2019 Econometria Eco Medina

    34/41

     APUNTES DE CLASE

    FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco 

    37

    - El modelo doblemente logarítmico es una función constante en elasticidades pero

    variable en la pendiente, no así en el lineal donde la pendiente es constante y la

    elasticidad es variable a lo largo de la función.

    - No tiene máximo ni mínimo

    - Compacta la escala de estimación

    Por ejemplo: si tenemos 36 observaciones relativas al ingreso y al consumo y

    estimamos un modelo doblemente logarítmico y uno lineal en el TSP, obtenemos los

    siguientes resultados:

    LCONS = 0.0147954 + 0.98464 LING

    (0.03888) (0.00533)

    t= (0.38066) (184.836)

    R 2 = 0.999 = 99.9%

    F1,8 =34164.38

    CONS = 9.77283 + 0.89974 ING

    (9.6539) (0.005864)

    t= (1.01232) (153.442)

    R 2 = 0.9986 = 99.86%

    F1,8 =23544.3

    La interpretación para el primer modelo sería:

    β1 = 0.98464, significa que si el ingreso aumenta en el 1% (100%) el consumoaumenta, pues el coeficiente es positivo, en el 0.98464% (98.464%). Es

    decir es una elasticidad que debe interpretarse por la magnitud: esinelástica (cambio menos que proporcional); y, por el signo: que

    expresa que es una relación directa.

    β1 = 0.89974, en tanto que en el modelo lineal, significa que si el ingreso aumenta enuna unidad (por ejemplo 1 sucre) el consumo aumenta en 0.89974

    unidades (por ejemplo 0.89974 sucres), pues el coeficiente es positivo.

    Es decir es en este caso representa la propensión marginal a consumir, o

    los cambios marginales en términos absolutos.

    3.3.2 Modelos semilogarítmicos

    Estos modelos solo tienen logaritmos de las observaciones originales en un solo

    miembro de la función sea de X o de Y. Es decir:

    ln Y = β0 + β1 Xi + µ 

    Y = β0 + β1 ln Xi + µ 

    La interpretación de los coeficientes: para el primer modelo se dice cual es el cambio

     porcentual experimentado por Y frente a un cambio en términos de valores absolutos de

    la variable X; éste modelo es muy importante cuando se trata de calcular tasas de

    crecimiento en el tiempo. En el segundo, se interpretara como el cambio experimentado

  • 8/9/2019 Econometria Eco Medina

    35/41

     APUNTES DE CLASE

    FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco 

    38

     por Y en términos da valores absolutos frente un cambio porcentual de la variable

    independiente.

    Explicando con mayor detalle el primer modelo semilog, si recordamos la fórmula de

    interés compuesto tendríamos:

    Yt = Y0 (1+r)t 

    lnYt = ln Y0 + t ln (1+r)

    Ahora si: β0 = ln Y0, y

    β1 = ln (1+r)

    ln Yt = β0 + β1 t

    Agregando el término de perturbación se tiene:

    ln Yt = β0 + β1 t + ut 

    3.3.3 Modelos Recíprocos

    Refleja una relación inversamente proporcional entre la variable independiente y la

    dependiente,

    1

    Y = β0 + β1 + µ 

    X

    Un ejemplo práctico para este modelo es la teoría macroeconómica del empleo.

  • 8/9/2019 Econometria Eco Medina

    36/41

     APUNTES DE CLASE

    FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco 

    39

    CAPITULO IV

    ANALISIS DE REGRESION LINEAL MULTIPLE 

    4.1 Definición y representación general de un modelo múltiple

    El análisis de regresión múltiple, como su nombre lo indica, relaciona una variable

    independiente con dos o más variables independientes. Su importancia radica en que la

    realidad expresada a través de un modelo ya no es tan simplificada, pues en pocas

    ocasiones encontraremos que un fenómeno o comportamiento esté explicado por una

    sola variable; es decir este tipo de modelo, obviamente, tiene mayor poder explicativo.

    En términos generales se lo puede representar como:

    Yi = β0 + β1 X1i + β2 X2i + ... + βk  Xki + µi 

    Expresado en forma matricial:

    Y = β X + µ 

    Donde:

    Y1  1 X11  X21  X31 ... Xn1 µ1 

    Y2  1 X12  X22  X32 ... Xn2 µ2 

    Y = Y3  X = µ =

    Yn  1 X1n  X2n  X3n ... Xnn µn 

    4.2 Supuestos del Modelo

    Los supuestos del modelo de regresión lineal múltiple son los mismo que para el simple,

     pero se agrega uno que es el de la multicolinealidad. Así:

    1. Recordemos que en la estimación de un modelo hay un margen de error, los cuales

     pueden ser positivos o negativos. El valor esperado o promedio estimado de la

    variable dependiente, a través de la regresión muestral estará subestimado o

    sobrestimado con relación al valor poblacional. Por lo tanto, se espera que en promedio los errores sean cero, o el valor esperado de los errores es igual a cero,

    esto es:

     E X i i( / ) = 0

    Intuitivamente significa que los errores cometidos al estimar el modelo no afectan

    sistemáticamente al valor promedio de la variable dependiente, es decir que refleja

    el verdadero valor poblacional.

    2. Que los errores no están correlacionados, es decir que no existe autocorrelación enel modelo, esto es:

  • 8/9/2019 Econometria Eco Medina

    37/41

     APUNTES DE CLASE

    FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco 

    40

     

    Cov (µi, µ j) = 0 (i ≠ j)

    Intuitivamente significa que, por ejemplo, en series de tiempo el pasado no explica

    al presente; en series de corte transversal significa que las variaciones de ingreso en

    un grupo de personas no explican los cambios en el consumo de otro grupo.

    3. Que la varianza es única, o el modelo es homocedástico, esto es:

    Var (µ) = E (µ2) = σ2 

    Intuitivamente significa que el crecimiento (decrecimiento) de la variable

    independiente no afecta o conlleva modificaciones en la varianza del error del

    modelo.

    4. Que las observaciones de la variable independiente no están correlacionadas con el

    error, esto es:

    Cov (Xi, µi) = 0

    5. Las variables independientes no están correlacionadas, es decir que el modelo no

    está afectado por la multicolinealidad, esto es:

    Cov (Xi, X j) = 0 (i ≠ j)

    6. Finalmente, se supone que el modelo está bien especificado. Es decir que, la formafuncional se ajusta a los datos y se han incluido las variables relevantes. Esto

    implica que no cometemos sesgo de especificación.

    Estos supuestos se pueden resumir en:

    µ ∼ N (0, σ2)

    Lo cual significa que, los errores se distribuyen normalmente con media cero y varianza

    σ2.

    Cuando tenemos este tipo de modelo es difícil inferir la forma funcional. En la práctica

    lo que se hace es ensayar diferentes funciones, utilizando la teoría económica.

    El método de estimación que vamos a utilizar es el de MCO, el proceso es el mismo que

    en el modelo simple. Esto es resolvemos un proceso de optimización, minimizamos la

    sumatoria de los errores al cuadrado.

    4.3 Pruebas de hipótesis

    Como en el modelo de regresión lineal simple en el múltiple también tenemos dos

    hipótesis centrales: la de dependencia y la de relevancia.

  • 8/9/2019 Econometria Eco Medina

    38/41

     APUNTES DE CLASE

    FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco 

    41

    Prueba de dependencia

    Esta verifica el efecto conjunto y simultáneo de todas las variables independientes sobre

    la dependiente. Se la conoce también como la prueba de bondad del modelo. Por

    ejemplo si el modelo es:

    Yi = β0 + β1 X1i + β2 X2i + ... + βk  Xki + µi 

    La hipótesis será:

    Ho: β0 = β1  = β2  = ... βk  = 0

    Ha: β0 ≠ 0, β1  ≠ 0, β2  ≠ 0, ... , βk  ≠ 0

    Donde, como se analizó anteriormente, el estadístico de prueba es el Fc.

    Prueba de relevancia

    Esta prueba verifica si cada una de las variables independientes son importantes para

    explicar los cambios de la variable dependiente. Igual que en el modelo de regresión

    simple planteamos la hipótesis de la siguiente forma:

    Ho: βi = 0

    Ha: βi  ≠ 0

    Y el estadístico de prueba es el mismo que en el caso lineal simple, esto es el tc.

    Hipótesis específicas

    Son supuestos que se realizan con respecto a valores determinados de los parámetros

     poblacionales. Por ejemplo, si queremos probar que en una función de producción con

    tres insumos existen rendimientos crecientes, en un modelo como:

    Yi = β0  X1i β1

      X2i β2 X3 

    β3 e u 

    La hipótesis será:

    Ho: β1 + β

    2 + β

    3  ≤  0

    Ha: β1 + β2 + β3  > 0

    En este caso el estadístico de prueba es diferente, así:

    tc s X X 

    t n k gl  =  −

    ≈−

      − −

    λ β θ 

    λ λ 

    '

    ' ( ' ),

    2 11  

    Donde: λ = vector de coeficientes de los βs de la hipótesis; S2 (X’X)-1 = matriz de

    Var-Cov (β)

  • 8/9/2019 Econometria Eco Medina

    39/41

     APUNTES DE CLASE

    FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco 

    42

    4.4 Intervalos de confianza

    Para los estimadores:

     I ob t s X X i n k 

    ( ) Pr [ ' ' ( ' ) ]/ ,

     β λ β λ λ α 

    = ±− −2 1

    2  

    Para la predicción:

     I E Y X ob Xo t s Xo X X Xon k ( ( / ) Pr [ ' ' ( ' ) ]/ ,= ± − − β  α  2 12  

    4.5 Multicolinealidad

    La multicolinealidad se presenta cuando las variables independientes están

    correlacionadas. Es decir se está violando un supuesto y, por lo tanto, las inferencias yano tienen validez.

    Las causas para que se de este problema son: generalmente, los modelos utilizan

    variables sociales y económicas, por lo que casi siempre se va a presentar este

     problema. Es difícil encontrar en la práctica que variables de este tipo no se relacionen

    de ninguna forma. Por lo que se trata de corregir reduciendo este problema, nunca se va

    a eliminar totalmente.

    Se pude decir que existe multicolinealidad perfecta cuando el coeficiente de correlación

    entre variables independientes es igual a 1, en este caso no se puede estimar el modelo

     porque la matriz X es singular o no es de rango completo. También se dice que la

    multicolinealidad es menos que perfecta, en cuyo caso si es posible estimar el modelo

     pero existen problemas de inferencia, por lo que hay que trata de reducirla corrigiendo.

    Para detectar:

    Una forma es encontrando los coeficientes de correlación entre las variables

    independientes, si este es cercano a uno significa que las variables están altamente

    correlacionadas.

    Otra forma es corriendo regresiones entre las variables independientes, esto es que unade ellas es independiente y a la otra (s) como dependiente. Si son relevantes para

    explicar en los modelos, tendremos alta multicolinealidad.

    Para corregir, se podría pensar en eliminar una variable que se causa de la

    multicolinealidad, pero es posible que se genere un sesgo de especificación.

    4.6 Autocorrelación

    La autocorrelación significa que los errores están relacionados. En series de tiempo que

    el pasado explica al presente, en series de corte transversal que el cambio en una

    variable de un grupo afecta a otro grupo. Se presenta más en series de tiempo.

  • 8/9/2019 Econometria Eco Medina

    40/41

     APUNTES DE CLASE

    FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco 

    43

     

    Esta violación de los supuestos tiene consecuencias importantes, por lo que será

    necesario corregirla. Para detectar este problema se puede utilizar el estadístico Durbin-

    Watson y para corregir se utiliza la Ecuación de Diferencias Generalizadas.

    4.7 Heterocedasticidad

    La hetorecedasticidad es la violación del supuesto relativo a que la varianza es única, o

    que el modelo es homocedástico. Significa que a medida que aumenta o disminuye la

    variable independiente, causa de este problema, aumenta o disminuye la varianza de los

    errores.

    Este problema es más frecuente en series de corte transversal. Por ejemplo, cuando

    estamos estimando un modelo de consumo en función del ingreso, para un bien

    especifico y tenemos las observaciones clasificada según estrato económico,

    obviamente dependiendo del tipo de bien, el consumo aumenta en diferente forma para

    cada estrato.

    4.8 Sesgo de Especificación

    Recordemos el último supuesto, tanto del modelo simple como múltiple, que dice que

    un modelo debe estar bien especificado, es decir poseer la forma funcional correcta y

    las variables relevantes. Observamos pues que, la violación de este supuesto conduce a

    un sesgo de especificación que puede estar dado por:

    - Forma funcional inadecuada o que no se ajusta a los datos- Omisión de variables relevantes

    - Inclusión de variables irrelevantes

    - Errores de medición.

    Siendo la omisión de una o más variables relevantes el problema más grave.

    4.9 Proceso para estimar un modelo

    Es importante conocer el proceso de estimación de un modelo, el mismo que debeseguir una secuencia lógica. En este sentido, a continuación se presenta los pasos que,

    según criterio del autor, son los más importantes.

    1. Revisión de la teoría, es el paso fundamental dentro de un proceso de investigación.

    Cuando se está estudiando un fenómeno social o económico, es importante recopilar

    las principales teorías que existen al respecto, las cuales deben ser actualizadas y

    ajustarse a la realidad objeto de estudio.

    2. Con esta teoría se puede definir una relación funcional deterministica. Esto es:

    Y = f (X1, X2, X3, ... Xk )

  • 8/9/2019 Econometria Eco Medina

    41/41

    Es decir, la teoría es la base sobre la que se construye un modelo, contribuye a definir la

    cual es la variable dependiente y cual o cuales las independientes.

    3. Con esta relación determinista procedemos a establecer la relación funcional: lineal,

    cudrática, doblemente logarítmica, etc.. Primero basándonos en la propia teoría para

    luego ensayar las funciones que deducimos se pueden ajustar a los datos y a la teoríay, finalmente, determinar el modelo econométrico.

    Por ejemplo, si la relación más adecuada fuera una lineal tendríamos:

    Yi = β0 + β1 X1i + β2 X2i + ... + βk  Xki + µi 

    4. Se procede a la estimación de la función establecida, observando primero el

    coeficiente de determinación del modelo. Obviamente si éste se acerca más a la

    unidad los datos se ajustan al modelo. De no ser así, se inicia con un proceso

    iterativo, donde ensayamos diferentes tipos de funciones siempre observando el

    estadístico mencionado.

    5. Con estos modelos estimados procedemos a validar el modelo. Para el efecto,

     primero debemos partir siempre del modelo original, no del corregido, para ver si no

    viola ninguno de los supuestos utilizando pruebas de hipótesis y los diferentes

    métodos para detectar estos problemas. Si es así corregimos con los diferentes

    métodos señalados.

    También dentro de la validación se debe analizar si el modelo cumple con lo que se

    espera de acuerdo a la teoría, esto es la magnitud de los coeficientes y los signos. Si no

    cumple estos aspectos existe algún errores y debemos volver al paso 1.

    6. Una vez que tenemos el modelo validado estadísticamente y a través de la teoría

    económica procedemos a: primero interpretar cada uno de los coeficientes estimados;

    y, segundo a hacer pruebas de hipótesis que nos permitan hacer ciertas inferencias,

    de interés, para generalizar las características de la muestra a la población objeto de

    estudio.

    7. Finalmente, según los intereses de la investigación se pueden hacer simulaciones y

    formulación de política económica. Para luego escribir las conclusiones y

    recomendaciones, definidas primero sobre el propósito de la investigación, después

    sobre la facilidad o dificultad de la investigación como tal; y, por último sobre losresultados del modelo, así como sobre su validez.