Upload
paulnaranjo
View
238
Download
0
Embed Size (px)
Citation preview
8/9/2019 Econometria Eco Medina
1/41
APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA
ELABORADO POR:
NANCY MEDINA CARRANCO
2000
8/9/2019 Econometria Eco Medina
2/41
APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco
2
APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA
INTRODUCCION
Actualmente la Econometría es una herramienta de análisis muy importante, inclusive
para leer y entender la nueva teoría económica. Esta aplica métodos estadísticos y
matemáticos al análisis de variables económicas y, sobre todo, a la relación de
dependencia que puede existir entre las mismas.
El objetivo último de este instrumento de investigación es estimar modelos que
permitan captar el comportamiento de los individuos, fenómenos económicos o
sociales, etc., a fin de predecir y hacer simulaciones sobre los mismos para establecer
políticas económicas adecuadas, a nivel macroeconómico, políticas respecto a la
empresa, a nivel microecnómico, proyecciones, etc..
Por ejemplo, contribuiría a establecer cuál debería ser el precio mínimo o volumen de
producción mínimo de una empresa, para lo cual se tomarían datos de las principales
variables que determinan el comportamiento de la demanda del bien que se generaría
con el proyecto, para luego definir un flujo de beneficios, sobre el que se haría un
análisis de sensibilidad y/o riesgo.
Si se desea inferir la valoración de un recurso natural que no tiene precio, se podría
modelar el comportamiento de los individuos respecto a sus preferencias, de tal forma
que después de hacer las manipulaciones matemáticas necesarias se llegue a un
resultado del cambio en el bienestar de la población afectada en términos monetarios,
utilizando para ellos aproximaciones como la variación compensada, la variación
equivalente, el excedente del consumidor, etc..
En la evaluación y formulación de proyectos se puede utilizar a la econometría para
proyectar la oferta y la demanda del bien que se generaría con los mismos. Para el
efecto, se estiman las funciones pertinentes utilizando las variables relevantes que
explican su comportamiento, una vez estimada se realizan las predicciones directamente
o través de tasas de crecimiento calculadas con base en las elasticidades (modelo
doblemente logarítmico) y variaciones porcentuales de las variables que convenga.
En economía agrícola si se trata de proyectar la producción o encontrar el óptimo físicoy económico es fundamental estimar funciones de producción y de costos, basadas en
datos de producción e insumos (mano de obra, tierra, capital, etc.), que permitirían
plantear en términos prácticos el problema del productor: la maximización de
beneficios.
En realidad, sería interminable citar ejemplos donde se puede utilizar a la econometría
como herramienta de análisis básico.
El propósito fundamental del análisis econométrico es hacer inferencias de una muestra
hacia la población, esto es generalizar resultados. Para el efecto se requiere que el
modelo estimado sea válido, es decir que cumpla con los supuestos y esté acorde con lateoría económica, por lo que una vez obtenidas las estimaciones se hacen pruebas de
8/9/2019 Econometria Eco Medina
3/41
APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco
3
diagnóstico. Si los signos y magnitud de los parámetros estimados no están acordes con
la teoría es necesario analizar el origen de estos resultados para corregir los posibles
errores cometidos, para reformular o refutar una teoría, si ésta no se puede aplicar a
nuestra realidad.
Concepto y Objetivos de la Econometría
Existen diversos conceptos de econometría, a manera de ejemplo citaremos dos que
recogen los elementos fundamentales de esta ciencia:
Gerhard Tinter dice que, la econometría es el resultado de la adopción de una posición
sobre el papel que juega la economía, consiste en la aplicación de la estadística
matemática a los datos económicos con el objeto de proporcionar no solo un apoyo
empírico a los modelos construidos por la economía matemática, sino una forma de
obtener resultados numéricos.
P. A. Samuelson define a la econometría como el análisis cuantitativo de los fenómenos
económicos reales basados en el desarrollo simultáneo de la observación y la teoría,
relacionados a través de apropiados métodos de inferencia.
Tratando de construir una definición que considere algunos criterios de diferentes
autores diríamos que la econometría es parte de los métodos cuantitativos de la
economía, combina métodos matemáticos y estadísticos en la estimación de un modelo,
el cual se ha establecido con base en la teoría económica que indica la relación de
dependencia entre variables y debe ser validado utilizando a la inferencia estadística
(pruebas de hipótesis) y contrastándolo con el enunciado de la teoría que se ha utilizado.
Se puede decir que la econometría, por lo tanto, se resumen en cinco etapas:
especificación, estimación, verificación predicción y recomendaciones de política.
El objetivo de la econometría es verificar y establecer la relación de dependencia entre
una variable dependiente y una o más variables independientes, a fin de obtener una
función que permita realizar predicciones, formulación de políticas y simulaciones.
Metodología
Para explicar la metodología utilizada por la econometría es necesario primero definir lo
que es un modelo.
Un modelo es una representación simplificada de un fenómeno económico o de la
realidad a través de una(s) función(es) o ecuación(es). Cuando decimos que la
producción de un bien depende del costo de los insumos, estamos resumiendo el
fenómeno de la producción para un determinado bien.
Explicitando los pasos que debe seguir un análisis econométrico se citaría los
siguientes puntos:
8/9/2019 Econometria Eco Medina
4/41
APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco
4
1. Consultar, en lo posible, toda la teoría existente con respecto al fenómeno que se
desea analizar. Esto permite definir las variables (dependiente e independiente(s)) y
su comportamiento en la explicación de un fenómeno, dando cuenta de la relación
funcional.
2. Con los resultados del paso anterior definimos una relación determinística entrevariables, esto significa que establecemos que los cambios en una de ellas se
atribuyen o están explicados por modificaciones en una o más variables, sin dejar
margen para un error. Es decir:
Y = f (Xi) (i = 1, 2, 3 ... n)
3. Con esta relación definimos la forma funcional que tendría. Para el efecto, se
utilizan varios métodos como el diagrama de dispersión, en el caso de un modelo
que tiene una sola variable dependiente, o simplemente ensayamos diferentes
formas funcionales (cuadrática, cúbica, logarítmica, etc.) y verificamos cual es la
que mejor se ajusta a los datos; por supuesto que la teoría también sugiere formas
funcionales, por ejemplo los rendimientos marginales decrecientes expresan que
una función de producción no sería lineal. Si, para el ejemplo, la forma funcional
adecuada es una lineal tendríamos:
Y = β0 + β1 X
4. El modelo anterior es matemático o determinístico y hay que convertirlo a
econométrico, para lo cual lo único que se debe hacer es agregarle el término de
error, perturbación aleatoria o “canasta aleatoria”. Esto se debe a que,
generalmente, cuando trabajamos con variables económicas y sociales siempre hay
riesgo de cometer errores de medición; por otro lado, algunas variables son difícilesde cuantificar, o simplemente porque dada la definición misma de modelo y de su
característica de que éste debe ser parsimonioso, no se incluyen todas las variables;
a lo cual adicionaríamos los posibles errores en la forma funcional. El primer
aspecto se evidencia cuando preguntamos, por ejemplo, cuál es el ingreso mensual
de una persona, ésta nunca nos contesta con la verdad, hay tendencia a sobre o
subestimar.
Es esta la razón para decir que es una “canasta aleatoria”, porque contiene a todos
los errores que fuere posible cometer. La aleatoriedad se debe a que hay la
probabilidad y no la certeza de cometer una margen de error determinado; y, de que
sus resultados no siempre se cumplan. En el ejemplo, el modelo econométricoquedaría expresado como:
Y = β0 + β1 X + µ
5. Con este modelo nos servimos de procedimientos matemáticos y estadísticos para
la estimación, los que se concretan en métodos básicos como: Mínimos Cuadrados
Ordinarios (MCO), Máxima Verosimilitud (MV), Momentos, etc., los mismos que
serán explicados posteriormente.
6. Una vez estimado el modelo procedemos a validarlo contrastándolo con la teoríaeconómica para verificar si resultaron los signos esperados y las magnitudes
8/9/2019 Econometria Eco Medina
5/41
APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco
5
previstas; adicionalmente verificamos si se cumplen o no los supuestos, que se
resumen en la normalidad de los errores. Si una de las dos cosas falla significa que
hubo algún error en la estimación y tenemos que volver a reiniciar todo el proceso
hasta obtener un modelo adecuado a la realidad.
7. Con el modelo validado procedemos a aplicarlo, ya sea para predicciones oformulación de política económica, básicamente.
Cabe anotar que, los elementos de un modelo son: las ecuaciones, las variables y los
parámetros.
Las ecuaciones relacionan variables y pueden ser:
- de comportamiento, cuando reflejan la conducta de diferentes agentes;
- de definición, reflejan identidades contables;
- tecnológicas, como las funciones de producción que expresan una técnica para
producir;
- institucionales, reflejan la voluntad política de los agentes rectores de una economía
(impuestos, oferta monetaria, etc.); y,
- de equilibro, por ejemplo las de oferta y demanda en un sistema de ecuaciones,
donde no habría solución sin éstas.
Las variables son aquellas que cambian de valor en diferentes observaciones. En un
modelo éstas pueden ser:
- endógenas, que se determinan dentro de un modelo. Generalmente, las conocemos
como dependientes; y,- exógenas, que se determinan fuera del modelo. Se las conoce como independientes o
explicativas.
Los parámetros son valores fijos. En un modelo son los coeficientes que están ligados
con la(s) variable(s) independiente(s) y son los que precisamente se trata de encontrar a
través de su estimación.
Los modelos pueden ser de diferente tipo, entre los cuales tenemos:
- Uniecuacionales, cuando existe una sola ecuación;
- Multiecuacionales, cuando tenemos más de una ecuación (modelos de ecuacionessimultáneas);
- Dinámicos, cuando se incluye la variable tiempo; y,
- Estáticos, cuando se utilizan para explicar un fenómeno en un determinado momento
del tiempo.
El proceso para el análisis econométrico se resume en el siguiente diagrama de flujo:
8/9/2019 Econometria Eco Medina
6/41
APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco
6
Inferencia Estadística
Para hacer investigación es necesario familiarizarse con métodos cuantitativos que
permitan hacerla más efectiva.
La estadística comprende dos ramas fundamentales: la Estadística Descriptiva y la
Inferencia Estadística. La primera se ocupa de la recopilación, organización y
presentación de los datos. La segunda trata del desarrollo de los métodos de la teoría
estadística (aplicación), a fin de hacer generalizaciones de una parte (muestra) a un todo
(población).
TEORIA ECONOMIA
Revisión, análisis y definiciones
MODELO MATEMATICO
Determinístico
MODELO ECONOMETRICO
Probabilístico
ESTIMACION DEL MODELO
Métodos matemáticos y estadísticos
VALIDACION DEL MODELO
Viola los supuestos?
Está acorde con la teoría?(signos y valores esperados)
ES ADECUADO? NO
SI
PREDICCIONES, PROYECCIONES
FORMULACION DE POLITICAS
PRUEBAS DE HIPOTESIS
Aplicaciones de la teoría a la realidad
DATOS
8/9/2019 Econometria Eco Medina
7/41
APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco
7
La econometría utiliza a la inferencia estadística. La estadística descriptiva le interesa
solo en la medida que ciertos resultados (estadísticos) resumen diferentes
características de los datos (media, desviación estándar).
La diferencia entre estadística descriptiva e inferencia consiste en que, en el ámbito de
la primera los resultados obtenidos con los datos son un fin en sí mismo, mientras queen la segunda son solo un instrumento de análisis.
Conceptos básicos
Población.- se define como el conjunto de todas las observaciones (datos) posibles,
medidas o resultados.
Muestra.- conjunto de datos, medidas o resultados seleccionados a partir de la muestra.
Generalmente, en econometría para la estimación de modelos utilizamos muestras
obtenidas de acuerdo a algún mecanismo causal determinado, que se denomina
probabilístico.
Tanto las muestras como las poblaciones se describen a través de sus características
numéricas, que en el caso de una población se denominaran parámetros y en el de una
muestra estadísticos (medidas resumen).
Dado que la estadística se interesa por los fenómenos que pueden ser medidos o
contados es necesario conocer lo que es una variable y un atributo.
Variable.- es aquella que toma diferentes valores en distintas observaciones.
Atributo.- cuando el fenómeno no puede medirse pero si contarse. Un atributo es la
presencia o ausencia de una característica determinada. Por ejemplo: sexo (masculino o
femenino), educación (primaria, secundaria, superior), etc.
Constante.- como su nombre lo indica es aquella que no cambia de valor de una
observación a otra.
Variable estocástica o aleatoria.- sus valores no pueden ser determinados antes de ser
observados, ni controlados totalmente. Se caracterizan por tomar diferentes valores con
probabilidades diferentes a la unidad.
Variable no aleatoria.- la que es totalmente controlable o al menos se puede predecir
totalmente.
Variable continua.- es aquella que toma cualquier valor sobre la recta numérica. Ej:
tiempo, ingreso, temperatura, gasto, etc.
Variable discreta.- toman solo ciertos valores de la recta numérica, los mismos que
están separados por intervalos de igual longitud. Ej: número de hijos, número de puntos
obtenidos al lanzar un dado, etc.
8/9/2019 Econometria Eco Medina
8/41
APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco
8
Distribución de frecuencias (muestra) y de probabilidades (población).- es la
ordenación de datos de tal forma que se indique el número de observaciones
correspondientes a cada valor de la variable (discreta) o de cada intervalo de valores de
la variable (continua).
Naturaleza de la Inferencia Estadística
La inferencia se dedica a efectuar generalizaciones respecto a una población, con base
en la información proporcionada por la muestra.
Lo que hace a la aplicación de la inferencia un método científico es el hecho de que se
toma en consideración la selección de la muestra y que expresa los resultados en
términos de probabilidades.
El objetivo del muestreo y de todo lo relacionado con la inferencia es efectuar juicios
acerca de los parámetros de la población, basados en los estadísticos de la muestra.
Los juicios son pronósticos dotados de cierto grado de confianza y pueden ser de dos
tipos:
1. Se refiere a la estimación de un parámetro, es decir estimadores (información
resumida) que nos son más que fórmulas que describen un procedimiento para
efectuar conjeturas acerca del valor de un determinado parámetro.
2. Se refiere a la contrastación de una hipótesis respecto a un parámetro. Esto implica
un supuesto previo respecto al valor del parámetro, para lo cual utilizamos un
estadístico de prueba.
Distribuciones Muestrales
La forma de saber en que medida se puede confiar en un pronóstico es conocer la
conducta de la variable de análisis en todas las muestras posibles. Pues, se supone que
existe un proceso desconocido que genera los datos, el cual se describe por medio de
una distribución de probabilidades, que se caracteriza por algunos parámetros
desconocidos.
Estimador Perfecto
Es aquel que no tiene posibilidad de error. En otras palabras, su distribución muestral se
concentra en un solo punto y éste coincide con el valor que se estima. Pero estos son
infrecuentes dadas las características de las mediciones o datos.
Sin embargo, para que los estimadores sean al menos buenos debe tener ciertas
propiedades deseables:
Insesgado.- es cuando la distribución muestral tiene una media que es igual al parámetro
estimado, pues proporciona el resultado perfecto en promedio.
8/9/2019 Econometria Eco Medina
9/41
APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco
9
Eficiente.- se refiere a la distancia entre los valores estimados y el promedio de la
distribución, es decir al grado de dispersión entre los estimadores y el promedio que no
es más que deben tener la varianza mínima.
Consistentes.- referido a que a medida que se aumenta el tamaño de la muestra la
distribución tiende a concentrarse más alrededor del promedio.
Comentarios Finales
La econometría se puede utilizar en el estudio y análisis de una variedad de fenómenos
económicos, sociales, políticos, etc., lo cual demuestra la importancia que tiene el
manejo de este instrumento para, en particular, un economista.
Se puede observar que para que la econometría genere resultados válidos es necesario
entrar en un proceso iterativo hasta llegar a un modelo adecuado a la realidad.
8/9/2019 Econometria Eco Medina
10/41
APUNTES DE CLASEFUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco
10
CAPITULO I
ANALISIS DE CORRELACION
En este capítulo estudiaremos un tipo de análisis muy importante dentro del proceso de
estimación de un modelo econométrico, el de correlación.
1.1 Definición e Interpretación
El análisis de correlación busca medir o cuantificar el grado de asociación lineal entre
variables continuas, sin tener en cuenta cual de las dos es la dependiente o
independiente. Este análisis utiliza como herramienta básica el coeficiente de
correlación (ρ en términos poblacionales y r en términos muestrales), que se lo puedeinterpretar por su signo y magnitud.
Por su magnitud.- el coeficiente de correlación puede tomar valores entre más 1 y
menos 1, es decir que el límite mínimo es -1 y el límite máximo es+1. Obviamente, mientras más se acerca a uno (valor absoluto)
existe un mayor grado de asociación lineal entre variables y mientras
más se acerca a cero es evidente que no existe este tipo de relación.
Por su signo.- como habíamos mencionado el coeficiente de correlación puede
tener valores positivos y negativos. Si el coeficiente tiene signo
negativo se puede decir que existe una relación lineal inversa entre
las dos variables y si es positivo se dice que existe una relación
lineal directa entre las variables.
Para calcularlo se utiliza la fórmula:
r
X X Y Y
X X Y Y
i i
i
n
i i
i
n
i
n=
− −
− −
=
==
∑
∑∑
( ) ( )
( ) ( )
1
2 2
11
Donde nos damos claramente cuenta que es el numerador el que determina el sigo de r.
1.2 Características
El coeficiente de correlación tiene las siguientes características:
1. Sus valores están entre -1 y +1;
2. Maneja a las variables simétricamente, esto es que considera tanto a X como Y
como aleatorias y no las diferencia entre dependiente e independiente;
3. Si su resultado fuera 0, significa que no existe relación lineal alguna entre las
variables;
4. Si su resultado fuera 1, significa que existe una asociación lineal perfecta entre las
dos variables; y,5. Es la relación entre la covarianza entre X e Y y las varianzas de X y de Y.
8/9/2019 Econometria Eco Medina
11/41
APUNTES DE CLASEFUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco
11
Las principales Ventajas de este coeficiente es que es fácil de medir y de interpretar,
todos los paquetes estadísticos lo proporcionan y la escala no afecta al resultado. El
limitante es que solo mide la relación lineal entre dos variables.
1.3 Aplicaciones
Este tipo de análisis es muy importante para verificar si existe o no alguna relación
lineal y si ésta es positiva o negativa. Por ejemplo, si se desea ver si se cumple: la ley de
la demanda, interesa observa si existe una relación inversa entre la cantidad demandada
y el precio; la ley de la oferta, se trata de ver si hay una relación directa entre la
cantidad ofertada y el precio, etc.
Para el efecto, se deben hacer pruebas de hipótesis1 respecto al coeficiente de
correlación poblacional, tanto en la nula como en la alterna, con un nivel de
significancia. El estadístico de prueba útil en este caso es:
t r n
r t n=
− −
−≈ −
2
1 22
θ
Este estadístico tiene una distribución aproximadamente normal, en muestras pequeñas
se distribuye con una t de student con n-2 grados de libertad, es decir que se debe
contrastar con el valor teórico de esta distribución, de acuerdo al nivel de significancia
seleccionado.
El proceso para hacer una prueba de hipótesis se puede describir en los siguientes
pasos:
1. Planteamos la hipótesis nula y la hipótesis alterna2 que, en este caso, se refiere a si
existe o no una la relación lineal, o al verificación de una relación directa o inversa
entre dos variables. Es decir:
Ho: ρxy = 0 (no ∃3 relación o asociación lineal entre las variables X y Y)
Ha: ρxy ≠ 0 (∃ relación o asociación lineal entre las variables X y Y)
Ho: ρxy ≤ 0 (no ∃ una relación o asociación lineal directa entre X y Y)Ha: ρxy > 0 (∃ una relación o asociación lineal directa entre las variables X y Y)
Ho: ρxy ≥ 0 (no ∃ una relación o asociación lineal inversa entre X y Y)Ha: ρxy < 0 (∃ una relación o asociación lineal inversa entre las variables X y Y)
2. Definimos un nivel de significancia4 (α) dependiendo del error tipo I que se prevécometer. Generalmente, se utiliza el 5%, pero su valor es establecido por el
investigador.
1 / Una hipótesis es un supuesto que se hace con respecto al verdadero valor poblacional.
Una prueba de hipótesis no es más que la contrastación del valor muestral con el poblacional, para
realizar inferencias con respecto al último.2 / Para una definición y discusión de estos conceptos véase el Apéndice 1.1.
3 / ∃ = existe
8/9/2019 Econometria Eco Medina
12/41
APUNTES DE CLASEFUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco
12
3. Se evalúa el estadístico de prueba o valor calculado, el cual simplemente es una
fórmula que incluye el parámetro sobre el que se está realizando la prueba de
hipótesis, en términos muestrales (r), y que tiene la distribución de probabilidades
que se presume tiene el parámetro poblacional. En este caso se supone que tiene
una distribución aproximadamente normal, para muestras pequeñas se asume unadistribución t de student. La fórmula pertinente es la que se presentó anteriormente.
4. Buscamos el valor teórico, o el que le corresponde en la distribución de
probabilidades, en la tabla correspondiente (distribución normal o t-student),
considerando los grados de libertad, en este caso 2 porque perdemos dos valores al
calcular las medias utilizadas para estimar r.
5. Finalmente, contrastamos el valor calculado con el teórico sobre un gráfico de la
distribución correspondiente, la cual se dividirá en una región crítica, o de rechazo
de la hipótesis nula, y en una región de aceptación de la misma.
Por ejemplo, en una empresa de comercialización de enciclopedias el salario de sus
ejecutivos de ventas se relaciona directamente con el volumen de ventas logrado en un
período determinado. Se desea verificar esta proposición para los siguientes datos
disponibles:
Salario (Y)
(cientos de dólares)
Ventas (X)
(número de enciclopedias)
4 30
6 30
5 407 50
7 60
1. Ho: ρxy ≤ 0 (no ∃ una relación o asociación lineal directa entre X y Y)Ha: ρxy > 0 (∃ una relación o asociación lineal directa entre las variables X y Y)
2. α = 5%
3. Calculamos el estadístico de prueba -> t calculado (tc)
t cr n
r t n=
− −
−≈ −
2
1 22
θ
Para el efecto, necesitamos el valor de r que lo obtenemos con la fórmula:
4 / Para entender de mejor forma este concepto véase el Apéndice 1.1.
8/9/2019 Econometria Eco Medina
13/41
APUNTES DE CLASEFUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco
13
r
X X Y Y
X X Y Y
i i
i
n
i i
i
n
i
n=
− −
− −
=
==
∑
∑∑
( ) ( )
( ) ( )
1
2 2
11
=>
Y X Yi - Y Xi - X (Xi - X)(Yi -Y) (Yi -Y)2 (Xi -X)
2
4 30 -1,8 -12 21,6 3,24 144
6 30 0,2 -12 -2,4 0,04 144
5 40 -0,8 -2 1,6 0,64 4
7 50 1,2 8 9,6 1,44 64
7 60 1,2 18 21,6 1,44 324
Sumatorias( ) 29 210 52 6,8 680
Promedios Y = 5.8 X = 42
Aplicando la fórmula encontramos que r = 0,764705882.
Cómo se interpreta este valor?. Su signo es positivo por lo que se diría que existe una
relación directa entre el salario percibido por un vendedor y el volumen de ventas que
logra el mismo. Por su magnitud, el grado de asociación lineal entre las variables es del
76.5%, aproximadamente, que significa que existe asociación lineal entre las variables.
Conocemos que n = 5 y θ = 0 (θ es el valor de la hipótesis).
Calculamos tc:
t c = − −
−=
0 76471 5 2 0
1 0 764712 05548
2
.
( . ).
4. tt (t teórico) = t 5%, 5-2 gl (para una cola) = 2.353
Observemos que hemos puesto el valor teórico de t con el 95% de confianza y 3
grados de libertad para una cola. 95% porque el nivel de significancia α = 5% y el
de confianza es simplemente 1- α. Una cola (y derecha) porque en la hipótesisalterna decimos que el valor de el coeficiente de correlación debe ser mayor que
cero para que se cumpla esta hipótesis.
5. Contrastamos el estadístico (tc) con el teórico (tt), el último valor es el que define
la región crítica y la de aceptación.
8/9/2019 Econometria Eco Medina
14/41
APUNTES DE CLASEFUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco
14
Con esta contrastación concluimos:
Como el tc está a la izquierda del tt, es decir en la región de aceptación de la
hipótesis nula (A Ho) (no existe una relación directa entre salario y ventas), se
puede decir con el 95% de confiabilidad que no existe una relación directa
(positiva) entre el salario y las ventas.
Cabe señalar que, cuando empezamos a plantear un modelo econométrico se debe
efectuar análisis entre las variables para observar si existe o no relación entre ellas, de
tal forma que la incorporación de una variable en un modelo esté sustentada. El
coeficiente de correlación contribuye a definir la existencia o no de una asociación
lineal entre dos variables de tipo continuo.
Cuando se trata de variables categóricas, o de combinaciones entre categóricas y
continuas se debe utilizar otro tipo de análisis, tales como el de contingencia.
Por ejemplo, si disponemos de datos relativos al número de personas por estratos (bajo,
medio y alto), quienes a su vez están divididas por el tipo de ingreso que perciben (bajo,
medio y alto), como se indica en la siguiente tabla.
TABLA DE DATOS
Ingresos Total
Estrato Bajo Medio Alto
Bajo 10 7 6 23
Medio 9 11 12 32
Alto 7 9 15 31
Total 26 27 33 86
Así, la columna total significa que en el grupo donde se ha levantado la encuesta existen
23 personas de estrato bajo, 32 de medio y 31 de alto. De las 23 personas de estrato
bajo, 10 tienen ingreso bajos, 7 medio y 6 altos, dentro de su estrato, y así
sucesivamente. Se trata de establecer si existe alguna relación entre el estrato y el nivel
de ingreso, para lo cual se debe calcular el estadístico de prueba Xc, debido a que tiene
una distribución Chi-cuadrado, a través de la fórmula:
X cO e
e
i j i j
i j ji
= −
∑∑( )2
Donde Oij es el valor observado y eij es el valor esperado, de la frecuencia.
Construimos una tabla de contingencia, como se presenta a continuación:
02.3532.055
A HoR Ho
8/9/2019 Econometria Eco Medina
15/41
APUNTES DE CLASEFUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco
15
Ingresos Total
Estrato Bajo Medio Alto
Bajo 10 26*23/86 7 27*23/86 6 3*23/86 23
Medio 9 26*32/86 11 27*32/86 12 33*32/86 32 Alto 7 26*31/86 9 27*31/86 15 33*31/86 31
Total 26 27 33 86
Donde, en cada celda se encuentra el valor observado (Oij), primer número, y el valor
esperado (eij), segunda expresión. A continuación calculamos los eij en la siguiente
tabla:
Estrato ei,1 ei,2 ei,3 e1,j 6,953 7,221 8,826
e2,j 9,674 10,047 12,279
e3,j 9,372 9,733 11,895
Por último procedemos a calcular cada elemento de la fórmula mencionada
anteriormente y Xc, como se observa en la siguiente tabla:
(Oi,1-(ei,1))2 (Oi,2-(ei,2))
2 (Oi,3-(ei,3))
2
(O1,j-(e1,j))2 1,33476 0,00676 0,90463
(O2,j-(e2,j))2 0,04701 0,09049 0,00634
(O3,j-(e3,j))2 0,60038 0,05514 0,81030
Xc 3,85583
Ahora realizamos la prueba de hipótesis:
1. Ho: X 2= 0 (no ∃ relación entre estrato y nivel de ingreso)Ha: X 2 ≠ 0 (∃ relación entre estrato y nivel de ingreso)
2. α = 5%
3. Calculamos el estadístico de prueba -> Xc
Xc = 3,85583 ∼ X 2 (i-1)*(j-1) gl
4. Xt (X teórico) = X 5%, 4 gl (para una cola) = 9.48773
Observemos que hemos puesto el valor teórico de X con el 95% de confianza y 4
grados de libertad, que se obtiene de (i-1)*(j-1) = (3-1)*(3-1)= 4.
5. Contrastamos el estadístico (Xc) con el teórico (Xt), el último valor es el que define
la región crítica y la de aceptación.
8/9/2019 Econometria Eco Medina
16/41
APUNTES DE CLASEFUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco
16
Con esta contrastación concluimos:
Como el Xc está a la izquierda del Xt, es decir en la región de aceptación de la
hipótesis nula (no existe relación entre el nivel de ingresos y el estrato), se puede
decir con el 95% de confiabilidad que no existe relación entre el nivel de ingreso y
el estrato.
Observemos que la Chi-cuadrado ( X 2) tiene una forma diferente a la distribución t y
normal, pues relaciona un cuadrado con otro número, por lo que nunca puede ser
negativa y no es simétrica.
3.86
A HoR Ho
9.488 X 2
f( X 2)
8/9/2019 Econometria Eco Medina
17/41
APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco
20
CAPITULO II
ANALISIS DE REGRESION
En este capítulo estudiaremos el análisis de regresión como base fundamental para la
formulación de un modelo.
1.1 Análisis de correlación versus análisis de regresión
El análisis de regresión se utiliza para establecer una relación de dependencia o
funcional, lo cual requiere la definición de una función. Es decir que, mientras el
análisis de correlación mide el grado de asociación lineal, el análisis de regresión va
más allá, busca definir la relación de dependencia de una variable con otra(s).
Por otro lado, en tanto que el análisis de correlación maneja a las variables
simétricamente (las dos son aleatorias), el de regresión lo hace asimétricamente, lo cual
es uno de los supuestos básicos de un modelo, es decir supone que la variabledependiente es aleatoria y la(s) independiente(s) no aleatoria(s) o dada(s), fija(s) o
predeterminada(s). Se observa que este análisis diferencia cuál es la variable
dependiente y cuál es la independiente.
Con el análisis de regresión ya nos introducimos en el mundo de los modelos
econométricos.
Históricamente el concepto de regresión se lo atribuye a Galton, quien observó que la
estatura de los hijos de padres altos era baja y que la de hijos de padres bajos era alta,
pero que en promedio se tendía a un valor determinado o promedio.
En el análisis de regresión estimamos el valor medio de la variable dependiente con
base en valores “fijos” de la variable(s) independiente(s), es decir que se puede decir
que la función de regresión es la unión de las medias condicionales dado un valor
determinado de la variable independiente.
Gráfico No. 1
Consumo (X)
Ingreso (Y) E(Y\X) = f(X)
150000 500000
E(Y\X=500000
8/9/2019 Econometria Eco Medina
18/41
APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco
21
En el Gráfico No. 2 observamos una regresión lineal simple. La linealidad puede estar
dada desde el punto de vista de los parámetros y de las variables. En este documento
vamos a trabajar siempre con la linealidad en los parámetros.
1.2 Función de regresión lineal poblacional (FRP) y muestral (FRM)
Gráficamente:
Gráfico No. 2
x
x
x
x
x x
Observamos que a cada valor de X le corresponde un valor promedio de Y. La línea
Y=β0 + β1X se conoce como línea o función de regresión poblacional (FRP), que no esmás que la unión de los valores promedios de Y o de las esperanzas1 condicionales2 de
Y dado un Xi, con base en los valores poblacionales observados. Es decir, es el valor
medio que toma Y dado un valor para X, que en términos matemáticos se representa
como:
E(Y/Xi)= β0 + β1X
Pero como las estimaciones se realizan con base en muestras y no poblaciones, lo que
vamos a obtener es una función de regresión muestral (FRM). Esto debido a que,
generalmente, no se cuenta con los datos poblacionales: para las series de tiempo
muchas veces se dispone de una datos limitados en el tiempo; para series de corte
transversal, ya sea por costos o tiempo, tampoco se dispone de todas las observaciones
correspondientes a la población.
Generalmente, cuando se trata de tomar datos directamente se hace un muestreo que puede ser aleatorio, estratificado, etc., debido a que el tiempo, así como los recursos,
para el levantamiento de una encuesta son limitados. Es más, dependiendo del tipo de
cálculo que se utilice para determinar el tamaño de la muestra, con anticipación nos
fijamos un nivel de error y de confiabilidad.
Actualmente, se define a la regresión simple como el establecimiento de una relación
funcional entre la variable independiente y la(s) dependiente(s).
1
/ El valor esperado de una variable no es más que un promedio ponderado, donde las ponderacionescorresponden a las probabilidades de que tome determinados valores.
2 / La esperanza condicional es el valor promedio condicionado a una determinada probabilidad.
Y
X
Y = β0 + β1X (FRP)
x1 x3x2
Y= 0 + 1X FRM
8/9/2019 Econometria Eco Medina
19/41
APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco
22
La importancia de este tipo de análisis se observa en las aplicaciones de sus resultados,
que como hemos mencionado hacen posible realizar simulaciones, formulación de
políticas y predicciones, entre las principales.
Ahora que, al predecir con la FRP cometemos un error µi, que es la diferencia o
distancia existente entre el valor medio poblacional estimado para Y y el valorobservado para la misma variable. En este sentido, se puede decir que un modelo de
regresión simple es una relación funcional entre una variable independiente y una
dependiente, quedaría expresado como:
E(Yi/Xi) = β0 + β1 Xi + µi
En tanto que, si predecimos con la FRM cometemos un error ei, que es un estimado
considerado como la distancia existente entre la FRM y la FRP, es decir:
E(Yi/X
i) = β
0 + β
1 X
i + e
i
Entonces, tendríamos:
Valores estimados
de la muestra
Valores
poblacionales
FRM FRP
β0 β0 β1 β1 ei ui
Yi E(Yi\Xi)
Características de la línea de regresión
1. Pasa por los puntos formados por las observaciones de X y los valores promedio
condicionales de Y ( X , Y);2. La media de los valores estimados es igual a la media de los valores observados
Y=Y; y,
3. La sumatoria de los errores estimados es igual a cero Σei = 0
1.3 Método de estimación de la FRM
Una vez definida la función se procede a estimar el modelo. Para el efecto existen
diferentes métodos, entre los cuales el más conocido y el que utilizaremos en los
primeros capítulos es el de Mínimos Cuadrados Ordinarios (MCO).
Como observamos en el Gráfico No. 2, el valor promedio de Y no corresponde
exactamente al valor poblacional, existe un margen de error (µi); por otro lado, haydiferencia entre la FRP y FRM, la cual es la que estimamos. Lo que intenta este método
es justamente minimizar el error (distancia) entre las dos funciones. Puesto que:
8/9/2019 Econometria Eco Medina
20/41
APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco
23
Y = β0 + β1 Xi + ei => ei = Y - (β0 + β1 Xi)
Ahora que sería inútil minimizar la sumatoria de los errores, pues en promedio sabemos
que éste es igual a cero. Pero si tiene sentido minimizar la sumatoria de los errores al
cuadrado, esto es:
min e Y X ii
n
i
n
i
= =∑ ∑= − +
1
0
1
1
2[ ( )] β β
Aplicando el concepto de optimización, es decir intentamos encontrar el valor óptimo
de los βi para minimizar la sumatoria de los errores al cuadrado. Para el efecto,aplicamos conocimientos de cálculo diferencial, sacando las condiciones de primer
orden (la primera derivada de la expresión con respecto a cada uno de los parámetros
desconocidos (βs) será igual a cero) y de segundo orden (la segunda deriva de la
expresión con respecto a cada uno de los βs es mayor que cero).
∂
∂ β
∂ β β
∂ β
( )
( )
( ( ))
( )
e Y X i
i i
2
0 1
2
0= − +
=
∂
∂ β
∂ β β
∂ β
2 2
2
2
0 1
2
20
( )
( )
( ( ))
( )
e Y X i
i i
= − +
〉
Al obtener las derivadas de primer orden encontramos dos ecuaciones con dos
incógnitas, β0 β1, que al resolverlas nos dan como resultado lo que denominamos comoecuaciones normales, que a saber son:
Y n X ii
n
i
i
n
= =∑ ∑= +
1
0 1
1
β β
X Y X X i ii
n
i
i
n
i
i
n
= = =∑ ∑ ∑= +
1
0
1
1
1
2
β β
Este sistema de ecuaciones es resuelto por cualquier método matemático (adición,substracción, igualación, suma y resta, etc.) para encontrar los valores de los parámetros
desconocidos, que constituyen los estimadores de MCO. Una vez estimados definimos
el modelo como:
Y = β0 + β1 Xi
1.4 Supuestos del Modelo Clásico de Regresión Lineal Simple
(MCRLS)
8/9/2019 Econometria Eco Medina
21/41
APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco
24
Siempre se deben establecer supuestos sobre el modelo. Los más importantes o los que
deben quedar explícitos son los relativos al término del error. Los supuestos que debe
cumplir un modelo econométrico son:
1. Recordemos que en la estimación de un modelo hay un margen de error, los cuales
pueden ser positivos o negativos. El valor esperado o promedio estimado de lavariable dependiente, a través de la regresión muestral estará subestimado o
sobrestimado con relación al valor poblacional. Por lo tanto, se espera que en
promedio los errores sean cero, o el valor esperado de los errores es igual a cero,
esto es:
E X i i( / ) = 0
Intuitivamente significa que los errores cometidos al estimar el modelo no afectan
sistemáticamente al valor promedio de la variable dependiente, es decir que refleja
el verdadero valor poblacional.
2. Que los errores no están correlacionados, es decir que no existe autocorrelación en
el modelo, esto es:
Cov (µi, µ j) = 0 (i ≠ j) pues,
Cov (µi, µ j) = E[ui - E(ui)] [u j- E(u j)]
Cov (µi, µ j) = E(ui u j) = E(ui) E(u j) = 0 (i ≠ j)
Intuitivamente significa que el valor de la observación i no influye en el de la j. Por
ejemplo, en series de tiempo el pasado no explica al presente; en series de corte
transversal significa que las variaciones de ingreso en un grupo de personas no
explican los cambios en el consumo de otro grupo.
3. Que la varianza es única, o el modelo es homocedástico, esto es:
Var (µi) = E (µi)2 = σ2
Porque:
Var (µi) = E [µi - E (ui)]2 = σ2
Intuitivamente significa que el crecimiento (decrecimiento) de la variable
independiente no afecta o conlleva modificaciones en la varianza del error del
modelo.
4. Que las observaciones de la variable independiente no están correlacionadas con elerror, esto es:
0 0
0 0
0
8/9/2019 Econometria Eco Medina
22/41
APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco
25
Cov (Xi, µi) = 0
5. Finalmente, se supone que el modelo está bien especificado. Es decir que, la forma
funcional se ajusta a los datos y que se han incluido las variables relevantes. Esto
implica que no cometemos sesgo de especificación.
Estos cinco supuestos se pueden resumir en:
µ ∼ N (0, σ2)
Lo cual significa que, los errores se distribuyen normalmente con media cero y varianza
σ2. Estos supuestos se deben cumplir porque de lo contrario estamos en problemas.
Si un modelo lineal simple cumple con todos estos supuestos tenemos el MCRLS
(Modelo Clásico de Regresión Lineal Simple). Según Markov si a este modelo
aplicamos el método de estimación de MCO, los estimadores van a ser los Mejores
Estimadores Lineales Insesgados (MELI).
Sabemos que para que un estimador sea perfecto debe ser:
1. Insesgado, lo que significa que en promedio los estimadores son igual al verdadero
valor poblacional, lo que permite que las inferencias sean válidas. Esto es:
E(βi) = βi
2. Eficiente, se refiere a la distancia entre los valores del estimador y el valor del
parámetro, e implica que entre todos los estimadores se ha seleccionado aquel de
varianza mínima (distancia mínima o de menor dispersión).
3. Consistente, que no es más que un estimador se acerca cada vez más a su
verdadero valor poblacional a medida que se aumenta el tamaño de la muestra, o
tiende a concentrarse más alrededor del verdadero valor del parámetro.
β i
βi1 βi2
8/9/2019 Econometria Eco Medina
23/41
APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco
26
Estas tres características están bajo el supuesto que se realizan estimaciones de
diferentes modelos para diferentes muestras, obviamente esto es teórico, pues sabemos
que en virtud de los costos, en la práctica, utilizamos una sola muestra.
1.5 Errores de precisión de los estimadores, intervalos de confianza y
pruebas de hipótesis
Errores de precisión de los estimadores
Conocemos que entre todos los estimadores se escoge aquel que cumple con las
propiedades teóricas; sin embargo, en la práctica lo que estimamos es uno solo, con
base en la muestra, por lo que es necesario considerar los errores que tienen éstos conrespecto al verdadero valor poblacional.
Esta medida la conocemos como la desviación típica o estándar, que se define como una
medida de dispersión de todos los valores estimados para un parámetro con respecto a
su verdadero valor poblacional (valor promedio de estos estimadores, si cumple con la
propiedad de ser insesgado) varianza.
Esta es muy importante para calcular intervalos de confianza y para hacer pruebas de
hipótesis respecto a los parámetros.
Var S S
X X
S S
i
i
n( ) ( )
( )
( ) ( ) β β β β 1 12
2
1
2 1 1
2= =
−
=> =
=∑
Var S
S X
n X X
S S
i
i
n
i
i
n( ) ( )
( )
( ) ( ) β β β β 0 02
2 2
1
1
2 0 0
2= =
−
=> ==
=
∑
∑
βi
8/9/2019 Econometria Eco Medina
24/41
APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco
27
Donde: S2 es la varianza del modelo, es decir es la varianza del error (discrepancia
entre la FRM y la FRP), que tan cerca está el valor estimado del verdadero
valor poblacional:
ei = Yi - Yi
Intervalos de Confianza
La estimación de un modelo da como resultado estimadores puntuales de los parámetros
(un solo valor). En la práctica es muy arriesgado presentar los resultados de esta forma,
pues la estimación se hace con base a una muestra, por otro lado hay el riesgo de no
incluir todas las variables explicativas, por las razones que hemos venido mencionado, y
de cometer errores de medición. En este sentido, es mejor presentar los resultados en
forma de intervalos con cierto nivel de confianza, es decir decimos que la probabilidad
de que el valor estimado se encuentre en un determinado intervalo con tal grado de
confianza.
Como los valores que se estiman son de los parámetros y del promedio de la variable
dependiente, habrá intervalos de confianza para cada uno de los parámetros y para el
valor promedio.
Intervalo de confianza para los estimadores
IC(βi) = Probabilidad[Límite inferior, Límite superior] = (1- α)% de confiabilidad
IC ob t S t S i i n i i ni i( ) Pr [ * * ] ( )%/ , / , β β β β α α β α β = − ≤ ≤ + = −− −2 2 2 2 1
Intervalo de confianza para el valor esperado de la variable dependiente
IC E Y ob Y t S Y Y t S i i n Y i i n Y i i[ ( )] Pr [ * * ] ( )%/ , / ,= − ≤ ≤ + = −− −α α α 2 2 2 2 1
Donde:
S S n
X X
X X
Y
i
i
ni= +
−
−
=∑
2 0
2
2
1
1 ( )
( )
Donde X0 es un valor dado para X, pues recordemos que el valor promedio de Y está
condicionado a un valor de X.
Pruebas de hipótesis
Las pruebas de hipótesis son un poderoso instrumento para definir y establecer
conclusiones generales respecto a una población. El proceso de una prueba de hipótesis
es el siguiente:
8/9/2019 Econometria Eco Medina
25/41
APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco
28
1) Se deben formular la hipótesis, que son supuestos que se realizan con respecto al
verdadero valor poblacional. Decimos hipótesis porque son dos: la nula y la alterna.
La última apoya a la tesis del investigador y la primera simplemente es lo contrario.
Se comienza por la hipótesis alterna debido que se conoce la probabilidad de error
tipo I (α), que surge cuando se rechaza la hipótesis nula siento ésta verdadera; la
probabilidad de error tipo II (β) no se conoce, éste se genera cuando se acepta lahipótesis nula siendo esta falsa.
Esto debido a que se supone que existe una distribución de probabilidades para cada
uno de los parámetros estimados.
b) Al probar una hipótesis buscamos rechazar la hipótesis nula, lo que permite tener
evidencia para apoyar el supuesto establecido en la alterna. De esta forma, el
investigador prefija el nivel de probabilidad de error tipo I, es decir el margen de
error de rechazar la hipótesis nula siendo verdadera. En definitiva, fijamos un nivel
de significancia (
) que está a discreción del investigador.
c) Para probar la hipótesis se necesario contrastar dos valores, por lo cual se calcula un
estadístico de prueba con base en el valor del parámetro estimado, sobre el que se
está realizando la prueba, y en los valores planteados en la prueba de hipótesis (θ).
d) Una vez obtenido el valor calculado se lo compara con el valor teórico de la
distribución, el cual se consulta en las tablas respectivas, utilizando los grados de
libertad que constan en la tabla anterior.
e) Se procede a graficar la distribución correspondiente, en ésta es el valor teórico o de
tablas el que divide a la región crítica (de rechazo de la hipótesis nula) y a la deaceptación de la hipótesis nula. Sobre este gráfico se observa donde cae el valor
calculado, si en la de rechazo o en la de aceptación.
Si cae en la región crítica (de rechazo), se procede a concluir que con el 1- α % deconfiabilidad hay evidencia suficiente para decir que se cumple lo que se enuncia en
la hipótesis alterna (ojo: no cuando se rechaza la hipótesis nula se acepta
automáticamente la alterna). Si cae en la de aceptación se concluye que con el 1- α % de confiabilidad se prueba lo que se enuncia en la hipótesis nula.
Las dos pruebas de hipótesis centrales, fundamentales, y que en todo modelo se deben
realizar son la de relevancia y la de dependencia, cuyos estadísticos de prueba utilizados
son los que se presentan a continuación:
Estadístico de prueba
(valor calculado)
Parámetro Prueba de hipótesis Distribución
t S
c
i
i
= −∃ β θ
β
βi - Relevancia
- Específicas
t (Student) con n-k-1 g l
F CMR
CME c =
Razón de
cuadrados
- Dependencia glo-
bal, el modelo es
“bueno”
F (Fisher) con k gl para
el numerador y n-k-1
para el denominador
8/9/2019 Econometria Eco Medina
26/41
APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco
29
Prueba de Relevancia: se refiere a probar la importancia de una variable en la
explicación del comportamiento de la variable dependiente.
Si es importante se supone que el coeficiente que la
acompaña (βi ) es estadísticamente diferente de cero, por lo
tanto la prueba de hipótesis planteada es:
Ho: βi = 0Ha: βi ≠ 0
El estadístico de prueba es el que consta en la primera fila de la tabla anterior.
Prueba de Dependencia Global : se refiere a probar que todas las variables en su
conjunto explican a la variable dependiente, es
decir si todos los βi estimados son estadísticamente
diferentes de cero. La prueba de hipótesis planteada es:
Ho: β1 = β2 = β3 ... = βk = 0Ha: β1 ≠ 0, β2 ≠ 0, β3 ≠ 0 ... βk ≠ 0
El estadístico de prueba es el que consta en la tercera fila de la tabla anterior.
Cuál es el origen del estadístico F? lo deduciremos a partir de la Tabla de Análisis de
Varianza (ANOVA)
Fuente devariación
Grados delibertad (gl)
Suma de Cuadrados(SC)
CuadradoMedio (CM)
F calculado(Fc)
Regresión 1 SCR = β 1 ( )( ) X X Y Y i i− −∑ SCR/1Error n-2 SCE = Σei = SCT - SCR SCE/(n-2) CMR/CME
Total n-1SCT = ( )Y Y i −∑
2
SCT/(n-1)
Análisis de los resultados y forma de presentar el modelo
Los resultados de un modelo estimado se debe presentar de la siguiente forma:
Yi = β0 + β1 Xi(Sβ0) (Sβ1)
t = (tcβ0) (tcβ1)
R 2 = # %
Fgl = #
El análisis de los resultados comienza por la interpretación de los coeficientes
estimados, tanto por su signo como por su magnitud. Respecto a la última, en una
regresión lineal éstos reflejan variaciones marginales, es decir cuál será el cambio, en
términos absolutos, experimentado por la variable dependiente (Y), frente a un cambio
dado en la variable dependiente (X). El signo mostrara una relación directa o inversa de
la variable dependiente con respecto a la independiente.
8/9/2019 Econometria Eco Medina
27/41
APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco
30
Luego se realizan las dos pruebas de hipótesis centrales mencionadas anteriormente y,
de ser necesario o interés del investigador, también se hacen pruebas específicas.
Por ejemplo: se desea estimar un modelo de regresión simple de la demanda del bien X,
para lo cual se dispone de 12 observaciones de ésta variable y del precio del mismo bien. El resultado obtenido después de correr el modelo en el paquete estadístico TSP es
como se presenta a continuación:
Dxi = 25.2686 - 1.061 Pxi
(0.4194) (0.0338)
t = (61.25) (-31.35)
R 2 = 0.9899 = 98.99%
F1,10 = 982.72
Interpretemos los coeficientes β0 y β1. β0 =25.2686, representa a la intersección de lalínea de regresión con el eje Y, es decir que cuando X vale cero Y toma éste valor y
diríamos que si el precio del bien X es cero, la demanda de este mismo bien es de
25.2686 kilos. β1, en este caso, es la pendiente de la línea de regresión y expresa que siel precio del bien X aumenta (disminuye) en una unidad la demanda disminuye
(aumenta) en 1.061 kilos, es decir que existe una relación inversa entre las dos
variables.
La prueba de hipótesis de relevancia seguiría el siguiente procedimiento:
1. Ho: β1 = 0 (Px no es relevante para explicar las variaciones de Dx)
Ha: β1 ≠ 0 (Px es relevante para explicar las variaciones de Dx)
Planteamos así las hipótesis porque si el parámetro en análisis fuera estadísticamente
(no matemáticamente) igual a cero, la variable Px no influiría de ningún modo en los
cambios de Dx, pues Yi = β0 + 0 Px.
2. α = 5%
3. El estadístico de prueba sería:
tcS =
− β θ
β
1
1
∼ tn-2 gl
Donde: β1 = es el estimador , θ = es el valor de la prueba de hipótesis y Sβ1 = es ladesviación típica del estimador.
=>
-1.061 - 0
tc = --------------- ≅ -31.34830.03384
4. El tt = t α%, n-2 gl = t 5%, 10 gl (para dos colas) = 2.228
8/9/2019 Econometria Eco Medina
28/41
APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco
31
Es una prueba de dos colas, lo cual se determina con base en el signo establecido
en la hipótesis alterna, pues no interesa si es mayor o menor que cero, lo
importante es que sea estadísticamente diferente de cero.
5. Ahora contrastamos el tc con el tt, observamos que el tc es totalmente superior altt. es decir cae en la zona de rechazo de la hipótesis nula por lo que se pude
concluir que: con el 95% de confianza hay suficiente evidencia para decir que
Px si es relevante para explicar a Dx.
La prueba de hipótesis de dependencia.
1. Ho: β1 = 0 (no existe dependencia o el modelo no es “bueno”)Ha: β1 ≠ 0 (existe dependencia o el modelo es “bueno”)
Se observa que en este caso la de relevancia coincide con la dependencia por existir una
sola variable independiente.
2. α = 5%
3. El estadístico de prueba sería:
Fc CNR
CME = ∼ Fk,n-k-1 gl
=>
Fc ≅ 982.72 (según los resultados obtenidos en el TSP)
4. El Ft = F α%, k, n-k-1 gl = F 5%, 1, 10 gl = 4.96
k son los grados de libertad del numerador y n-k-1 los del denominador.
5. Ahora contratamos el Fc con el Ft, observamos que el Fc es superior al Ft, es
decir cae en la zona de rechazo de la hipótesis nula por lo que se pude concluir
que: con el 95% de confianza hay suficiente evidencia para decir que el modelo
estimado es “bueno” o existe dependencia.
A Ho R HoR Ho
A Ho R Ho
4.96 982.72 F
f(F)
8/9/2019 Econometria Eco Medina
29/41
APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco
32
Una prueba de hipótesis específica es cuando planteamos, por ejemplo, probar que si Pxaumenta en una unidad la demanda no disminuye en 2 unidades.
1. Ho: β1 = -2 (si Px aumenta en una unidad la demanda disminuye en 2 unidades)Ha: β1 ≠ -2 (si Px aumenta en una unidad la demanda no disminuye en 2 unidades)
Planteamos así las hipótesis porque:
β 12
1= =
−∆
∆
Dx
Px
2. α = 10%
3. El estadístico de prueba sería:
tcS
= − β θ
β
1
1
∼ tn-2 gl
=>
-1.061 - (-2)
tc = --------------------- ≅ 27.750.03384
4. El tt = t α%, n-2 gl = t 10%, 10 gl (para dos colas) = ± 1.812
Es una prueba de dos colas, lo cual se determina con base en el signo establecido
en la hipótesis alterna, pues no interesa si es mayor o menor que cero, lo
importante es que sea estadísticamente diferente de cero.
5. Ahora contrastamos el tc (27.75) con el tt (± 1.812), observamos que el tc
(27.75) es mayor que tt (+1.812). Es decir cae en la zona de rechazo de lahipótesis nula por lo que se pude concluir que: con el 95% de confianza hay
suficiente evidencia para decir que si Px aumenta en una unidad la demanda no
disminuye en dos unidades.
A HoR HoR Ho
+ 1.812- 1.81227.75
8/9/2019 Econometria Eco Medina
30/41
APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco
33
CAPITULO III
APUNTES ADICIONALES RESPECTO A
REGRESION SIMPLE
3.1 Por qué es conveniente plantear modelos con intercepto?
Un modelo sin intercepto se conoce como regresión a través del origen, de tal forma que
β0 = 0, lo que significa que la línea de regresión pasa por el origen y, por lo tanto, elmodelo quedaría expresado como:
Yi = β1 Xi + ui
Es preferible plantear un modelo con intercepto ya que como se observa en el siguiente
cuadro tiene sus ventajas:
Concepto Modelo sin intercepto Modelo con intercepto
Expresión
matemáticaYi = β1 Xi + ui Yi = β0 + β1 Xi +ui
Sumatoria de
los errores
La sumatoria de los errores no
necesariamente es igual a cero
La sumatoria de los errores
siempre es igual a cero
Coeficiente de
determinación
R 2 puede ser en algunos casos
negativo
R 2 siempre es positivo, porque
asume implícitamente que β0 está presente en el modelo
R 2 no puede ser adecuado para
estos modelos
R 2 si es adecuado
β 0 No existe Puede no ser estadísticamente
significativo
Se evidencia, entonces, que es conveniente plantear siempre un modelo con intercepto,
ya que si en realidad el intercepto es estadísticamente no significativo se interpretaría
como una regresión en el origen; en tanto que si es estadísticamente significativo y
plantemos sin intercepto cometeríamos un error de especificación, es decir se viola el
quinto supuesto, mencionando con anterioridad.
Por ejemplo si tenemos 10 observaciones de consumo e ingreso y corremos modelos
lineales en el TSP, primero con intercepto y luego sin intercepto, obtenemos los
siguientes resultados:
Y = 3.64 + 0.0888 X
(0.6191) (0.0106)
t= (5.8798) (8.3757)
R 2 = 0.8976 = 89.76%
F1,8 =70.152
Y = 0.144 X
(0.010)t= (14.32)
8/9/2019 Econometria Eco Medina
31/41
APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco
34
R 2 = 0.4552 = 45.52%
Observamos que R 2 disminuye drásticamente y, por lo tanto, hay mayor poder
explicativo con el primero (89.76%). Fc no ha sido posible calcularlo por el supuesto
que implícitamente el intercepto es parte del modelo. Aunque la variable independiente
tiene un tc mayor en el segundo modelo que en el primero, se pierden otros parámetrosestadísticos que validan el modelo con mayor certeza.
3.2 Unidades de escala
Es importante notar que las unidades de escala afectarán la interpretación de los
coeficientes obtenidos, en la medida que está sea diferente para la variable
independiente y para la dependiente. Así, si tenemos el modelo original como:
Yi = β0 + β1 Xi +ui
Y los modelos afectados por la escala como:
Yi* = β0 + β1 Xi* +ui
Yi* = β0 + β1 Xi +ui
Yi = β0 + β1 Xi* +ui
Donde: Yi* = Yi* = a Yi
Xi* = Xi* = a Xi
Es decir, las dos variables están afectadas por la misma escala, por ejemplo expresadas
en miles de sucres (divididas para mil). Utilizando las diferentes expresiones de cálculo para los coeficientes y para los errores estándar, correspondientes, así como para el
coeficiente de determinación.
β 11
2
1
1
2
1
= =
− −
−
=
=
=
=
∑
∑
∑
∑
x y
x
X X Y Y
X X
i i
i
n
i
i
n
i i
i
n
i
i
n
( ) ( )
( )
, β β 0 1= −Y X
S X
n x
i
i
β
σ
0
2 2
2=
∑∑
, S xi
β
σ 1
2
2=
∑
R r
X X Y Y
X X Y Y
i i
i
n
i i
i
n
i
n
2 2 1
2 2
11
= =
− −
− −
=
==
∑
∑∑
( )
( ) ( )
( ) ( )
, σ 22
2=
−
∑ en
i
8/9/2019 Econometria Eco Medina
32/41
APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco
35
Aplicando estas expresiones para calcular los diferentes parámetros se verían afectados
como se presenta en siguiente cuadro:
Parámetr
oYi* = β0*+ β1*Xi*
+ui
Yi* = β0*+ β1*Xi+ui
Yi = β0*+ β1*Xi*+ui
β0* a β0 a β0 β0
β1* β1 a β1 (1/a) β1
Sβ0* a Sβ0 a Sβ0 Sβ0
Sβ1* Sβ1 a Sβ1 (1/a) Sβ1
S* a S a S S
R 2* R 2 R 2 R 2
En el primer caso, donde, por ejemplo, a las dos variables se las a dividido por mil
observamos que únicamente el intercepto se ve afectado por lo que se interpretaría
dividido por mil. Para el segundo caso, donde solo a la variable independiente se la
expresa en miles, todos los parámetros deberían ser divididos por mil para su
interpretación. Finalmente, para el último caso en el que se afecta únicamente a la
variable independiente los resultados del coeficiente de la misma y de su respectivo
error estándar deberían ser multiplicado por mil para su interpretación.
Concluiríamos que la escala no afecta los resultados, pero que a la hora de interpretar si
se debe tener en cuenta este aspecto.
Qué pasaría si las escalas de medición que afectan a las variables son diferentes?, esto
es si a la variable independiente se la expresa en miles y la dependiente en millones y
viceversa.
Por ejemplo, con las mismas observaciones de consumo e ingreso y con a=5, tenemos
los siguientes resultados:
Y = 3.64 + 0.0888 X(0.6191) (0.0106)
R 2 = 0.8976
S2 = 0.7370
Y* = 18.20 + 0.44381 X => β0*= 5*3.64=18.2 ; β1*= 5*0.888 ≈ 0.444
(3.095) (0.05298) => Sβ0*=5*0.619≈3.095; Sβ1*=5*0.0106≈ 0.053
R 2 = 0.8976 => Es igual
S2 = 18.4256 => S2*= 25*0.7370 ≈ 18.4256
Y = 3.64 + 0.01775 X* => β0*= 3.64=3.64 ; β1*= 0.888/5 ≈ 0.01775 (0.6191) (0.0021) => Sβ0*=0.619≈0.6191; Sβ1*=0.0106/5≈ 0.021
8/9/2019 Econometria Eco Medina
33/41
APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco
36
R 2 = 0.8976 => Es igual
S2 = 0.7370 => S2*= 0.7370≈ 0.7370
Y* = 18.2 + 0.888 X* => β0*= 5*3.64=18.2 ; β1*= 0.888 ≈ 0.888
(3.095) (0.0106) => Sβ0*=5*0.619≈3.095; Sβ1*=0.0106≈ 0.0106
R 2 = 0.8976 => Es igual
S2 = 18.4256 => S2*= 0.7370*25≈ 18.425
En los resultados anteriores observamos que las estimaciones de la tabla se cumplen, es
decir que los coeficientes obtenidos son afectados en la medida que la variable
independiente o la dependiente cambien de escala.
3.3. Modelos simples no lineales
Hasta aquí hemos revisado modelos simples de tipo lineal; sin embargo, es importante
analizar aquellos no lineales, entre los que tenemos el doblemente logarítmico, lossemilogarítmicos y los inversos.
3.3.1 Modelo doblemente logarítmico:
Matemáticamente se expresa como:
Yi = β0 Xiβ1 e µ
Donde e es la base de los logaritmos neperianos o naturales. Este modelos se lo puede
linealizar utilizando las propiedades de los logaritmos. Así, si aplicamos logaritmos alos dos miembros de la función obtenemos:
ln Yi = ln β0 + β1 ln Xi + µ
Observamos que se convierte en un modelo doblemente logarítmico, pues se estima con
base en las observaciones de X y de Y, pero no originales sino de sus logaritmos. A esta
función se la conoce también como Cobb Douglas y es muy importante pues nos
permite obtener elasticidades directamente, es decir los βs estimados son elasticidades.
La interpretación correspondiente es que ante un cambio de un 1% (o 100%) de la
variable X cual es el cambio en términos de porcentaje para la variable Y. Recordemosque en lineal la interpretación de los βs era relativa a las variaciones marginales entérminos de valores absolutos, esto es ante un cambio de 1 unidad de la variables X cual
es cambio experimentado, en términos absolutos, por la variable Y.
El supuesto fundamental para aplicar el método de estimación de MCO es que el
modelo sea lineal en los parámetros más no en las variables, por lo tanto el modelo
presentado puede estimarse a través de este método.
Las características:
8/9/2019 Econometria Eco Medina
34/41
APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco
37
- El modelo doblemente logarítmico es una función constante en elasticidades pero
variable en la pendiente, no así en el lineal donde la pendiente es constante y la
elasticidad es variable a lo largo de la función.
- No tiene máximo ni mínimo
- Compacta la escala de estimación
Por ejemplo: si tenemos 36 observaciones relativas al ingreso y al consumo y
estimamos un modelo doblemente logarítmico y uno lineal en el TSP, obtenemos los
siguientes resultados:
LCONS = 0.0147954 + 0.98464 LING
(0.03888) (0.00533)
t= (0.38066) (184.836)
R 2 = 0.999 = 99.9%
F1,8 =34164.38
CONS = 9.77283 + 0.89974 ING
(9.6539) (0.005864)
t= (1.01232) (153.442)
R 2 = 0.9986 = 99.86%
F1,8 =23544.3
La interpretación para el primer modelo sería:
β1 = 0.98464, significa que si el ingreso aumenta en el 1% (100%) el consumoaumenta, pues el coeficiente es positivo, en el 0.98464% (98.464%). Es
decir es una elasticidad que debe interpretarse por la magnitud: esinelástica (cambio menos que proporcional); y, por el signo: que
expresa que es una relación directa.
β1 = 0.89974, en tanto que en el modelo lineal, significa que si el ingreso aumenta enuna unidad (por ejemplo 1 sucre) el consumo aumenta en 0.89974
unidades (por ejemplo 0.89974 sucres), pues el coeficiente es positivo.
Es decir es en este caso representa la propensión marginal a consumir, o
los cambios marginales en términos absolutos.
3.3.2 Modelos semilogarítmicos
Estos modelos solo tienen logaritmos de las observaciones originales en un solo
miembro de la función sea de X o de Y. Es decir:
ln Y = β0 + β1 Xi + µ
Y = β0 + β1 ln Xi + µ
La interpretación de los coeficientes: para el primer modelo se dice cual es el cambio
porcentual experimentado por Y frente a un cambio en términos de valores absolutos de
la variable X; éste modelo es muy importante cuando se trata de calcular tasas de
crecimiento en el tiempo. En el segundo, se interpretara como el cambio experimentado
8/9/2019 Econometria Eco Medina
35/41
APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco
38
por Y en términos da valores absolutos frente un cambio porcentual de la variable
independiente.
Explicando con mayor detalle el primer modelo semilog, si recordamos la fórmula de
interés compuesto tendríamos:
Yt = Y0 (1+r)t
lnYt = ln Y0 + t ln (1+r)
Ahora si: β0 = ln Y0, y
β1 = ln (1+r)
ln Yt = β0 + β1 t
Agregando el término de perturbación se tiene:
ln Yt = β0 + β1 t + ut
3.3.3 Modelos Recíprocos
Refleja una relación inversamente proporcional entre la variable independiente y la
dependiente,
1
Y = β0 + β1 + µ
X
Un ejemplo práctico para este modelo es la teoría macroeconómica del empleo.
8/9/2019 Econometria Eco Medina
36/41
APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco
39
CAPITULO IV
ANALISIS DE REGRESION LINEAL MULTIPLE
4.1 Definición y representación general de un modelo múltiple
El análisis de regresión múltiple, como su nombre lo indica, relaciona una variable
independiente con dos o más variables independientes. Su importancia radica en que la
realidad expresada a través de un modelo ya no es tan simplificada, pues en pocas
ocasiones encontraremos que un fenómeno o comportamiento esté explicado por una
sola variable; es decir este tipo de modelo, obviamente, tiene mayor poder explicativo.
En términos generales se lo puede representar como:
Yi = β0 + β1 X1i + β2 X2i + ... + βk Xki + µi
Expresado en forma matricial:
Y = β X + µ
Donde:
Y1 1 X11 X21 X31 ... Xn1 µ1
Y2 1 X12 X22 X32 ... Xn2 µ2
Y = Y3 X = µ =
Yn 1 X1n X2n X3n ... Xnn µn
4.2 Supuestos del Modelo
Los supuestos del modelo de regresión lineal múltiple son los mismo que para el simple,
pero se agrega uno que es el de la multicolinealidad. Así:
1. Recordemos que en la estimación de un modelo hay un margen de error, los cuales
pueden ser positivos o negativos. El valor esperado o promedio estimado de la
variable dependiente, a través de la regresión muestral estará subestimado o
sobrestimado con relación al valor poblacional. Por lo tanto, se espera que en promedio los errores sean cero, o el valor esperado de los errores es igual a cero,
esto es:
E X i i( / ) = 0
Intuitivamente significa que los errores cometidos al estimar el modelo no afectan
sistemáticamente al valor promedio de la variable dependiente, es decir que refleja
el verdadero valor poblacional.
2. Que los errores no están correlacionados, es decir que no existe autocorrelación enel modelo, esto es:
8/9/2019 Econometria Eco Medina
37/41
APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco
40
Cov (µi, µ j) = 0 (i ≠ j)
Intuitivamente significa que, por ejemplo, en series de tiempo el pasado no explica
al presente; en series de corte transversal significa que las variaciones de ingreso en
un grupo de personas no explican los cambios en el consumo de otro grupo.
3. Que la varianza es única, o el modelo es homocedástico, esto es:
Var (µ) = E (µ2) = σ2
Intuitivamente significa que el crecimiento (decrecimiento) de la variable
independiente no afecta o conlleva modificaciones en la varianza del error del
modelo.
4. Que las observaciones de la variable independiente no están correlacionadas con el
error, esto es:
Cov (Xi, µi) = 0
5. Las variables independientes no están correlacionadas, es decir que el modelo no
está afectado por la multicolinealidad, esto es:
Cov (Xi, X j) = 0 (i ≠ j)
6. Finalmente, se supone que el modelo está bien especificado. Es decir que, la formafuncional se ajusta a los datos y se han incluido las variables relevantes. Esto
implica que no cometemos sesgo de especificación.
Estos supuestos se pueden resumir en:
µ ∼ N (0, σ2)
Lo cual significa que, los errores se distribuyen normalmente con media cero y varianza
σ2.
Cuando tenemos este tipo de modelo es difícil inferir la forma funcional. En la práctica
lo que se hace es ensayar diferentes funciones, utilizando la teoría económica.
El método de estimación que vamos a utilizar es el de MCO, el proceso es el mismo que
en el modelo simple. Esto es resolvemos un proceso de optimización, minimizamos la
sumatoria de los errores al cuadrado.
4.3 Pruebas de hipótesis
Como en el modelo de regresión lineal simple en el múltiple también tenemos dos
hipótesis centrales: la de dependencia y la de relevancia.
8/9/2019 Econometria Eco Medina
38/41
APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco
41
Prueba de dependencia
Esta verifica el efecto conjunto y simultáneo de todas las variables independientes sobre
la dependiente. Se la conoce también como la prueba de bondad del modelo. Por
ejemplo si el modelo es:
Yi = β0 + β1 X1i + β2 X2i + ... + βk Xki + µi
La hipótesis será:
Ho: β0 = β1 = β2 = ... βk = 0
Ha: β0 ≠ 0, β1 ≠ 0, β2 ≠ 0, ... , βk ≠ 0
Donde, como se analizó anteriormente, el estadístico de prueba es el Fc.
Prueba de relevancia
Esta prueba verifica si cada una de las variables independientes son importantes para
explicar los cambios de la variable dependiente. Igual que en el modelo de regresión
simple planteamos la hipótesis de la siguiente forma:
Ho: βi = 0
Ha: βi ≠ 0
Y el estadístico de prueba es el mismo que en el caso lineal simple, esto es el tc.
Hipótesis específicas
Son supuestos que se realizan con respecto a valores determinados de los parámetros
poblacionales. Por ejemplo, si queremos probar que en una función de producción con
tres insumos existen rendimientos crecientes, en un modelo como:
Yi = β0 X1i β1
X2i β2 X3
β3 e u
La hipótesis será:
Ho: β1 + β
2 + β
3 ≤ 0
Ha: β1 + β2 + β3 > 0
En este caso el estadístico de prueba es diferente, así:
tc s X X
t n k gl = −
≈−
− −
λ β θ
λ λ
'
' ( ' ),
2 11
Donde: λ = vector de coeficientes de los βs de la hipótesis; S2 (X’X)-1 = matriz de
Var-Cov (β)
8/9/2019 Econometria Eco Medina
39/41
APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco
42
4.4 Intervalos de confianza
Para los estimadores:
I ob t s X X i n k
( ) Pr [ ' ' ( ' ) ]/ ,
β λ β λ λ α
= ±− −2 1
2
Para la predicción:
I E Y X ob Xo t s Xo X X Xon k ( ( / ) Pr [ ' ' ( ' ) ]/ ,= ± − − β α 2 12
4.5 Multicolinealidad
La multicolinealidad se presenta cuando las variables independientes están
correlacionadas. Es decir se está violando un supuesto y, por lo tanto, las inferencias yano tienen validez.
Las causas para que se de este problema son: generalmente, los modelos utilizan
variables sociales y económicas, por lo que casi siempre se va a presentar este
problema. Es difícil encontrar en la práctica que variables de este tipo no se relacionen
de ninguna forma. Por lo que se trata de corregir reduciendo este problema, nunca se va
a eliminar totalmente.
Se pude decir que existe multicolinealidad perfecta cuando el coeficiente de correlación
entre variables independientes es igual a 1, en este caso no se puede estimar el modelo
porque la matriz X es singular o no es de rango completo. También se dice que la
multicolinealidad es menos que perfecta, en cuyo caso si es posible estimar el modelo
pero existen problemas de inferencia, por lo que hay que trata de reducirla corrigiendo.
Para detectar:
Una forma es encontrando los coeficientes de correlación entre las variables
independientes, si este es cercano a uno significa que las variables están altamente
correlacionadas.
Otra forma es corriendo regresiones entre las variables independientes, esto es que unade ellas es independiente y a la otra (s) como dependiente. Si son relevantes para
explicar en los modelos, tendremos alta multicolinealidad.
Para corregir, se podría pensar en eliminar una variable que se causa de la
multicolinealidad, pero es posible que se genere un sesgo de especificación.
4.6 Autocorrelación
La autocorrelación significa que los errores están relacionados. En series de tiempo que
el pasado explica al presente, en series de corte transversal que el cambio en una
variable de un grupo afecta a otro grupo. Se presenta más en series de tiempo.
8/9/2019 Econometria Eco Medina
40/41
APUNTES DE CLASE
FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco
43
Esta violación de los supuestos tiene consecuencias importantes, por lo que será
necesario corregirla. Para detectar este problema se puede utilizar el estadístico Durbin-
Watson y para corregir se utiliza la Ecuación de Diferencias Generalizadas.
4.7 Heterocedasticidad
La hetorecedasticidad es la violación del supuesto relativo a que la varianza es única, o
que el modelo es homocedástico. Significa que a medida que aumenta o disminuye la
variable independiente, causa de este problema, aumenta o disminuye la varianza de los
errores.
Este problema es más frecuente en series de corte transversal. Por ejemplo, cuando
estamos estimando un modelo de consumo en función del ingreso, para un bien
especifico y tenemos las observaciones clasificada según estrato económico,
obviamente dependiendo del tipo de bien, el consumo aumenta en diferente forma para
cada estrato.
4.8 Sesgo de Especificación
Recordemos el último supuesto, tanto del modelo simple como múltiple, que dice que
un modelo debe estar bien especificado, es decir poseer la forma funcional correcta y
las variables relevantes. Observamos pues que, la violación de este supuesto conduce a
un sesgo de especificación que puede estar dado por:
- Forma funcional inadecuada o que no se ajusta a los datos- Omisión de variables relevantes
- Inclusión de variables irrelevantes
- Errores de medición.
Siendo la omisión de una o más variables relevantes el problema más grave.
4.9 Proceso para estimar un modelo
Es importante conocer el proceso de estimación de un modelo, el mismo que debeseguir una secuencia lógica. En este sentido, a continuación se presenta los pasos que,
según criterio del autor, son los más importantes.
1. Revisión de la teoría, es el paso fundamental dentro de un proceso de investigación.
Cuando se está estudiando un fenómeno social o económico, es importante recopilar
las principales teorías que existen al respecto, las cuales deben ser actualizadas y
ajustarse a la realidad objeto de estudio.
2. Con esta teoría se puede definir una relación funcional deterministica. Esto es:
Y = f (X1, X2, X3, ... Xk )
8/9/2019 Econometria Eco Medina
41/41
Es decir, la teoría es la base sobre la que se construye un modelo, contribuye a definir la
cual es la variable dependiente y cual o cuales las independientes.
3. Con esta relación determinista procedemos a establecer la relación funcional: lineal,
cudrática, doblemente logarítmica, etc.. Primero basándonos en la propia teoría para
luego ensayar las funciones que deducimos se pueden ajustar a los datos y a la teoríay, finalmente, determinar el modelo econométrico.
Por ejemplo, si la relación más adecuada fuera una lineal tendríamos:
Yi = β0 + β1 X1i + β2 X2i + ... + βk Xki + µi
4. Se procede a la estimación de la función establecida, observando primero el
coeficiente de determinación del modelo. Obviamente si éste se acerca más a la
unidad los datos se ajustan al modelo. De no ser así, se inicia con un proceso
iterativo, donde ensayamos diferentes tipos de funciones siempre observando el
estadístico mencionado.
5. Con estos modelos estimados procedemos a validar el modelo. Para el efecto,
primero debemos partir siempre del modelo original, no del corregido, para ver si no
viola ninguno de los supuestos utilizando pruebas de hipótesis y los diferentes
métodos para detectar estos problemas. Si es así corregimos con los diferentes
métodos señalados.
También dentro de la validación se debe analizar si el modelo cumple con lo que se
espera de acuerdo a la teoría, esto es la magnitud de los coeficientes y los signos. Si no
cumple estos aspectos existe algún errores y debemos volver al paso 1.
6. Una vez que tenemos el modelo validado estadísticamente y a través de la teoría
económica procedemos a: primero interpretar cada uno de los coeficientes estimados;
y, segundo a hacer pruebas de hipótesis que nos permitan hacer ciertas inferencias,
de interés, para generalizar las características de la muestra a la población objeto de
estudio.
7. Finalmente, según los intereses de la investigación se pueden hacer simulaciones y
formulación de política económica. Para luego escribir las conclusiones y
recomendaciones, definidas primero sobre el propósito de la investigación, después
sobre la facilidad o dificultad de la investigación como tal; y, por último sobre losresultados del modelo, así como sobre su validez.