Econometria Eco Medina

8/9/2019 Econometria Eco Medina

1/41

APUNTES DE CLASE

FUNDAMENTOS DE ECONOMETRIA

ELABORADO POR:

NANCY MEDINA CARRANCO

2000


2/41

APUNTES DE CLASE

FUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco

2

APUNTES DE CLASE

FUNDAMENTOS DE ECONOMETRIA

INTRODUCCION

Actualmente la Econometría es una herramienta de análisis muy importante, inclusive

para leer y entender la nueva teoría económica. Esta aplica métodos estadísticos y

matemáticos al análisis de variables económicas y, sobre todo, a la relación de

dependencia que puede existir entre las mismas.

El objetivo último de este instrumento de investigación es estimar modelos que

permitan captar el comportamiento de los individuos, fenómenos económicos o

sociales, etc., a fin de predecir y hacer simulaciones sobre los mismos para establecer

políticas económicas adecuadas, a nivel macroeconómico, políticas respecto a la

empresa, a nivel microecnómico, proyecciones, etc..

Por ejemplo, contribuiría a establecer cuál debería ser el precio mínimo o volumen de

producción mínimo de una empresa, para lo cual se tomarían datos de las principales

variables que determinan el comportamiento de la demanda del bien que se generaría

con el proyecto, para luego definir un flujo de beneficios, sobre el que se haría un

análisis de sensibilidad y/o riesgo.

Si se desea inferir la valoración de un recurso natural que no tiene precio, se podría

modelar el comportamiento de los individuos respecto a sus preferencias, de tal forma

que después de hacer las manipulaciones matemáticas necesarias se llegue a un

resultado del cambio en el bienestar de la población afectada en términos monetarios,

utilizando para ellos aproximaciones como la variación compensada, la variación

equivalente, el excedente del consumidor, etc..

En la evaluación y formulación de proyectos se puede utilizar a la econometría para

proyectar la oferta y la demanda del bien que se generaría con los mismos. Para el

efecto, se estiman las funciones pertinentes utilizando las variables relevantes que

explican su comportamiento, una vez estimada se realizan las predicciones directamente

o través de tasas de crecimiento calculadas con base en las elasticidades (modelo

doblemente logarítmico) y variaciones porcentuales de las variables que convenga.

En economía agrícola si se trata de proyectar la producción o encontrar el óptimo físicoy económico es fundamental estimar funciones de producción y de costos, basadas en

datos de producción e insumos (mano de obra, tierra, capital, etc.), que permitirían

plantear en términos prácticos el problema del productor: la maximización de

beneficios.

En realidad, sería interminable citar ejemplos donde se puede utilizar a la econometría

como herramienta de análisis básico.

El propósito fundamental del análisis econométrico es hacer inferencias de una muestra

hacia la población, esto es generalizar resultados. Para el efecto se requiere que el

modelo estimado sea válido, es decir que cumpla con los supuestos y esté acorde con lateoría económica, por lo que una vez obtenidas las estimaciones se hacen pruebas de


3/41

APUNTES DE CLASE


3

diagnóstico. Si los signos y magnitud de los parámetros estimados no están acordes con

la teoría es necesario analizar el origen de estos resultados para corregir los posibles

errores cometidos, para reformular o refutar una teoría, si ésta no se puede aplicar a

nuestra realidad.

Concepto y Objetivos de la Econometría

Existen diversos conceptos de econometría, a manera de ejemplo citaremos dos que

recogen los elementos fundamentales de esta ciencia:

Gerhard Tinter dice que, la econometría es el resultado de la adopción de una posición

sobre el papel que juega la economía, consiste en la aplicación de la estadística

matemática a los datos económicos con el objeto de proporcionar no solo un apoyo

empírico a los modelos construidos por la economía matemática, sino una forma de

obtener resultados numéricos.

P. A. Samuelson define a la econometría como el análisis cuantitativo de los fenómenos

económicos reales basados en el desarrollo simultáneo de la observación y la teoría,

relacionados a través de apropiados métodos de inferencia.

Tratando de construir una definición que considere algunos criterios de diferentes

autores diríamos que la econometría es parte de los métodos cuantitativos de la

economía, combina métodos matemáticos y estadísticos en la estimación de un modelo,

el cual se ha establecido con base en la teoría económica que indica la relación de

dependencia entre variables y debe ser validado utilizando a la inferencia estadística

(pruebas de hipótesis) y contrastándolo con el enunciado de la teoría que se ha utilizado.

Se puede decir que la econometría, por lo tanto, se resumen en cinco etapas:

especificación, estimación, verificación predicción y recomendaciones de política.

El objetivo de la econometría es verificar y establecer la relación de dependencia entre

una variable dependiente y una o más variables independientes, a fin de obtener una

función que permita realizar predicciones, formulación de políticas y simulaciones.

Metodología

Para explicar la metodología utilizada por la econometría es necesario primero definir lo

que es un modelo.

Un modelo es una representación simplificada de un fenómeno económico o de la

realidad a través de una(s) función(es) o ecuación(es). Cuando decimos que la

producción de un bien depende del costo de los insumos, estamos resumiendo el

fenómeno de la producción para un determinado bien.

Explicitando los pasos que debe seguir un análisis econométrico se citaría los

siguientes puntos:


4/41

APUNTES DE CLASE


4

1. Consultar, en lo posible, toda la teoría existente con respecto al fenómeno que se

desea analizar. Esto permite definir las variables (dependiente e independiente(s)) y

su comportamiento en la explicación de un fenómeno, dando cuenta de la relación

funcional.

2. Con los resultados del paso anterior definimos una relación determinística entrevariables, esto significa que establecemos que los cambios en una de ellas se

atribuyen o están explicados por modificaciones en una o más variables, sin dejar

margen para un error. Es decir:

Y = f (Xi) (i = 1, 2, 3 ... n)

3. Con esta relación definimos la forma funcional que tendría. Para el efecto, se

utilizan varios métodos como el diagrama de dispersión, en el caso de un modelo

que tiene una sola variable dependiente, o simplemente ensayamos diferentes

formas funcionales (cuadrática, cúbica, logarítmica, etc.) y verificamos cual es la

que mejor se ajusta a los datos; por supuesto que la teoría también sugiere formas

funcionales, por ejemplo los rendimientos marginales decrecientes expresan que

una función de producción no sería lineal. Si, para el ejemplo, la forma funcional

adecuada es una lineal tendríamos:

Y = β0 + β1 X

4. El modelo anterior es matemático o determinístico y hay que convertirlo a

econométrico, para lo cual lo único que se debe hacer es agregarle el término de

error, perturbación aleatoria o “canasta aleatoria”. Esto se debe a que,

generalmente, cuando trabajamos con variables económicas y sociales siempre hay

riesgo de cometer errores de medición; por otro lado, algunas variables son difícilesde cuantificar, o simplemente porque dada la definición misma de modelo y de su

característica de que éste debe ser parsimonioso, no se incluyen todas las variables;

a lo cual adicionaríamos los posibles errores en la forma funcional. El primer

aspecto se evidencia cuando preguntamos, por ejemplo, cuál es el ingreso mensual

de una persona, ésta nunca nos contesta con la verdad, hay tendencia a sobre o

subestimar.

Es esta la razón para decir que es una “canasta aleatoria”, porque contiene a todos

los errores que fuere posible cometer. La aleatoriedad se debe a que hay la

probabilidad y no la certeza de cometer una margen de error determinado; y, de que

sus resultados no siempre se cumplan. En el ejemplo, el modelo econométricoquedaría expresado como:

Y = β0 + β1 X + µ

5. Con este modelo nos servimos de procedimientos matemáticos y estadísticos para

la estimación, los que se concretan en métodos básicos como: Mínimos Cuadrados

Ordinarios (MCO), Máxima Verosimilitud (MV), Momentos, etc., los mismos que

serán explicados posteriormente.

6. Una vez estimado el modelo procedemos a validarlo contrastándolo con la teoríaeconómica para verificar si resultaron los signos esperados y las magnitudes


5/41

APUNTES DE CLASE


5

previstas; adicionalmente verificamos si se cumplen o no los supuestos, que se

resumen en la normalidad de los errores. Si una de las dos cosas falla significa que

hubo algún error en la estimación y tenemos que volver a reiniciar todo el proceso

hasta obtener un modelo adecuado a la realidad.

7. Con el modelo validado procedemos a aplicarlo, ya sea para predicciones oformulación de política económica, básicamente.

Cabe anotar que, los elementos de un modelo son: las ecuaciones, las variables y los

parámetros.

Las ecuaciones relacionan variables y pueden ser:

- de comportamiento, cuando reflejan la conducta de diferentes agentes;

- de definición, reflejan identidades contables;

- tecnológicas, como las funciones de producción que expresan una técnica para

producir;

- institucionales, reflejan la voluntad política de los agentes rectores de una economía

(impuestos, oferta monetaria, etc.); y,

- de equilibro, por ejemplo las de oferta y demanda en un sistema de ecuaciones,

donde no habría solución sin éstas.

Las variables son aquellas que cambian de valor en diferentes observaciones. En un

modelo éstas pueden ser:

- endógenas, que se determinan dentro de un modelo. Generalmente, las conocemos

como dependientes; y,- exógenas, que se determinan fuera del modelo. Se las conoce como independientes o

explicativas.

Los parámetros son valores fijos. En un modelo son los coeficientes que están ligados

con la(s) variable(s) independiente(s) y son los que precisamente se trata de encontrar a

través de su estimación.

Los modelos pueden ser de diferente tipo, entre los cuales tenemos:

- Uniecuacionales, cuando existe una sola ecuación;

- Multiecuacionales, cuando tenemos más de una ecuación (modelos de ecuacionessimultáneas);

- Dinámicos, cuando se incluye la variable tiempo; y,

- Estáticos, cuando se utilizan para explicar un fenómeno en un determinado momento

del tiempo.

El proceso para el análisis econométrico se resume en el siguiente diagrama de flujo:


6/41

APUNTES DE CLASE


6

Inferencia Estadística

Para hacer investigación es necesario familiarizarse con métodos cuantitativos que

permitan hacerla más efectiva.

La estadística comprende dos ramas fundamentales: la Estadística Descriptiva y la

Inferencia Estadística. La primera se ocupa de la recopilación, organización y

presentación de los datos. La segunda trata del desarrollo de los métodos de la teoría

estadística (aplicación), a fin de hacer generalizaciones de una parte (muestra) a un todo

(población).

TEORIA ECONOMIA

Revisión, análisis y definiciones

MODELO MATEMATICO

Determinístico

MODELO ECONOMETRICO

Probabilístico

ESTIMACION DEL MODELO

Métodos matemáticos y estadísticos

VALIDACION DEL MODELO

Viola los supuestos?

Está acorde con la teoría?(signos y valores esperados)

ES ADECUADO? NO

SI

PREDICCIONES, PROYECCIONES

FORMULACION DE POLITICAS

PRUEBAS DE HIPOTESIS

Aplicaciones de la teoría a la realidad

DATOS


7/41

APUNTES DE CLASE


7

La econometría utiliza a la inferencia estadística. La estadística descriptiva le interesa

solo en la medida que ciertos resultados (estadísticos) resumen diferentes

características de los datos (media, desviación estándar).

La diferencia entre estadística descriptiva e inferencia consiste en que, en el ámbito de

la primera los resultados obtenidos con los datos son un fin en sí mismo, mientras queen la segunda son solo un instrumento de análisis.

Conceptos básicos

Población.- se define como el conjunto de todas las observaciones (datos) posibles,

medidas o resultados.

Muestra.- conjunto de datos, medidas o resultados seleccionados a partir de la muestra.

Generalmente, en econometría para la estimación de modelos utilizamos muestras

obtenidas de acuerdo a algún mecanismo causal determinado, que se denomina

probabilístico.

Tanto las muestras como las poblaciones se describen a través de sus características

numéricas, que en el caso de una población se denominaran parámetros y en el de una

muestra estadísticos (medidas resumen).

Dado que la estadística se interesa por los fenómenos que pueden ser medidos o

contados es necesario conocer lo que es una variable y un atributo.

Variable.- es aquella que toma diferentes valores en distintas observaciones.

Atributo.- cuando el fenómeno no puede medirse pero si contarse. Un atributo es la

presencia o ausencia de una característica determinada. Por ejemplo: sexo (masculino o

femenino), educación (primaria, secundaria, superior), etc.

Constante.- como su nombre lo indica es aquella que no cambia de valor de una

observación a otra.

Variable estocástica o aleatoria.- sus valores no pueden ser determinados antes de ser

observados, ni controlados totalmente. Se caracterizan por tomar diferentes valores con

probabilidades diferentes a la unidad.

Variable no aleatoria.- la que es totalmente controlable o al menos se puede predecir

totalmente.

Variable continua.- es aquella que toma cualquier valor sobre la recta numérica. Ej:

tiempo, ingreso, temperatura, gasto, etc.

Variable discreta.- toman solo ciertos valores de la recta numérica, los mismos que

están separados por intervalos de igual longitud. Ej: número de hijos, número de puntos

obtenidos al lanzar un dado, etc.


8/41

APUNTES DE CLASE


8

Distribución de frecuencias (muestra) y de probabilidades (población).- es la

ordenación de datos de tal forma que se indique el número de observaciones

correspondientes a cada valor de la variable (discreta) o de cada intervalo de valores de

la variable (continua).

Naturaleza de la Inferencia Estadística

La inferencia se dedica a efectuar generalizaciones respecto a una población, con base

en la información proporcionada por la muestra.

Lo que hace a la aplicación de la inferencia un método científico es el hecho de que se

toma en consideración la selección de la muestra y que expresa los resultados en

términos de probabilidades.

El objetivo del muestreo y de todo lo relacionado con la inferencia es efectuar juicios

acerca de los parámetros de la población, basados en los estadísticos de la muestra.

Los juicios son pronósticos dotados de cierto grado de confianza y pueden ser de dos

tipos:

1. Se refiere a la estimación de un parámetro, es decir estimadores (información

resumida) que nos son más que fórmulas que describen un procedimiento para

efectuar conjeturas acerca del valor de un determinado parámetro.

2. Se refiere a la contrastación de una hipótesis respecto a un parámetro. Esto implica

un supuesto previo respecto al valor del parámetro, para lo cual utilizamos un

estadístico de prueba.

Distribuciones Muestrales

La forma de saber en que medida se puede confiar en un pronóstico es conocer la

conducta de la variable de análisis en todas las muestras posibles. Pues, se supone que

existe un proceso desconocido que genera los datos, el cual se describe por medio de

una distribución de probabilidades, que se caracteriza por algunos parámetros

desconocidos.

Estimador Perfecto

Es aquel que no tiene posibilidad de error. En otras palabras, su distribución muestral se

concentra en un solo punto y éste coincide con el valor que se estima. Pero estos son

infrecuentes dadas las características de las mediciones o datos.

Sin embargo, para que los estimadores sean al menos buenos debe tener ciertas

propiedades deseables:

Insesgado.- es cuando la distribución muestral tiene una media que es igual al parámetro

estimado, pues proporciona el resultado perfecto en promedio.


9/41

APUNTES DE CLASE


9

Eficiente.- se refiere a la distancia entre los valores estimados y el promedio de la

distribución, es decir al grado de dispersión entre los estimadores y el promedio que no

es más que deben tener la varianza mínima.

Consistentes.- referido a que a medida que se aumenta el tamaño de la muestra la

distribución tiende a concentrarse más alrededor del promedio.

Comentarios Finales

La econometría se puede utilizar en el estudio y análisis de una variedad de fenómenos

económicos, sociales, políticos, etc., lo cual demuestra la importancia que tiene el

manejo de este instrumento para, en particular, un economista.

Se puede observar que para que la econometría genere resultados válidos es necesario

entrar en un proceso iterativo hasta llegar a un modelo adecuado a la realidad.


10/41

APUNTES DE CLASEFUNDAMENTOS DE ECONOMETRIA Nancy Medina Carranco

10

CAPITULO I

ANALISIS DE CORRELACION

En este capítulo estudiaremos un tipo de análisis muy importante dentro del proceso de

estimación de un modelo econométrico, el de correlación.

1.1 Definición e Interpretación

El análisis de correlación busca medir o cuantificar el grado de asociación lineal entre

variables continuas, sin tener en cuenta cual de las dos es la dependiente o

independiente. Este análisis utiliza como herramienta básica el coeficiente de

correlación (ρ en términos poblacionales y r en términos muestrales), que se lo puedeinterpretar por su signo y magnitud.

Por su magnitud.- el coeficiente de correlación puede tomar valores entre más 1 y

menos 1, es decir que el límite mínimo es -1 y el límite máximo es+1. Obviamente, mientras más se acerca a uno (valor absoluto)

existe un mayor grado de asociación lineal entre variables y mientras

más se acerca a cero es evidente que no existe este tipo de relación.

Por su signo.- como habíamos mencionado el coeficiente de correlación puede

tener valores positivos y negativos. Si el coeficiente tiene signo

negativo se puede decir que existe una relación lineal inversa entre

las dos variables y si es positivo se dice que existe una relación

lineal directa entre las variables.

Para calcularlo se utiliza la fórmula:

r

X X Y Y

X X Y Y

i i

i

n

i i

i

n

i

n=

− −

− −

=

==

∑

∑∑

( ) ( )

( ) ( )

1

2 2

11

Donde nos damos claramente cuenta que es el numerador el que determina el sigo de r.

1.2 Características

El coeficiente de correlación tiene las siguientes características:

1. Sus valores están entre -1 y +1;

2. Maneja a las variables simétricamente, esto es que considera tanto a X como Y

como aleatorias y no las diferencia entre dependiente e independiente;

3. Si su resultado fuera 0, significa que no existe relación lineal alguna entre las

variables;

4. Si su resultado fuera 1, significa que existe una asociación lineal perfecta entre las

dos variables; y,5. Es la relación entre la covarianza entre X e Y y las varianzas de X y de Y.


11/41


11

Las principales Ventajas de este coeficiente es que es fácil de medir y de interpretar,

todos los paquetes estadísticos lo proporcionan y la escala no afecta al resultado. El

limitante es que solo mide la relación lineal entre dos variables.

1.3 Aplicaciones

Este tipo de análisis es muy importante para verificar si existe o no alguna relación

lineal y si ésta es positiva o negativa. Por ejemplo, si se desea ver si se cumple: la ley de

la demanda, interesa observa si existe una relación inversa entre la cantidad demandada

y el precio; la ley de la oferta, se trata de ver si hay una relación directa entre la

cantidad ofertada y el precio, etc.

Para el efecto, se deben hacer pruebas de hipótesis1 respecto al coeficiente de

correlación poblacional, tanto en la nula como en la alterna, con un nivel de

significancia. El estadístico de prueba útil en este caso es:

t r n

r t n=

− −

−≈ −

2

1 22

θ

Este estadístico tiene una distribución aproximadamente normal, en muestras pequeñas

se distribuye con una t de student con n-2 grados de libertad, es decir que se debe

contrastar con el valor teórico de esta distribución, de acuerdo al nivel de significancia

seleccionado.

El proceso para hacer una prueba de hipótesis se puede describir en los siguientes

pasos:

1. Planteamos la hipótesis nula y la hipótesis alterna2 que, en este caso, se refiere a si

existe o no una la relación lineal, o al verificación de una relación directa o inversa

entre dos variables. Es decir:

Ho: ρxy = 0 (no ∃3 relación o asociación lineal entre las variables X y Y)

Ha: ρxy ≠ 0 (∃ relación o asociación lineal entre las variables X y Y)

Ho: ρxy ≤ 0 (no ∃ una relación o asociación lineal directa entre X y Y)Ha: ρxy > 0 (∃ una relación o asociación lineal directa entre las variables X y Y)

Ho: ρxy ≥ 0 (no ∃ una relación o asociación lineal inversa entre X y Y)Ha: ρxy < 0 (∃ una relación o asociación lineal inversa entre las variables X y Y)

2. Definimos un nivel de significancia4 (α) dependiendo del error tipo I que se prevécometer. Generalmente, se utiliza el 5%, pero su valor es establecido por el

investigador.

1 / Una hipótesis es un supuesto que se hace con respecto al verdadero valor poblacional.

Una prueba de hipótesis no es más que la contrastación del valor muestral con el poblacional, para

realizar inferencias con respecto al último.2 / Para una definición y discusión de estos conceptos véase el Apéndice 1.1.

3 / ∃ = existe


12/41


12

3. Se evalúa el estadístico de prueba o valor calculado, el cual simplemente es una

fórmula que incluye el parámetro sobre el que se está realizando la prueba de

hipótesis, en términos muestrales (r), y que tiene la distribución de probabilidades

que se presume tiene el parámetro poblacional. En este caso se supone que tiene

una distribución aproximadamente normal, para muestras pequeñas se asume unadistribución t de student. La fórmula pertinente es la que se presentó anteriormente.

4. Buscamos el valor teórico, o el que le corresponde en la distribución de

probabilidades, en la tabla correspondiente (distribución normal o t-student),

considerando los grados de libertad, en este caso 2 porque perdemos dos valores al

calcular las medias utilizadas para estimar r.

5. Finalmente, contrastamos el valor calculado con el teórico sobre un gráfico de la

distribución correspondiente, la cual se dividirá en una región crítica, o de rechazo

de la hipótesis nula, y en una región de aceptación de la misma.

Por ejemplo, en una empresa de comercialización de enciclopedias el salario de sus

ejecutivos de ventas se relaciona directamente con el volumen de ventas logrado en un

período determinado. Se desea verificar esta proposición para los siguientes datos

disponibles:

Salario (Y)

(cientos de dólares)

Ventas (X)

(número de enciclopedias)

4 30

6 30

5 407 50

7 60

1. Ho: ρxy ≤ 0 (no ∃ una relación o asociación lineal directa entre X y Y)Ha: ρxy > 0 (∃ una relación o asociación lineal directa entre las variables X y Y)

2. α = 5%

3. Calculamos el estadístico de prueba -> t calculado (tc)

t cr n

r t n=

− −

−≈ −

2

1 22

θ

Para el efecto, necesitamos el valor de r que lo obtenemos con la fórmula:

4 / Para entender de mejor forma este concepto véase el Apéndice 1.1.


13/41


13

r

X X Y Y

X X Y Y

i i

i

n

i i

i

n

i

n=

− −

− −

=

==

∑

∑∑

( ) ( )

( ) ( )

1

2 2

11

=>

Y X Yi - Y Xi - X (Xi - X)(Yi -Y) (Yi -Y)2 (Xi -X)

2

4 30 -1,8 -12 21,6 3,24 144

6 30 0,2 -12 -2,4 0,04 144

5 40 -0,8 -2 1,6 0,64 4

7 50 1,2 8 9,6 1,44 64

7 60 1,2 18 21,6 1,44 324

Sumatorias( ) 29 210 52 6,8 680

Promedios Y = 5.8 X = 42

Aplicando la fórmula encontramos que r = 0,764705882.

Cómo se interpreta este valor?. Su signo es positivo por lo que se diría que existe una

relación directa entre el salario percibido por un vendedor y el volumen de ventas que

logra el mismo. Por su magnitud, el grado de asociación lineal entre las variables es del

76.5%, aproximadamente, que significa que existe asociación lineal entre las variables.

Conocemos que n = 5 y θ = 0 (θ es el valor de la hipótesis).

Calculamos tc:

t c = − −

−=

0 76471 5 2 0

1 0 764712 05548

2

.

( . ).

4. tt (t teórico) = t 5%, 5-2 gl (para una cola) = 2.353

Observemos que hemos puesto el valor teórico de t con el 95% de confianza y 3

grados de libertad para una cola. 95% porque el nivel de significancia α = 5% y el

de confianza es simplemente 1- α. Una cola (y derecha) porque en la hipótesisalterna decimos que el valor de el coeficiente de correlación debe ser mayor que

cero para que se cumpla esta hipótesis.

5. Contrastamos el estadístico (tc) con el teórico (tt), el último valor es el que define

la región crítica y la de aceptación.


14/41


14

Con esta contrastación concluimos:

Como el tc está a la izquierda del tt, es decir en la región de aceptación de la

hipótesis nula (A Ho) (no existe una relación directa entre salario y ventas), se

puede decir con el 95% de confiabilidad que no existe una relación directa

(positiva) entre el salario y las ventas.

Cabe señalar que, cuando empezamos a plantear un modelo econométrico se debe

efectuar análisis entre las variables para observar si existe o no relación entre ellas, de

tal forma que la incorporación de una variable en un modelo esté sustentada. El

coeficiente de correlación contribuye a definir la existencia o no de una asociación

lineal entre dos variables de tipo continuo.

Cuando se trata de variables categóricas, o de combinaciones entre categóricas y

continuas se debe utilizar otro tipo de análisis, tales como el de contingencia.

Por ejemplo, si disponemos de datos relativos al número de personas por estratos (bajo,

medio y alto), quienes a su vez están divididas por el tipo de ingreso que perciben (bajo,

medio y alto), como se indica en la siguiente tabla.

TABLA DE DATOS

Ingresos Total

Estrato Bajo Medio Alto

Bajo 10 7 6 23

Medio 9 11 12 32

Alto 7 9 15 31

Total 26 27 33 86

Así, la columna total significa que en el grupo donde se ha levantado la encuesta existen

23 personas de estrato bajo, 32 de medio y 31 de alto. De las 23 personas de estrato

bajo, 10 tienen ingreso bajos, 7 medio y 6 altos, dentro de su estrato, y así

sucesivamente. Se trata de establecer si existe alguna relación entre el estrato y el nivel

de ingreso, para lo cual se debe calcular el estadístico de prueba Xc, debido a que tiene

una distribución Chi-cuadrado, a través de la fórmula:

X cO e

e

i j i j

i j ji

= −

∑∑( )2

Donde Oij es el valor observado y eij es el valor esperado, de la frecuencia.

Construimos una tabla de contingencia, como se presenta a continuación:

02.3532.055

A HoR Ho


15/41


15

Ingresos Total

Estrato Bajo Medio Alto

Bajo 10 26*23/86 7 27*23/86 6 3*23/86 23

Medio 9 26*32/86 11 27*32/86 12 33*32/86 32 Alto 7 26*31/86 9 27*31/86 15 33*31/86 31

Total 26 27 33 86

Donde, en cada celda se encuentra el valor observado (Oij), primer número, y el valor

esperado (eij), segunda expresión. A continuación calculamos los eij en la siguiente

tabla:

Estrato ei,1 ei,2 ei,3 e1,j 6,953 7,221 8,826

e2,j 9,674 10,047 12,279

e3,j 9,372 9,733 11,895

Por último procedemos a calcular cada elemento de la fórmula mencionada

anteriormente y Xc, como se observa en la siguiente tabla:

(Oi,1-(ei,1))2 (Oi,2-(ei,2))

2 (Oi,3-(ei,3))

2

(O1,j-(e1,j))2 1,33476 0,00676 0,90463

(O2,j-(e2,j))2 0,04701 0,09049 0,00634

(O3,j-(e3,j))2 0,60038 0,05514 0,81030

Xc 3,85583

Ahora realizamos la prueba de hipótesis:

1. Ho: X 2= 0 (no ∃ relación entre estrato y nivel de ingreso)Ha: X 2 ≠ 0 (∃ relación entre estrato y nivel de ingreso)

2. α = 5%

3. Calculamos el estadístico de prueba -> Xc

Xc = 3,85583 ∼ X 2 (i-1)*(j-1) gl

4. Xt (X teórico) = X 5%, 4 gl (para una cola) = 9.48773

Observemos que hemos puesto el valor teórico de X con el 95% de confianza y 4

grados de libertad, que se obtiene de (i-1)*(j-1) = (3-1)*(3-1)= 4.

5. Contrastamos el estadístico (Xc) con el teórico (Xt), el último valor es el que define

la región crítica y la de aceptación.


16/41


16

Con esta contrastación concluimos:

Como el Xc está a la izquierda del Xt, es decir en la región de aceptación de la

hipótesis nula (no existe relación entre el nivel de ingresos y el estrato), se puede

decir con el 95% de confiabilidad que no existe relación entre el nivel de ingreso y

el estrato.

Observemos que la Chi-cuadrado ( X 2) tiene una forma diferente a la distribución t y

normal, pues relaciona un cuadrado con otro número, por lo que nunca puede ser

negativa y no es simétrica.

3.86

A HoR Ho

9.488 X 2

f( X 2)


17/41

APUNTES DE CLASE


20

CAPITULO II

ANALISIS DE REGRESION

En este capítulo estudiaremos el análisis de regresión como base fundamental para la

formulación de un modelo.

1.1 Análisis de correlación versus análisis de regresión

El análisis de regresión se utiliza para establecer una relación de dependencia o

funcional, lo cual requiere la definición de una función. Es decir que, mientras el

análisis de correlación mide el grado de asociación lineal, el análisis de regresión va

más allá, busca definir la relación de dependencia de una variable con otra(s).

Por otro lado, en tanto que el análisis de correlación maneja a las variables

simétricamente (las dos son aleatorias), el de regresión lo hace asimétricamente, lo cual

es uno de los supuestos básicos de un modelo, es decir supone que la variabledependiente es aleatoria y la(s) independiente(s) no aleatoria(s) o dada(s), fija(s) o

predeterminada(s). Se observa que este análisis diferencia cuál es la variable

dependiente y cuál es la independiente.

Con el análisis de regresión ya nos introducimos en el mundo de los modelos

econométricos.

Históricamente el concepto de regresión se lo atribuye a Galton, quien observó que la

estatura de los hijos de padres altos era baja y que la de hijos de padres bajos era alta,

pero que en promedio se tendía a un valor determinado o promedio.

En el análisis de regresión estimamos el valor medio de la variable dependiente con

base en valores “fijos” de la variable(s) independiente(s), es decir que se puede decir

que la función de regresión es la unión de las medias condicionales dado un valor

determinado de la variable independiente.

Gráfico No. 1

Consumo (X)

Ingreso (Y) E(Y\X) = f(X)

150000 500000

E(Y\X=500000


18/41

APUNTES DE CLASE


21

En el Gráfico No. 2 observamos una regresión lineal simple. La linealidad puede estar

dada desde el punto de vista de los parámetros y de las variables. En este documento

vamos a trabajar siempre con la linealidad en los parámetros.

1.2 Función de regresión lineal poblacional (FRP) y muestral (FRM)

Gráficamente:

Gráfico No. 2

x

x

x

x

x x

Observamos que a cada valor de X le corresponde un valor promedio de Y. La línea

Y=β0 + β1X se conoce como línea o función de regresión poblacional (FRP), que no esmás que la unión de los valores promedios de Y o de las esperanzas1 condicionales2 de

Y dado un Xi, con base en los valores poblacionales observados. Es decir, es el valor

medio que toma Y dado un valor para X, que en términos matemáticos se representa

como:

E(Y/Xi)= β0 + β1X

Pero como las estimaciones se realizan con base en muestras y no poblaciones, lo que

vamos a obtener es una función de regresión muestral (FRM). Esto debido a que,

generalmente, no se cuenta con los datos poblacionales: para las series de tiempo

muchas veces se dispone de una datos limitados en el tiempo; para series de corte

transversal, ya sea por costos o tiempo, tampoco se dispone de todas las observaciones

correspondientes a la población.

Generalmente, cuando se trata de tomar datos directamente se hace un muestreo que puede ser aleatorio, estratificado, etc., debido a que el tiempo, así como los recursos,

para el levantamiento de una encuesta son limitados. Es más, dependiendo del tipo de

cálculo que se utilice para determinar el tamaño de la muestra, con anticipación nos

fijamos un nivel de error y de confiabilidad.

Actualmente, se define a la regresión simple como el establecimiento de una relación

funcional entre la variable independiente y la(s) dependiente(s).

1

/ El valor esperado de una variable no es más que un promedio ponderado, donde las ponderacionescorresponden a las probabilidades de que tome determinados valores.

2 / La esperanza condicional es el valor promedio condicionado a una determinada probabilidad.

Y

X

Y = β0 + β1X (FRP)

x1 x3x2

Y= 0 + 1X FRM


19/41

APUNTES DE CLASE


22

La importancia de este tipo de análisis se observa en las aplicaciones de sus resultados,

que como hemos mencionado hacen posible realizar simulaciones, formulación de

políticas y predicciones, entre las principales.

Ahora que, al predecir con la FRP cometemos un error µi, que es la diferencia o

distancia existente entre el valor medio poblacional estimado para Y y el valorobservado para la misma variable. En este sentido, se puede decir que un modelo de

regresión simple es una relación funcional entre una variable independiente y una

dependiente, quedaría expresado como:

E(Yi/Xi) = β0 + β1 Xi + µi

En tanto que, si predecimos con la FRM cometemos un error ei, que es un estimado

considerado como la distancia existente entre la FRM y la FRP, es decir:

E(Yi/X

i) = β

0 + β

1 X

i + e

i

Entonces, tendríamos:

Valores estimados

de la muestra

Valores

poblacionales

FRM FRP

β0 β0 β1 β1 ei ui

Yi E(Yi\Xi)

Características de la línea de regresión

1. Pasa por los puntos formados por las observaciones de X y los valores promedio

condicionales de Y ( X , Y);2. La media de los valores estimados es igual a la media de los valores observados

Y=Y; y,

3. La sumatoria de los errores estimados es igual a cero Σei = 0

1.3 Método de estimación de la FRM

Una vez definida la función se procede a estimar el modelo. Para el efecto existen

diferentes métodos, entre los cuales el más conocido y el que utilizaremos en los

primeros capítulos es el de Mínimos Cuadrados Ordinarios (MCO).

Como observamos en el Gráfico No. 2, el valor promedio de Y no corresponde

exactamente al valor poblacional, existe un margen de error (µi); por otro lado, haydiferencia entre la FRP y FRM, la cual es la que estimamos. Lo que intenta este método

es justamente minimizar el error (distancia) entre las dos funciones. Puesto que:


20/41

APUNTES DE CLASE


23

Y = β0 + β1 Xi + ei => ei = Y - (β0 + β1 Xi)

Ahora que sería inútil minimizar la sumatoria de los errores, pues en promedio sabemos

que éste es igual a cero. Pero si tiene sentido minimizar la sumatoria de los errores al

cuadrado, esto es:

min e Y X ii

n

i

n

i

= =∑ ∑= − +

1

0

1

1

2[ ( )] β β

Aplicando el concepto de optimización, es decir intentamos encontrar el valor óptimo

de los βi para minimizar la sumatoria de los errores al cuadrado. Para el efecto,aplicamos conocimientos de cálculo diferencial, sacando las condiciones de primer

orden (la primera derivada de la expresión con respecto a cada uno de los parámetros

desconocidos (βs) será igual a cero) y de segundo orden (la segunda deriva de la

expresión con respecto a cada uno de los βs es mayor que cero).

∂

∂ β

∂ β β

∂ β

( )

( )

( ( ))

( )

e Y X i

i i

2

0 1

2

0= − +

=

∂

∂ β

∂ β β

∂ β

2 2

2

2

0 1

2

20

( )

( )

( ( ))

( )

e Y X i

i i

= − +

〉

Al obtener las derivadas de primer orden encontramos dos ecuaciones con dos

incógnitas, β0 β1, que al resolverlas nos dan como resultado lo que denominamos comoecuaciones normales, que a saber son:

Y n X ii

n

i

i

n

= =∑ ∑= +

1

0 1

1

β β

X Y X X i ii

n

i

i

n

i

i

n

= = =∑ ∑ ∑= +

1

0

1

1

1

2

β β

Este sistema de ecuaciones es resuelto por cualquier método matemático (adición,substracción, igualación, suma y resta, etc.) para encontrar los valores de los parámetros

desconocidos, que constituyen los estimadores de MCO. Una vez estimados definimos

el modelo como:

Y = β0 + β1 Xi

1.4 Supuestos del Modelo Clásico de Regresión Lineal Simple

(MCRLS)


21/41

APUNTES DE CLASE


24

Siempre se deben establecer supuestos sobre el modelo. Los más importantes o los que

deben quedar explícitos son los relativos al término del error. Los supuestos que debe

cumplir un modelo econométrico son:

1. Recordemos que en la estimación de un modelo hay un margen de error, los cuales

pueden ser positivos o negativos. El valor esperado o promedio estimado de lavariable dependiente, a través de la regresión muestral estará subestimado o

sobrestimado con relación al valor poblacional. Por lo tanto, se espera que en

promedio los errores sean cero, o el valor esperado de los errores es igual a cero,

esto es:

E X i i( / ) = 0

Intuitivamente significa que los errores cometidos al estimar el modelo no afectan

sistemáticamente al valor promedio de la variable dependiente, es decir que refleja

el verdadero valor poblacional.

2. Que los errores no están correlacionados, es decir que no existe autocorrelación en

el modelo, esto es:

Cov (µi, µ j) = 0 (i ≠ j) pues,

Cov (µi, µ j) = E[ui - E(ui)] [u j- E(u j)]

Cov (µi, µ j) = E(ui u j) = E(ui) E(u j) = 0 (i ≠ j)

Intuitivamente significa que el valor de la observación i no influye en el de la j. Por

ejemplo, en series de tiempo el pasado no explica al presente; en series de corte

transversal significa que las variaciones de ingreso en un grupo de personas no

explican los cambios en el consumo de otro grupo.

3. Que la varianza es única, o el modelo es homocedástico, esto es:

Var (µi) = E (µi)2 = σ2

Porque:

Var (µi) = E [µi - E (ui)]2 = σ2

Intuitivamente significa que el crecimiento (decrecimiento) de la variable

independiente no afecta o conlleva modificaciones en la varianza del error del

modelo.

4. Que las observaciones de la variable independiente no están correlacionadas con elerror, esto es:

0 0

0 0

0


22/41

APUNTES DE CLASE


25

Cov (Xi, µi) = 0

5. Finalmente, se supone que el modelo está bien especificado. Es decir que, la forma

funcional se ajusta a los datos y que se han incluido las variables relevantes. Esto

implica que no cometemos sesgo de especificación.

Estos cinco supuestos se pueden resumir en:

µ ∼ N (0, σ2)

Lo cual significa que, los errores se distribuyen normalmente con media cero y varianza

σ2. Estos supuestos se deben cumplir porque de lo contrario estamos en problemas.

Si un modelo lineal simple cumple con todos estos supuestos tenemos el MCRLS

(Modelo Clásico de Regresión Lineal Simple). Según Markov si a este modelo

aplicamos el método de estimación de MCO, los estimadores van a ser los Mejores

Estimadores Lineales Insesgados (MELI).

Sabemos que para que un estimador sea perfecto debe ser:

1. Insesgado, lo que significa que en promedio los estimadores son igual al verdadero

valor poblacional, lo que permite que las inferencias sean válidas. Esto es:

E(βi) = βi

2. Eficiente, se refiere a la distancia entre los valores del estimador y el valor del

parámetro, e implica que entre todos los estimadores se ha seleccionado aquel de

varianza mínima (distancia mínima o de menor dispersión).

3. Consistente, que no es más que un estimador se acerca cada vez más a su

verdadero valor poblacional a medida que se aumenta el tamaño de la muestra, o

tiende a concentrarse más alrededor del verdadero valor del parámetro.

β i

βi1 βi2


23/41

APUNTES DE CLASE


26

Estas tres características están bajo el supuesto que se realizan estimaciones de

diferentes modelos para diferentes muestras, obviamente esto es teórico, pues sabemos

que en virtud de los costos, en la práctica, utilizamos una sola muestra.

1.5 Errores de precisión de los estimadores, intervalos de confianza y

pruebas de hipótesis

Errores de precisión de los estimadores

Conocemos que entre todos los estimadores se escoge aquel que cumple con las

propiedades teóricas; sin embargo, en la práctica lo que estimamos es uno solo, con

base en la muestra, por lo que es necesario considerar los errores que tienen éstos conrespecto al verdadero valor poblacional.

Esta medida la conocemos como la desviación típica o estándar, que se define como una

medida de dispersión de todos los valores estimados para un parámetro con respecto a

su verdadero valor poblacional (valor promedio de estos estimadores, si cumple con la

propiedad de ser insesgado) varianza.

Esta es muy importante para calcular intervalos de confianza y para hacer pruebas de

hipótesis respecto a los parámetros.

Var S S

X X

S S

i

i

n( ) ( )

( )

( ) ( ) β β β β 1 12

2

1

2 1 1

2= =

−

=> =

=∑

Var S

S X

n X X

S S

i

i

n

i

i

n( ) ( )

( )

( ) ( ) β β β β 0 02

2 2

1

1

2 0 0

2= =

−

=> ==

=

∑

∑

βi


24/41

APUNTES DE CLASE


27

Donde: S2 es la varianza del modelo, es decir es la varianza del error (discrepancia

entre la FRM y la FRP), que tan cerca está el valor estimado del verdadero

valor poblacional:

ei = Yi - Yi

Intervalos de Confianza

La estimación de un modelo da como resultado estimadores puntuales de los parámetros

(un solo valor). En la práctica es muy arriesgado presentar los resultados de esta forma,

pues la estimación se hace con base a una muestra, por otro lado hay el riesgo de no

incluir todas las variables explicativas, por las razones que hemos venido mencionado, y

de cometer errores de medición. En este sentido, es mejor presentar los resultados en

forma de intervalos con cierto nivel de confianza, es decir decimos que la probabilidad

de que el valor estimado se encuentre en un determinado intervalo con tal grado de

confianza.

Como los valores que se estiman son de los parámetros y del promedio de la variable

dependiente, habrá intervalos de confianza para cada uno de los parámetros y para el

valor promedio.

Intervalo de confianza para los estimadores

IC(βi) = Probabilidad[Límite inferior, Límite superior] = (1- α)% de confiabilidad

IC ob t S t S i i n i i ni i( ) Pr [ * * ] ( )%/ , / , β β β β α α β α β = − ≤ ≤ + = −− −2 2 2 2 1

Intervalo de confianza para el valor esperado de la variable dependiente

IC E Y ob Y t S Y Y t S i i n Y i i n Y i i[ ( )] Pr [ * * ] ( )%/ , / ,= − ≤ ≤ + = −− −α α α 2 2 2 2 1

Donde:

S S n

X X

X X

Y

i

i

ni= +

−

−

=∑

2 0

2

2

1

1 ( )

( )

Donde X0 es un valor dado para X, pues recordemos que el valor promedio de Y está

condicionado a un valor de X.

Pruebas de hipótesis

Las pruebas de hipótesis son un poderoso instrumento para definir y establecer

conclusiones generales respecto a una población. El proceso de una prueba de hipótesis

es el siguiente:


25/41

APUNTES DE CLASE


28

1) Se deben formular la hipótesis, que son supuestos que se realizan con respecto al

verdadero valor poblacional. Decimos hipótesis porque son dos: la nula y la alterna.

La última apoya a la tesis del investigador y la primera simplemente es lo contrario.

Se comienza por la hipótesis alterna debido que se conoce la probabilidad de error

tipo I (α), que surge cuando se rechaza la hipótesis nula siento ésta verdadera; la

probabilidad de error tipo II (β) no se conoce, éste se genera cuando se acepta lahipótesis nula siendo esta falsa.

Esto debido a que se supone que existe una distribución de probabilidades para cada

uno de los parámetros estimados.

b) Al probar una hipótesis buscamos rechazar la hipótesis nula, lo que permite tener

evidencia para apoyar el supuesto establecido en la alterna. De esta forma, el

investigador prefija el nivel de probabilidad de error tipo I, es decir el margen de

error de rechazar la hipótesis nula siendo verdadera. En definitiva, fijamos un nivel

de significancia (

) que está a discreción del investigador.

c) Para probar la hipótesis se necesario contrastar dos valores, por lo cual se calcula un

estadístico de prueba con base en el valor del parámetro estimado, sobre el que se

está realizando la prueba, y en los valores planteados en la prueba de hipótesis (θ).

d) Una vez obtenido el valor calculado se lo compara con el valor teórico de la

distribución, el cual se consulta en las tablas respectivas, utilizando los grados de

libertad que constan en la tabla anterior.

e) Se procede a graficar la distribución correspondiente, en ésta es el valor teórico o de

tablas el que divide a la región crítica (de rechazo de la hipótesis nula) y a la deaceptación de la hipótesis nula. Sobre este gráfico se observa donde cae el valor

calculado, si en la de rechazo o en la de aceptación.

Si cae en la región crítica (de rechazo), se procede a concluir que con el 1- α % deconfiabilidad hay evidencia suficiente para decir que se cumple lo que se enuncia en

la hipótesis alterna (ojo: no cuando se rechaza la hipótesis nula se acepta

automáticamente la alterna). Si cae en la de aceptación se concluye que con el 1- α % de confiabilidad se prueba lo que se enuncia en la hipótesis nula.

Las dos pruebas de hipótesis centrales, fundamentales, y que en todo modelo se deben

realizar son la de relevancia y la de dependencia, cuyos estadísticos de prueba utilizados

son los que se presentan a continuación:

Estadístico de prueba

(valor calculado)

Parámetro Prueba de hipótesis Distribución

t S

c

i

i

= −∃ β θ

β

βi - Relevancia

- Específicas

t (Student) con n-k-1 g l

F CMR

CME c =

Razón de

cuadrados

- Dependencia glo-

bal, el modelo es

“bueno”

F (Fisher) con k gl para

el numerador y n-k-1

para el denominador


26/41

APUNTES DE CLASE


29

Prueba de Relevancia: se refiere a probar la importancia de una variable en la

explicación del comportamiento de la variable dependiente.

Si es importante se supone que el coeficiente que la

acompaña (βi ) es estadísticamente diferente de cero, por lo

tanto la prueba de hipótesis planteada es:

Ho: βi = 0Ha: βi ≠ 0

El estadístico de prueba es el que consta en la primera fila de la tabla anterior.

Prueba de Dependencia Global : se refiere a probar que todas las variables en su

conjunto explican a la variable dependiente, es

decir si todos los βi estimados son estadísticamente

diferentes de cero. La prueba de hipótesis planteada es:

Ho: β1 = β2 = β3 ... = βk = 0Ha: β1 ≠ 0, β2 ≠ 0, β3 ≠ 0 ... βk ≠ 0

El estadístico de prueba es el que consta en la tercera fila de la tabla anterior.

Cuál es el origen del estadístico F? lo deduciremos a partir de la Tabla de Análisis de

Varianza (ANOVA)

Fuente devariación

Grados delibertad (gl)

Suma de Cuadrados(SC)

CuadradoMedio (CM)

F calculado(Fc)

Regresión 1 SCR = β 1 ( )( ) X X Y Y i i− −∑ SCR/1Error n-2 SCE = Σei = SCT - SCR SCE/(n-2) CMR/CME

Total n-1SCT = ( )Y Y i −∑

2

SCT/(n-1)

Análisis de los resultados y forma de presentar el modelo

Los resultados de un modelo estimado se debe presentar de la siguiente forma:

Yi = β0 + β1 Xi(Sβ0) (Sβ1)

t = (tcβ0) (tcβ1)

R 2 = # %

Fgl = #

El análisis de los resultados comienza por la interpretación de los coeficientes

estimados, tanto por su signo como por su magnitud. Respecto a la última, en una

regresión lineal éstos reflejan variaciones marginales, es decir cuál será el cambio, en

términos absolutos, experimentado por la variable dependiente (Y), frente a un cambio

dado en la variable dependiente (X). El signo mostrara una relación directa o inversa de

la variable dependiente con respecto a la independiente.


27/41

APUNTES DE CLASE


30

Luego se realizan las dos pruebas de hipótesis centrales mencionadas anteriormente y,

de ser necesario o interés del investigador, también se hacen pruebas específicas.

Por ejemplo: se desea estimar un modelo de regresión simple de la demanda del bien X,

para lo cual se dispone de 12 observaciones de ésta variable y del precio del mismo bien. El resultado obtenido después de correr el modelo en el paquete estadístico TSP es

como se presenta a continuación:

Dxi = 25.2686 - 1.061 Pxi

(0.4194) (0.0338)

t = (61.25) (-31.35)

R 2 = 0.9899 = 98.99%

F1,10 = 982.72

Interpretemos los coeficientes β0 y β1. β0 =25.2686, representa a la intersección de lalínea de regresión con el eje Y, es decir que cuando X vale cero Y toma éste valor y

diríamos que si el precio del bien X es cero, la demanda de este mismo bien es de

25.2686 kilos. β1, en este caso, es la pendiente de la línea de regresión y expresa que siel precio del bien X aumenta (disminuye) en una unidad la demanda disminuye

(aumenta) en 1.061 kilos, es decir que existe una relación inversa entre las dos

variables.

La prueba de hipótesis de relevancia seguiría el siguiente procedimiento:

1. Ho: β1 = 0 (Px no es relevante para explicar las variaciones de Dx)

Ha: β1 ≠ 0 (Px es relevante para explicar las variaciones de Dx)

Planteamos así las hipótesis porque si el parámetro en análisis fuera estadísticamente

(no matemáticamente) igual a cero, la variable Px no influiría de ningún modo en los

cambios de Dx, pues Yi = β0 + 0 Px.

2. α = 5%

3. El estadístico de prueba sería:

tcS =

− β θ

β

1

1

∼ tn-2 gl

Donde: β1 = es el estimador , θ = es el valor de la prueba de hipótesis y Sβ1 = es ladesviación típica del estimador.

=>

-1.061 - 0

tc = --------------- ≅ -31.34830.03384

4. El tt = t α%, n-2 gl = t 5%, 10 gl (para dos colas) = 2.228


28/41

APUNTES DE CLASE


31

Es una prueba de dos colas, lo cual se determina con base en el signo establecido

en la hipótesis alterna, pues no interesa si es mayor o menor que cero, lo

importante es que sea estadísticamente diferente de cero.

5. Ahora contrastamos el tc con el tt, observamos que el tc es totalmente superior altt. es decir cae en la zona de rechazo de la hipótesis nula por lo que se pude

concluir que: con el 95% de confianza hay suficiente evidencia para decir que

Px si es relevante para explicar a Dx.

La prueba de hipótesis de dependencia.

1. Ho: β1 = 0 (no existe dependencia o el modelo no es “bueno”)Ha: β1 ≠ 0 (existe dependencia o el modelo es “bueno”)

Se observa que en este caso la de relevancia coincide con la dependencia por existir una

sola variable independiente.

2. α = 5%


Fc CNR

CME = ∼ Fk,n-k-1 gl

=>

Fc ≅ 982.72 (según los resultados obtenidos en el TSP)

4. El Ft = F α%, k, n-k-1 gl = F 5%, 1, 10 gl = 4.96

k son los grados de libertad del numerador y n-k-1 los del denominador.

5. Ahora contratamos el Fc con el Ft, observamos que el Fc es superior al Ft, es

decir cae en la zona de rechazo de la hipótesis nula por lo que se pude concluir

que: con el 95% de confianza hay suficiente evidencia para decir que el modelo

estimado es “bueno” o existe dependencia.

A Ho R HoR Ho

A Ho R Ho

4.96 982.72 F

f(F)


29/41

APUNTES DE CLASE


32

Una prueba de hipótesis específica es cuando planteamos, por ejemplo, probar que si Pxaumenta en una unidad la demanda no disminuye en 2 unidades.

1. Ho: β1 = -2 (si Px aumenta en una unidad la demanda disminuye en 2 unidades)Ha: β1 ≠ -2 (si Px aumenta en una unidad la demanda no disminuye en 2 unidades)

Planteamos así las hipótesis porque:

β 12

1= =

−∆

∆

Dx

Px

2. α = 10%


tcS

= − β θ

β

1

1

∼ tn-2 gl

=>

-1.061 - (-2)

tc = --------------------- ≅ 27.750.03384

4. El tt = t α%, n-2 gl = t 10%, 10 gl (para dos colas) = ± 1.812

Es una prueba de dos colas, lo cual se determina con base en el signo establecido

en la hipótesis alterna, pues no interesa si es mayor o menor que cero, lo

importante es que sea estadísticamente diferente de cero.

5. Ahora contrastamos el tc (27.75) con el tt (± 1.812), observamos que el tc

(27.75) es mayor que tt (+1.812). Es decir cae en la zona de rechazo de lahipótesis nula por lo que se pude concluir que: con el 95% de confianza hay

suficiente evidencia para decir que si Px aumenta en una unidad la demanda no

disminuye en dos unidades.

A HoR HoR Ho

+ 1.812- 1.81227.75


30/41

APUNTES DE CLASE


33

CAPITULO III

APUNTES ADICIONALES RESPECTO A

REGRESION SIMPLE

3.1 Por qué es conveniente plantear modelos con intercepto?

Un modelo sin intercepto se conoce como regresión a través del origen, de tal forma que

β0 = 0, lo que significa que la línea de regresión pasa por el origen y, por lo tanto, elmodelo quedaría expresado como:

Yi = β1 Xi + ui

Es preferible plantear un modelo con intercepto ya que como se observa en el siguiente

cuadro tiene sus ventajas:

Concepto Modelo sin intercepto Modelo con intercepto

Expresión

matemáticaYi = β1 Xi + ui Yi = β0 + β1 Xi +ui

Sumatoria de

los errores

La sumatoria de los errores no

necesariamente es igual a cero

La sumatoria de los errores

siempre es igual a cero

Coeficiente de

determinación

R 2 puede ser en algunos casos

negativo

R 2 siempre es positivo, porque

asume implícitamente que β0 está presente en el modelo

R 2 no puede ser adecuado para

estos modelos

R 2 si es adecuado

β 0 No existe Puede no ser estadísticamente

significativo

Se evidencia, entonces, que es conveniente plantear siempre un modelo con intercepto,

ya que si en realidad el intercepto es estadísticamente no significativo se interpretaría

como una regresión en el origen; en tanto que si es estadísticamente significativo y

plantemos sin intercepto cometeríamos un error de especificación, es decir se viola el

quinto supuesto, mencionando con anterioridad.

Por ejemplo si tenemos 10 observaciones de consumo e ingreso y corremos modelos

lineales en el TSP, primero con intercepto y luego sin intercepto, obtenemos los

siguientes resultados:

Y = 3.64 + 0.0888 X

(0.6191) (0.0106)

t= (5.8798) (8.3757)

R 2 = 0.8976 = 89.76%

F1,8 =70.152

Y = 0.144 X

(0.010)t= (14.32)


31/41

APUNTES DE CLASE


34

R 2 = 0.4552 = 45.52%

Observamos que R 2 disminuye drásticamente y, por lo tanto, hay mayor poder

explicativo con el primero (89.76%). Fc no ha sido posible calcularlo por el supuesto

que implícitamente el intercepto es parte del modelo. Aunque la variable independiente

tiene un tc mayor en el segundo modelo que en el primero, se pierden otros parámetrosestadísticos que validan el modelo con mayor certeza.

3.2 Unidades de escala

Es importante notar que las unidades de escala afectarán la interpretación de los

coeficientes obtenidos, en la medida que está sea diferente para la variable

independiente y para la dependiente. Así, si tenemos el modelo original como:

Yi = β0 + β1 Xi +ui

Y los modelos afectados por la escala como:

Yi* = β0 + β1 Xi* +ui

Yi* = β0 + β1 Xi +ui

Yi = β0 + β1 Xi* +ui

Donde: Yi* = Yi* = a Yi

Xi* = Xi* = a Xi

Es decir, las dos variables están afectadas por la misma escala, por ejemplo expresadas

en miles de sucres (divididas para mil). Utilizando las diferentes expresiones de cálculo para los coeficientes y para los errores estándar, correspondientes, así como para el

coeficiente de determinación.

β 11

2

1

1

2

1

= =

− −

−

=

=

=

=

∑

∑

∑

∑

x y

x

X X Y Y

X X

i i

i

n

i

i

n

i i

i

n

i

i

n

( ) ( )

( )

, β β 0 1= −Y X

S X

n x

i

i

β

σ

0

2 2

2=

∑∑

, S xi

β

σ 1

2

2=

∑

R r

X X Y Y

X X Y Y

i i

i

n

i i

i

n

i

n

2 2 1

2 2

11

= =

− −

− −

=

==

∑

∑∑

( )

( ) ( )

( ) ( )

, σ 22

2=

−

∑ en

i


32/41

APUNTES DE CLASE


35

Aplicando estas expresiones para calcular los diferentes parámetros se verían afectados

como se presenta en siguiente cuadro:

Parámetr

oYi* = β0*+ β1*Xi*

+ui

Yi* = β0*+ β1*Xi+ui

Yi = β0*+ β1*Xi*+ui

β0* a β0 a β0 β0

β1* β1 a β1 (1/a) β1

Sβ0* a Sβ0 a Sβ0 Sβ0

Sβ1* Sβ1 a Sβ1 (1/a) Sβ1

S* a S a S S

R 2* R 2 R 2 R 2

En el primer caso, donde, por ejemplo, a las dos variables se las a dividido por mil

observamos que únicamente el intercepto se ve afectado por lo que se interpretaría

dividido por mil. Para el segundo caso, donde solo a la variable independiente se la

expresa en miles, todos los parámetros deberían ser divididos por mil para su

interpretación. Finalmente, para el último caso en el que se afecta únicamente a la

variable independiente los resultados del coeficiente de la misma y de su respectivo

error estándar deberían ser multiplicado por mil para su interpretación.

Concluiríamos que la escala no afecta los resultados, pero que a la hora de interpretar si

se debe tener en cuenta este aspecto.

Qué pasaría si las escalas de medición que afectan a las variables son diferentes?, esto

es si a la variable independiente se la expresa en miles y la dependiente en millones y

viceversa.

Por ejemplo, con las mismas observaciones de consumo e ingreso y con a=5, tenemos

los siguientes resultados:

Y = 3.64 + 0.0888 X(0.6191) (0.0106)

R 2 = 0.8976

S2 = 0.7370

Y* = 18.20 + 0.44381 X => β0*= 5*3.64=18.2 ; β1*= 5*0.888 ≈ 0.444

(3.095) (0.05298) => Sβ0*=5*0.619≈3.095; Sβ1*=5*0.0106≈ 0.053

R 2 = 0.8976 => Es igual

S2 = 18.4256 => S2*= 25*0.7370 ≈ 18.4256

Y = 3.64 + 0.01775 X* => β0*= 3.64=3.64 ; β1*= 0.888/5 ≈ 0.01775 (0.6191) (0.0021) => Sβ0*=0.619≈0.6191; Sβ1*=0.0106/5≈ 0.021


33/41

APUNTES DE CLASE


36

R 2 = 0.8976 => Es igual

S2 = 0.7370 => S2*= 0.7370≈ 0.7370

Y* = 18.2 + 0.888 X* => β0*= 5*3.64=18.2 ; β1*= 0.888 ≈ 0.888

(3.095) (0.0106) => Sβ0*=5*0.619≈3.095; Sβ1*=0.0106≈ 0.0106

R 2 = 0.8976 => Es igual

S2 = 18.4256 => S2*= 0.7370*25≈ 18.425

En los resultados anteriores observamos que las estimaciones de la tabla se cumplen, es

decir que los coeficientes obtenidos son afectados en la medida que la variable

independiente o la dependiente cambien de escala.

3.3. Modelos simples no lineales

Hasta aquí hemos revisado modelos simples de tipo lineal; sin embargo, es importante

analizar aquellos no lineales, entre los que tenemos el doblemente logarítmico, lossemilogarítmicos y los inversos.

3.3.1 Modelo doblemente logarítmico:

Matemáticamente se expresa como:

Yi = β0 Xiβ1 e µ

Donde e es la base de los logaritmos neperianos o naturales. Este modelos se lo puede

linealizar utilizando las propiedades de los logaritmos. Así, si aplicamos logaritmos alos dos miembros de la función obtenemos:

ln Yi = ln β0 + β1 ln Xi + µ

Observamos que se convierte en un modelo doblemente logarítmico, pues se estima con

base en las observaciones de X y de Y, pero no originales sino de sus logaritmos. A esta

función se la conoce también como Cobb Douglas y es muy importante pues nos

permite obtener elasticidades directamente, es decir los βs estimados son elasticidades.

La interpretación correspondiente es que ante un cambio de un 1% (o 100%) de la

variable X cual es el cambio en términos de porcentaje para la variable Y. Recordemosque en lineal la interpretación de los βs era relativa a las variaciones marginales entérminos de valores absolutos, esto es ante un cambio de 1 unidad de la variables X cual

es cambio experimentado, en términos absolutos, por la variable Y.

El supuesto fundamental para aplicar el método de estimación de MCO es que el

modelo sea lineal en los parámetros más no en las variables, por lo tanto el modelo

presentado puede estimarse a través de este método.

Las características:


34/41

APUNTES DE CLASE


37

- El modelo doblemente logarítmico es una función constante en elasticidades pero

variable en la pendiente, no así en el lineal donde la pendiente es constante y la

elasticidad es variable a lo largo de la función.

- No tiene máximo ni mínimo

- Compacta la escala de estimación

Por ejemplo: si tenemos 36 observaciones relativas al ingreso y al consumo y

estimamos un modelo doblemente logarítmico y uno lineal en el TSP, obtenemos los

siguientes resultados:

LCONS = 0.0147954 + 0.98464 LING

(0.03888) (0.00533)

t= (0.38066) (184.836)

R 2 = 0.999 = 99.9%

F1,8 =34164.38

CONS = 9.77283 + 0.89974 ING

(9.6539) (0.005864)

t= (1.01232) (153.442)

R 2 = 0.9986 = 99.86%

F1,8 =23544.3

La interpretación para el primer modelo sería:

β1 = 0.98464, significa que si el ingreso aumenta en el 1% (100%) el consumoaumenta, pues el coeficiente es positivo, en el 0.98464% (98.464%). Es

decir es una elasticidad que debe interpretarse por la magnitud: esinelástica (cambio menos que proporcional); y, por el signo: que

expresa que es una relación directa.

β1 = 0.89974, en tanto que en el modelo lineal, significa que si el ingreso aumenta enuna unidad (por ejemplo 1 sucre) el consumo aumenta en 0.89974

unidades (por ejemplo 0.89974 sucres), pues el coeficiente es positivo.

Es decir es en este caso representa la propensión marginal a consumir, o

los cambios marginales en términos absolutos.

3.3.2 Modelos semilogarítmicos

Estos modelos solo tienen logaritmos de las observaciones originales en un solo

miembro de la función sea de X o de Y. Es decir:

ln Y = β0 + β1 Xi + µ

Y = β0 + β1 ln Xi + µ

La interpretación de los coeficientes: para el primer modelo se dice cual es el cambio

porcentual experimentado por Y frente a un cambio en términos de valores absolutos de

la variable X; éste modelo es muy importante cuando se trata de calcular tasas de

crecimiento en el tiempo. En el segundo, se interpretara como el cambio experimentado


35/41

APUNTES DE CLASE


38

por Y en términos da valores absolutos frente un cambio porcentual de la variable

independiente.

Explicando con mayor detalle el primer modelo semilog, si recordamos la fórmula de

interés compuesto tendríamos:

Yt = Y0 (1+r)t

lnYt = ln Y0 + t ln (1+r)

Ahora si: β0 = ln Y0, y

β1 = ln (1+r)

ln Yt = β0 + β1 t

Agregando el término de perturbación se tiene:

ln Yt = β0 + β1 t + ut

3.3.3 Modelos Recíprocos

Refleja una relación inversamente proporcional entre la variable independiente y la

dependiente,

1

Y = β0 + β1 + µ

X

Un ejemplo práctico para este modelo es la teoría macroeconómica del empleo.


36/41

APUNTES DE CLASE


39

CAPITULO IV

ANALISIS DE REGRESION LINEAL MULTIPLE

4.1 Definición y representación general de un modelo múltiple

El análisis de regresión múltiple, como su nombre lo indica, relaciona una variable

independiente con dos o más variables independientes. Su importancia radica en que la

realidad expresada a través de un modelo ya no es tan simplificada, pues en pocas

ocasiones encontraremos que un fenómeno o comportamiento esté explicado por una

sola variable; es decir este tipo de modelo, obviamente, tiene mayor poder explicativo.

En términos generales se lo puede representar como:

Yi = β0 + β1 X1i + β2 X2i + ... + βk Xki + µi

Expresado en forma matricial:

Y = β X + µ

Donde:

Y1 1 X11 X21 X31 ... Xn1 µ1

Y2 1 X12 X22 X32 ... Xn2 µ2

Y = Y3 X = µ =

Yn 1 X1n X2n X3n ... Xnn µn

4.2 Supuestos del Modelo

Los supuestos del modelo de regresión lineal múltiple son los mismo que para el simple,

pero se agrega uno que es el de la multicolinealidad. Así:

1. Recordemos que en la estimación de un modelo hay un margen de error, los cuales

pueden ser positivos o negativos. El valor esperado o promedio estimado de la

variable dependiente, a través de la regresión muestral estará subestimado o

sobrestimado con relación al valor poblacional. Por lo tanto, se espera que en promedio los errores sean cero, o el valor esperado de los errores es igual a cero,

esto es:

E X i i( / ) = 0

Intuitivamente significa que los errores cometidos al estimar el modelo no afectan

sistemáticamente al valor promedio de la variable dependiente, es decir que refleja

el verdadero valor poblacional.

2. Que los errores no están correlacionados, es decir que no existe autocorrelación enel modelo, esto es:


37/41

APUNTES DE CLASE


40

Cov (µi, µ j) = 0 (i ≠ j)

Intuitivamente significa que, por ejemplo, en series de tiempo el pasado no explica

al presente; en series de corte transversal significa que las variaciones de ingreso en

un grupo de personas no explican los cambios en el consumo de otro grupo.

3. Que la varianza es única, o el modelo es homocedástico, esto es:

Var (µ) = E (µ2) = σ2

Intuitivamente significa que el crecimiento (decrecimiento) de la variable

independiente no afecta o conlleva modificaciones en la varianza del error del

modelo.

4. Que las observaciones de la variable independiente no están correlacionadas con el

error, esto es:

Cov (Xi, µi) = 0

5. Las variables independientes no están correlacionadas, es decir que el modelo no

está afectado por la multicolinealidad, esto es:

Cov (Xi, X j) = 0 (i ≠ j)

6. Finalmente, se supone que el modelo está bien especificado. Es decir que, la formafuncional se ajusta a los datos y se han incluido las variables relevantes. Esto

implica que no cometemos sesgo de especificación.

Estos supuestos se pueden resumir en:

µ ∼ N (0, σ2)

Lo cual significa que, los errores se distribuyen normalmente con media cero y varianza

σ2.

Cuando tenemos este tipo de modelo es difícil inferir la forma funcional. En la práctica

lo que se hace es ensayar diferentes funciones, utilizando la teoría económica.

El método de estimación que vamos a utilizar es el de MCO, el proceso es el mismo que

en el modelo simple. Esto es resolvemos un proceso de optimización, minimizamos la

sumatoria de los errores al cuadrado.

4.3 Pruebas de hipótesis

Como en el modelo de regresión lineal simple en el múltiple también tenemos dos

hipótesis centrales: la de dependencia y la de relevancia.


38/41

APUNTES DE CLASE


41

Prueba de dependencia

Esta verifica el efecto conjunto y simultáneo de todas las variables independientes sobre

la dependiente. Se la conoce también como la prueba de bondad del modelo. Por

ejemplo si el modelo es:


La hipótesis será:

Ho: β0 = β1 = β2 = ... βk = 0

Ha: β0 ≠ 0, β1 ≠ 0, β2 ≠ 0, ... , βk ≠ 0

Donde, como se analizó anteriormente, el estadístico de prueba es el Fc.

Prueba de relevancia

Esta prueba verifica si cada una de las variables independientes son importantes para

explicar los cambios de la variable dependiente. Igual que en el modelo de regresión

simple planteamos la hipótesis de la siguiente forma:

Ho: βi = 0

Ha: βi ≠ 0

Y el estadístico de prueba es el mismo que en el caso lineal simple, esto es el tc.

Hipótesis específicas

Son supuestos que se realizan con respecto a valores determinados de los parámetros

poblacionales. Por ejemplo, si queremos probar que en una función de producción con

tres insumos existen rendimientos crecientes, en un modelo como:

Yi = β0 X1i β1

X2i β2 X3

β3 e u

La hipótesis será:

Ho: β1 + β

2 + β

3 ≤ 0

Ha: β1 + β2 + β3 > 0

En este caso el estadístico de prueba es diferente, así:

tc s X X

t n k gl = −

≈−

− −

λ β θ

λ λ

'

' ( ' ),

2 11

Donde: λ = vector de coeficientes de los βs de la hipótesis; S2 (X’X)-1 = matriz de

Var-Cov (β)


39/41

APUNTES DE CLASE


42

4.4 Intervalos de confianza

Para los estimadores:

I ob t s X X i n k

( ) Pr [ ' ' ( ' ) ]/ ,

β λ β λ λ α

= ±− −2 1

2

Para la predicción:

I E Y X ob Xo t s Xo X X Xon k ( ( / ) Pr [ ' ' ( ' ) ]/ ,= ± − − β α 2 12

4.5 Multicolinealidad

La multicolinealidad se presenta cuando las variables independientes están

correlacionadas. Es decir se está violando un supuesto y, por lo tanto, las inferencias yano tienen validez.

Las causas para que se de este problema son: generalmente, los modelos utilizan

variables sociales y económicas, por lo que casi siempre se va a presentar este

problema. Es difícil encontrar en la práctica que variables de este tipo no se relacionen

de ninguna forma. Por lo que se trata de corregir reduciendo este problema, nunca se va

a eliminar totalmente.

Se pude decir que existe multicolinealidad perfecta cuando el coeficiente de correlación

entre variables independientes es igual a 1, en este caso no se puede estimar el modelo

porque la matriz X es singular o no es de rango completo. También se dice que la

multicolinealidad es menos que perfecta, en cuyo caso si es posible estimar el modelo

pero existen problemas de inferencia, por lo que hay que trata de reducirla corrigiendo.

Para detectar:

Una forma es encontrando los coeficientes de correlación entre las variables

independientes, si este es cercano a uno significa que las variables están altamente

correlacionadas.

Otra forma es corriendo regresiones entre las variables independientes, esto es que unade ellas es independiente y a la otra (s) como dependiente. Si son relevantes para

explicar en los modelos, tendremos alta multicolinealidad.

Para corregir, se podría pensar en eliminar una variable que se causa de la

multicolinealidad, pero es posible que se genere un sesgo de especificación.

4.6 Autocorrelación

La autocorrelación significa que los errores están relacionados. En series de tiempo que

el pasado explica al presente, en series de corte transversal que el cambio en una

variable de un grupo afecta a otro grupo. Se presenta más en series de tiempo.


40/41

APUNTES DE CLASE


43

Esta violación de los supuestos tiene consecuencias importantes, por lo que será

necesario corregirla. Para detectar este problema se puede utilizar el estadístico Durbin-

Watson y para corregir se utiliza la Ecuación de Diferencias Generalizadas.

4.7 Heterocedasticidad

La hetorecedasticidad es la violación del supuesto relativo a que la varianza es única, o

que el modelo es homocedástico. Significa que a medida que aumenta o disminuye la

variable independiente, causa de este problema, aumenta o disminuye la varianza de los

errores.

Este problema es más frecuente en series de corte transversal. Por ejemplo, cuando

estamos estimando un modelo de consumo en función del ingreso, para un bien

especifico y tenemos las observaciones clasificada según estrato económico,

obviamente dependiendo del tipo de bien, el consumo aumenta en diferente forma para

cada estrato.

4.8 Sesgo de Especificación

Recordemos el último supuesto, tanto del modelo simple como múltiple, que dice que

un modelo debe estar bien especificado, es decir poseer la forma funcional correcta y

las variables relevantes. Observamos pues que, la violación de este supuesto conduce a

un sesgo de especificación que puede estar dado por:

- Forma funcional inadecuada o que no se ajusta a los datos- Omisión de variables relevantes

- Inclusión de variables irrelevantes

- Errores de medición.

Siendo la omisión de una o más variables relevantes el problema más grave.

4.9 Proceso para estimar un modelo

Es importante conocer el proceso de estimación de un modelo, el mismo que debeseguir una secuencia lógica. En este sentido, a continuación se presenta los pasos que,

según criterio del autor, son los más importantes.

1. Revisión de la teoría, es el paso fundamental dentro de un proceso de investigación.

Cuando se está estudiando un fenómeno social o económico, es importante recopilar

las principales teorías que existen al respecto, las cuales deben ser actualizadas y

ajustarse a la realidad objeto de estudio.

2. Con esta teoría se puede definir una relación funcional deterministica. Esto es:

Y = f (X1, X2, X3, ... Xk )


41/41

Es decir, la teoría es la base sobre la que se construye un modelo, contribuye a definir la

cual es la variable dependiente y cual o cuales las independientes.

3. Con esta relación determinista procedemos a establecer la relación funcional: lineal,

cudrática, doblemente logarítmica, etc.. Primero basándonos en la propia teoría para

luego ensayar las funciones que deducimos se pueden ajustar a los datos y a la teoríay, finalmente, determinar el modelo econométrico.

Por ejemplo, si la relación más adecuada fuera una lineal tendríamos:


4. Se procede a la estimación de la función establecida, observando primero el

coeficiente de determinación del modelo. Obviamente si éste se acerca más a la

unidad los datos se ajustan al modelo. De no ser así, se inicia con un proceso

iterativo, donde ensayamos diferentes tipos de funciones siempre observando el

estadístico mencionado.

5. Con estos modelos estimados procedemos a validar el modelo. Para el efecto,

primero debemos partir siempre del modelo original, no del corregido, para ver si no

viola ninguno de los supuestos utilizando pruebas de hipótesis y los diferentes

métodos para detectar estos problemas. Si es así corregimos con los diferentes

métodos señalados.

También dentro de la validación se debe analizar si el modelo cumple con lo que se

espera de acuerdo a la teoría, esto es la magnitud de los coeficientes y los signos. Si no

cumple estos aspectos existe algún errores y debemos volver al paso 1.

6. Una vez que tenemos el modelo validado estadísticamente y a través de la teoría

económica procedemos a: primero interpretar cada uno de los coeficientes estimados;

y, segundo a hacer pruebas de hipótesis que nos permitan hacer ciertas inferencias,

de interés, para generalizar las características de la muestra a la población objeto de

estudio.

7. Finalmente, según los intereses de la investigación se pueden hacer simulaciones y

formulación de política económica. Para luego escribir las conclusiones y

recomendaciones, definidas primero sobre el propósito de la investigación, después

sobre la facilidad o dificultad de la investigación como tal; y, por último sobre losresultados del modelo, así como sobre su validez.

Documents

Econometria Eco Medina