3C0N0M3TR14

383

Click here to load reader

Transcript of 3C0N0M3TR14

  • ,

    ECONOMETRIA

  • , I

    ECONOMETRIA

    Primera Parte

    ~/ EDITORIAL V FUX VARELA La Habana. 2005

  • PROLOGO

    El objetivo fundamental de la segunda edicin del texto Econometrfa bsica sigue siendo el mismo. Se busca proporcionar una introduccin elemental y comprensible de la econometra, sin tener que recurrir al lgebra matricial, al clculo ni a la estadfstica, ms all de un nivel elemental.

    Desde la publicacin de la primera edicin de este libro en 1978, he re-cibido innumerables sugerencias de parte de alumnos, profesores e investi-gadores tanto de los Estados Unidos como del exterior sobre cmo se puede mejorar el libro y hacerlo accesible el una m,ayor audiencia. En respuesta a estas sugerencias y tambin buscando reflejar los nuevos acontecimientos en materia econmica desde 1978, he revisado y actualizado significativamente este libro: Algunos de los cambios ms importantes en la segunda edicin son los siguientes: l. La notacin de subndice Yule se ha eliminado y se ha remplazado por

    una notacin mucho ms simple. 2. La expo'sicin de algunos temas incluidos en la primera edicin se ha sim-

    plificado y algunoslde los conceptos ms abstractos se han clarificado con mayor profundidad. Las pruebas matemticas, donde son necesarias, se relegan a los apndices.

    3. Temas tales como las pruebas de Goldfeld-Quandt y Breusch-Pagan de heterocedasticidad, la prueba del ndice de condicin de la multicolinea-lidad, la prueba Xl de autocorrelacin, la prueba RESET de Ramsey para la especificacin de errores, la prueba de Chowpara la comparacin de dos o ms regresiones, los efectos de interaccin de las variables dicot-micas y otros temas similares se presentan ahora en diferentes captulos. Todos estos temas se ilustran con ejemplos numricos.

    4. Se han incorporado tres nuevos captulos que reunen material que se en-contraba disperso en la primera edicin. En el Captulo 6 (Extensiones al modelo de regresin lineal con dos variables) se cubren los siguientes temas: Regresin a travs del origen, escalamiento de las unidades de medida yl formas funcionales para los modelos de regresin, tales como los modelos log-lineal, semilogartmico y recprocos. En el Captulo 11 (Especificacin de modelos) se analizan los atributos de-un buen modelo

  • y se consideran las consecuencias de un modelo inc~rrectamente especi-ficado. Tambin se trata en este c~p1tulo el tema de la medicin de erro-res. En el Captulo 13 (Regresin sobre una variable dep~ndiente dico-tmica: Los modelos MPL, Logit y Probit), se da un tratamiento ms profundo al caso en donde la variable dependiente es dicotmica (s / no, presente I ausente). Algunos ejemplos numricos, como tambin ejemplos de la vida diaria, ilustran las diferentes tcnicas.

    5. Los problemas y preguntas al final de cada captulo se han ampliado considerablemente, incorporando gran parte del material de inters te-rico y prctico. Se han incluido ejemplos concretos de las diferentes ramas de los negocios, la economa y las finanzas, para demostrar clara-mente la versatilidad de los modelos de regresin.

    6. Desde la publiccin de la primera edicin se han lanzado al mercado excelentes paquetes de software de econometra disponibles tanto para grandes computadores (mainframe) como para los computadores perso-nales. El Apndice A presenta un breve anlisis de estos paquetes. La mayor parte de los problemas numricos considerados en este texto se solucionan utlzando el paquete SAS.

    El cubrimiento ms extenso de los antiguos temas, jUJ;lto con la adicin de nuevos temas y ejercicios, han hecho que el libro sea un poco ms largo. Esperamos que esto proporcione al profesor una mayor flexibilidad para es-coger los temas que considere adecuados para la audiencia especfica. A con-tinuacin se presentan algunas sugerencias sobre la manera como puede utili-zarse este libro.

    Cursos sobre econometra Un curso de un semestre para un no especiali::ta. CAptulos 1 a 6 y revisin de los Captulos 7 y 8 (omitiendo todas las pruebas) y el Captulo 10. Se pueden omitir los ejercicios tericos. Un curso de un semestre para estudiantes de economa. Captulos 1 a 6, Captulos 7 a 10. Se pueden omitir algunos ejercicios tericos. Un curso de dos semestres para estudiantes de economa. Captulos 1 a 15. Las pruebas matemticas dadas en los diferentes apndices se pueden cubrir en forma selectiva.

    Cursos sobre anlisis de regresin Un curso corto de un trimestre (aproximadamente 7 a 8 semanas). Captu-los 1 a 6, omitiendo todas las pruebas matemticas. Un curso de un semestre. Captulos 1 a 10. Se pueden omitir algunos desa-rrollos tericos.

    Esta revisin no habra sido posible sin los comentarios constructivos, las sugerencias y el estmulo que he recibido de diferentes personas que han

  • revisado el libro. En particular, deseo agradecer a los siguientes profesores, sin hacerlos, por supuesto, responsables de cualquier deficiencia que subsis-ta en la versin final de este libro:

    Ann R. Horowitz (University of Florida en Gainesville) James McDonald (Brigham Young University) James Moncur (University of Hawaii) Mark J. Roberts (Pennsylvania State University) Joseph J. Seneca (Rutgers University) John J. Spitzer (State University ofNew York,en Brockport) H. D. Vinod (Fordham University) Ronald Warren (University of Virginia) Tambin estoy endeuda con mis colegas John Martin, por su valiosa

    ayuda, con Ashok Vora por las estimulantes conversaciones que sostuvi-mos, y con mi asistente de investigacin, Zhenmin Fang, por su colabora-cin en repetidas ocasiones. . Finalmente, pero no menos importante, estoy profundamente agrade-cido con mi esposa Pushpa, mis hijas J oan y Diane, y con dos amigos especiales, Sushila Gildwani-Buschi y Joseph Buschi, por proporcionarme la paz mental necesaria para completar la revisin.

  • CONTENIDO

    In troduccin 1

    Parta I Modelos uniecuacionales de regresin 11

    1 La naturaleza del anlisis de regresin 13 . 1.1 Origen histrico del tnnino "regresin" 13 1.2' Interpretacin moderna de la regresin 14 1.3 Relaciones estadsticas vs. relaciones detenninsticas 18 1.4 Regresin vs. causacin 19 1.5 Regresin vs. correlacin 19 1.5 Tenninologa y notacin 21 1.7 Naturaleza y fuentes de infonnacin para el anlisis economtrico 22

    Tipos de datos Fuentes de datos Exactitud de los datos

    1.8 Resumen y conclusiones 2S Ejercicios 26

    2 Modelos de regresin con dos variables: algunas ideas bsicas 28

    2.1 Ejemplo hipottico 28 2.2 Concepto de la funcin de regresin poblacional (FRP) 31 23 Significado ~l tnnino "lineal" 33

    Linealidad en las variables Linealidad en los parmetros

    2.4 Especiftcacin estocstica de la FRP 34 2.S La signifJCanCa del tnnino de -"perturbacin estocstica" 3S 2.6 Funcin de regresin muestral {FRM} 37 2.7 Resumen y conclusiones 41

    Ejercicios 42

  • 3 El modelo de regresin con dos variables: El problema de la estimacin 47

    3.1 El mtodo de mnimos cuadrados ordinarios 47 Principio de los mnimos cuadrados

    3.2 El modelo de regresin lineal clsico: Supuestos fundamentales del mtodo de mnimos cuadrados ordinarios 54

    3.3 Errores de precisin o errores estndar de los estimadores de mnimos cuadrados ordinarios 63

    3.4 Propiedades de los estimadores de mnimos cuadrados: El teorema de Gauss-Markov 65

    3.5 Coeficiente de detenninacin ". : Medida de la "bondad del ajuste" 67 3.6 Un ejemplo numrico 73 3.7 Un ejemplo ilustrativo: La demanda de caf en los Estados Unidos 7S 3.8 Listado de computador para la funcin de demanda de caf 77 3.9 Resumen y conclusiones 77

    Ejercicios 79 Apndice 3A 84. 3A.l Derivacin de los estimadores de mnimos cuadrados 84 3A.2 Las propiedades de linealidad e insesgamiento de los

    estimadores de mnimos cuadrados ordinarios 84 3A.3 Varianzas y errores estndar de los estimadores mnimos

    cuadrados ordinarios 85 3A.4 El estimador de mnimos cuadrados para 0 2 86 3A.5 La propiedad de la varianza mnima de los estimadores con

    mnimos cuadrados 87 3A.6 Listado SAS para la funcin de demanda de caf (3.7.1) 89

    4 El supuesto de nonnalidad: El modelo clsico de regresin lineal nonnal 91

    4.1 La distribucin probabilstica de las perturbaciones Ilt 91 4.2 El supuesto de normalidad 92 4.3 Propiedades de los estimadores de MCO bajo el supuesto de

    normalidad 94 4.4 El mtodo de mxima ver:osimilitud (MV) 97 4.5 Resumen y conclusiones 97

    Apndice 4A 98 Estimacion utilizando el mtodo de mxima verosimilitud para un modelo de regresin con dos va,riables 98 Ejercicios del Apndice 4A 101

    5 Regresin con dos variables: Estimacin por intervalos y prueba de hiptesis 102

    5.1 Estimacin por intervalos: Algunos conceptos bsicos 102 5.2 Distribuciones normal t, )(l Y F: Breve exposicin 104 5.3 Intervalos de COnI18nZa para IQs coeficientes de regresin PI y P2 106

    Intervalo de confianza para {J2 Intervalo de confianza para {Jt

    5.4 Intervalo de confumza para {Jt y {J2 simultneamente

    Intervalo de confumza para 0 2 109 5.5 Prueba de hiptesis: Gomentarios generales 110 5.6 Prueba de hiptesis: El enfoque del intervalo de confianza 111

  • Prueba con dos colas o bateral Prueba con una cola o unilateral

    5.7 Prueba de hiptesis: El enfoque de la prueba de significancia 113 Prueba de significancia para los coeficismtes de regresin: La prueba t. . Prueba designificancia para a2: La prueba i"

    5.8 Prueba de hiptesis: Algunos aspectos prcticos 117 El significado de "aceptar" o "rechazar" una hiptesis La hiptesis nula o "O" y el "2t" La regla emprica Planteamiento de las hiptesis nula y alterna Escogencia del nivel de significancia ex Significancia estadstica vs. significancia prctica

    5.9 Anlisis de regresin y anlisis de varianza 121 5.10 Aplicacin del anlisis de regresin: El problema de la

    prediccin 124 Prediccin media Prediccin individual

    5.11 Informes de los resultados del anlisis de regresin 127 5.12. Evaluacin de los resultados del anlisis de regresin 128 5.13 Ejempl

  • 6A.l

    6A.2 6A.3

    Derivacin de los estimadores con el 'mtodo mnimos cuadrad~s para la regresin a trvs del origen

    '. liStado SAS para la lnea' caracterstica (6.1.11) Listado' SAS para la regresin de. la curVa de Phillips, para el Reino Unido (6.3.13)

    7 Enfoque matricial para el modelo

    168 170

    171

    de regresi6n lineal 172 7.1 El modelo de regresin lineal con kvariobles 173 7.2 Supuestos del modelo clsico de regresin utilizan:do notac~n

    matricial 175 7.3 Estimaciones utilizando MCO 177

    Ilustracin Matriz de varianza-covarianzapata , Propiedades del vector' de MeO .

    '7.4 El coeficiente de detenninacinR2 y el coeficiente de determinacin ajustado R2 es la notacin matricial 182

    7.5 La matriz de correlacin 184 7.6 Pruebas de hiPtesis con respecto a los coeficientes individuales

    de regresin en notacin matricial .,' 18S 7.7 Pruebas de siSnificancia global de 18 regresil: Anlisis de,varianza

    en notacin matricial . 186 7.8 Prueba de restricciones lineales: Pruebas generales F utilizando

    notacin matricial ' 187 7.9 Prediccin utilizando regresi6nmltiple: Formulaci~ matricial 187

    Prediccin media . . Prediccin individual.. . Varianza y predicci6n media Varianza de la prediccin media Varianza de la predicci6n individual ,

    7.10 Resumen del enfoque matricial: Ejemplo ilustrtivo 192 7.11 Resumen y conclusiones 197

    ~~b 1~ Apndice 7 A 204 7 A.l Derivacin de las K ecuaciones normales o simultneas 204 7A.2 Derivacin matricial de las eci.iaciones riormales 20S 7A.3 Mtriz de variaI!za-cvarianza de , 205 7 A.4 Propiedad MELI de los ~stimadores de MCO 206

    Parte 11 Violaci6n.delos supuestos del modelo clsico '

    8 Multicolinealidad 8.1 Naturaleza de la multicolinealidad 8.2 Esfimacin en el caso de multicolinealidad perfecta 8.3 Estirnaci6nen el caso de "alta" multicolinealidad pero

    "imperfecta"

    209

    213 213 216

    218

  • 8.4 Multicolinealidad: Consecuencias tericas de la multico1inealidad 219 8.5 Consecuencias prcticas de la multicolinealidad 221

    Varianzas y covarianzas amplias de los estimadores de MeO Intervalos de confianza ms amplios Raz~es t "no significativas" Un alto R' pero pocas razones t significativas , Sensibilidad de los estimadores de MeO y sus errores estndar ante pequefl.os cambios en los datos

    8.6 Ejemplo ilustrativo: gastos de consumo en ~lacin on ingreso y la riqueza 226

    8.7 Cmo detectar la multicolinealidad 229 t 8.8 Medidas remediales 233

    8.9 Es la mu!ticolinealidad necesariamente mala? tal vez no, si el objetivo es nicamente la prediccin 239

    8.10 Resumen y conclusiones 240 Ejercicios 241

    9 Heterocedasticidad 247 9.1 Naturaleza de la heterocedasticidad 241 9.2 La estimacin con MCO en presencia de heterocedasticidacl 252 9.3 El mtodo de los mnimos cuadrados generalizados (MCG) 253

    Diferencia entre MCO y MCG 9.4 Consecuencias de utilizar MCO ante presencia de heterocedasticidad 256

    Estimac.n con MCO permitiendo heteroscedasticidacl Estimacin con MCO sin tener en cuenta la presencia de heterocedasticidad 257

    9.5 Cmo detectar la heterocedasticidad 258 Ejemplo ilustrativo

    I 9.6 Medidas remediales 269 Cuando se conoce oi': el mtodo de los mnimos cuadrados ponderados Cuando no se conoce Of

    9.7 Resumen y conclusiones 214 Ejercicios 216 Apndice 9A 9A.1 Prueba de la ecuacin (9.2.2) 285 9A.2 Mtodo de mnimos cuadl.ldos ponderados 285

    10 Autocorrelacin 287 10.1 Naturaleza del problema 287 10.2 Estimacin de MCO en presencia de autoco~Jacin 294 10.3 El MELI en presencia de autocorreJacin 291 10.4 Consecuencias de utilizar MCO en presencia de autocorrelaoiD 298

    Estimacin de MCO permitiendo la autocorrelacin Estimacin de MCO sin tener en cuenta la autocorrelaciD

    10.5 Cmo detectar la autocorrelacin 304 10.6 Medidas remediales . 316

    Cuando se conoce la estructura de la autocorrelacin. Cuando p no se conoce

  • 10.7 Ejemplo ilustrativo: La relacin entre el ndice de vacantes de empleos y la tasa de desempleo en los Estados Unidos comparacin de los mtodos 323

    10.8 Resumen y conclusiones 326 Ejercicios 327

    11 Especificacin del modelo 336 11.1 Atributos de un buen modelo 337 11.2 Tipos de errores de especificacin 339 11.3 Consecuencias de los errores de especificacin 341

    Omisin de una variable relevante Inclusin de una variable irrelevante

    11.4 Pruebas de errores de especificacin 343 Cmo detectar la presencia de variables innecesarias Prueba~ de variables omitidas y de la forma funcional incorrecta Otras pruebas de error de especificacin

    11.5 Pruebas para detectar errores de especificacin de un modelo 350 Ejemplo ilustrativo: el modelo de San Luis

    11.6 Errores de medicin 352 Errores de medicin en la variable dependiente Y Errores de medicin en la variable explicativa X Un ejemplo

    11.7 Resumen y conclusiones 358 Ejercicios 359 Apndice IIA 363 llA.l Consecuencias de incluir una variable irrelevante:

    la propiedad de insesgamiento 363 l1A.2 Prueba de la ecuacin (11.6.10) 363

    Parte 111 Temas en econometra 365

    12 Regresin con una variable dicotmica 367 12.1 Naturaleza de las variables dicotmicas 367

    Ejemplo 12.1: Los salarios de los profesores segn el sexo 369 12.2 Regresin con una variable independiente cuantitativa y una

    cualitativa con dos clases o categoras 370 Ejemplo 12.2: Son los inventarios sensibles a las tasas de inters?

    12.3 Regresin en una variable independiente cuantitativa y una variable cualitativa con ms de dos clases 374

    12.4 Regresin en una variable independiente cuantitativa y dos cualitativas 376

    Generalizacin 12.5 Ejemplo 12.3: La economa del "doble empleo" 377 12.6 Comparacin de dos regresiones: Ideas bsicas 379

    Ejemplo 12.4: Athorro~ e ingresos, Reino Unido, 1946-1963 379 12.7 Comparacin de dos regresiones: Prueba de Chow 381 12.8 Comparacin de dos regresiones: Enfoque de la variable dicotmica 384

  • 12.9 Comapracin de dos regresiones: Ilustracin adicional 386 Ejemplo 12.5: El comportamiento del desempleo y de las vacantes sin llenar: Gran Bretaa, 1958-1971

    12.10 Efectos de interaccin 388 12.11 El uso de las variables dicotmicas en el anlisis estacional 389

    Ejemplo 12.6: Comportamiento de las ganancias-ventas en la industria manufacturera en los Estados Unidos

    12.12 Regresin discotinua o lineal por etapas o tramos 392 12.13 Resumen y conclusiones 394

    Ejercicios 395 Apndice 12A 403 12A.1 Matriz de datos para la regresin (12.9.2) 403 12A.2 Matriz de datos para la regresin (12.11.2) 404

    13 Regresin en una variable dependiente dicotmica: Los modelos MPL. Logit y Pro bit 405

    13.1 Variable dependiente dicotmica 405 13.2 El modelo de probabilidad lineal (MPL) 406 13.3 Estimacin de los MPL 407 13.4 MPL: Ejemplo numrico 411 13.5 Aplicaciones del MPL lO 413 13.6 Alternativas al MPL 418 13.7 El modelo Logit 420 13.8 Estimacin del modelo Logit 422 13.9 El modelo Logit: Un ejemplo numrico 425 13 .. 10 El modelo Logit: Ejemplos ilustrativos 428 13.11 El modelo Probit 430 13.12 El modelo Probit: Ejemplo numrico 434

    Logit vs. Probit 13.13 El modelo Probit: Ejemplo ilustrativo 436 13.14 Resumen y conclusiones 439

    Ejercicios 440 14 Modelos autorregresivos y rezagos distribuidos 445 14.1 El papel del "tiempo" o "rezagos" en la economa 446 14.2 Razones que explican los rezagos 450 14.3 Estimacin de los modelos de rezagos distribuidos 452

    Estimacin Ad hoc de los modelos de rezagos distribuidos 14.4 El enfoque de Koyck para los modelos de rezagos distribuidos 453

    Media y mediana de los rezagos 14.5 Racionalizacin del modelo de Koyck: El modelo de expectativas

    adaptables 457 14.6 Otra racionalizacin del modelo Koyck: El modelo de ajuste de

    exis.tencias o ajuste parcial 460 14.7 Combinacin de los modelos de esperanzas adaptables y de ajuste

    parcial 463 14.8 Estimacin de los modelos autorregresivos 464 14.9 Mtodo de variables instrumentales (VI) 466 14.10 Cmo detectar autocorrelacin en los modelos autonegresivos:

    Prueba h de Durbin 467 14.11 Ejemplo numrico: La demanda de dinero en la India 470

  • 14.12 Ejemplos ilustrativos 14.13 El enfoque de Almon a los modelos de rezagos distribuidos:

    El modelo de rezagos polimoniales de Almon Ejemplo numrico

    14.14 Causalidad en economa: La prueba de Granger La prueba de Granger Resultados empricos

    14.15 Reswnen y conclusiones Ejercicios

    Parte IV Modelos de ecuaciones simultneas

    15 Modelos de ecuaciones simultneas 15.1 Naturaleza de los modelos de ecuaciones simultneas 15.2 Ejemplos de modelos de ecuaciones simultneas 15.3 El sesgo en las ecuaciones simultneas: Inconsistencia de los

    estimadores de MCO 15.4 El sesgo en los 11\0delos de ecuaciones simultneas: Ejemplo

    numrico 15.5 Resumen y conclusiones

    Ejercicios

    16 El problema de la identificacin 16.1 Notacin y definiciones 16.2 El problema de la identificacin

    Sub identificacin Identificacin justa o exacta Sobreidentificacin

    163 Reglas para la identificacin de un modelo La condicin de orden de identificabilidad La condicin de rango de identificabilidad

    16.4 Resumen y conclusiones Ejercicios

    17 Mtodos de ecuaciones simultneas 17.1 Enfoque para la estimacin de un modelo 17.2 Modelos recursivos y el mtodo de,mnimos cuadrados ordinarios 17.3 Estimacin de una ecuacin exactamente identificada: El mtodo

    de mnimos cuadrados indirectos Propiedades de los estimadores con el mtodo de MCI

    17.4 Estimacin de una ecuacin sobreidentificada: El mtodo de mnimos cuadrados en dos etapas. (MC2E)

    Caractersticas sobresalientes de los estimadores con el mtodo de MC2E

    17.5 MC2E: ejemplo numrico 17.6 Ejemplos ilustrativos 17.7' Resumen y conclusiones

    Ejercicios

    472

    477

    484

    486 489

    497

    499 499 500

    507

    510 512 512

    517 517 521

    530

    535 536

    539 539 541

    544

    548

    553 555 561 562

  • A B

    Apndice 17 565 . 17 A.l . El sesgo de los estimadores de mnimos cuadrados indirectos 565

    17 A.2 Estimacin de los errores estndar de los estimadores de MC2E 566

    Apndices. Lista de algunos paquetes estadsticos de computador Tablas estadsticas Tabla B.l Areas bajo la distribucin normal estandarizada Tabla B.2 Puntos porcentuales de la distribucin t Tabla B.3 PUltos porcentuales superiores de la distribucin F Tabla B.4 Puntos porcentuales superiores de la distribucion X" Tabla B.5 Estadstica d de DurbinWatson: Puntos de significancia

    dL ydv a niveles de signiflcancia de 0.05 y 0.01 Tabla B.6 Valores crticos para diferentes rachas en la prueba de

    rachas

    Bibliografl3 Indice

    568 571

    588 591

  • INTRODUCCION

    1. QUE ES ECONOMETRIA? Literalmente, econometra significa "medicin econmica". Sin embargo, si bien es cierto que el fenmeno de la medicin es una parte importante de la econometra, el campo de accin de esta disciplina es mucho ms amplio, como puede apreciarse en las siguientes citas textuales: .

    La econometra, que es el resultado de la adopcin de una posicin sobre el papel que juega la economa, consiste en la aplicacin de la estadstica matemtica a los datos econmicos con el objeto de proporcionar no slo un apoyo emprico a los modelos construidos por la economa matemtica, sino una forma de obtener resul. tados numricos. 1

    Se puede definir la econometra como el a'nlisis cuantitativo de fenmenos econ micos reales basados en el desarrollo simultneo de la observacin y la teora, rela cionados a travs de apropiados mtodos de inferencia.2

    La econometra puede definirse como la ciencia social en la cual se aplican las he~ rramientas de la teora econmica, las matemticas y la inferencia estadstica, al anlisis de los fenmenos econmicos.3

    La econometra tiene que ver con la determinacin emprica de las leyes econ-micas.4

    El arte del econometrista consiste en encontrar el conjunto de supuestos que sean suficientemente especficos y realistas, de tal manera que le permitan aprovechar de la mejor manera posible los datos que tiene a su disposicin. .

    1 Gerhard Tintner, Methodology 01 Mathem,atical Economics and Econometrics, The University of Chicago Press, Chicago, 1968, p. 74. 2 P. A. Samuelson, T. C. Koopmans, and J. R. N. Stone, "Report of the Evaluative Committee ror Econometrica", Econometrica, Vol. 22, No. 2, abril 1954, pp. 141-146. 3 Arthur S. Goldberger, Econometric Theory, John Wiley & Sons, Inc., New York, 1964, p. 1. 4 H. Theil, Principies of Econometrics, John Wiley & Sons, Inc., New York, 1971, p. 1 5 E. Malinvaud, Statistical Methods of Econometrics, Rand McNally & Co., Chicago, 1966, p. 514.

    1

  • 2 INTRODUCCION

    2. POR QUE UNA DISCIPLINA APARTE? Corno sugieren las definiciones anteriores, la econometra es una amalgama de teora econmica, economa matemtica, estadstica econmica y estads~ tica matemtica. Sin embargo, es una disciplina que merece ser estu~iada separadamente por las razones que se esbozan a continuacin.

    La t.eora econmica hace afirmaciones o formula hiptesis de naturale-za principalmente cualitativa. Por ejemplo, la teora microeconmica sostiene que, al permanecer constantes otros factores, una reduccin en el precio de un bien debe traducirse en un aumento de la demanda de dicho bien.

    De este modo, la teora econmica postula la existencia de una relacin negativa o inversa entre el precio y la cantidad demandada de un bien, sin que proporcione, sin embargo, una medida numrica de la relacin entre las dos variables. en otras palabras, no nos dice en cunto aumentar o disminuir la cantidad demandada cuando se presente un cambio en el precio de un bien. En este sentido, es trabajo del econometrista proporcionar estimaciones numricas dirigidas a cuantificar dicha relacin, es decir, la econometra proporciona el contenido emprico a la mayora de las teoras econmicas.

    La preocupacin principal de la economa matemtica consiste en ex-presar la teora econmica en forma matemtica (ecuaciones), sin prestar atencin a la medicin ni a la verificacin emprica de la teora. La econome-tra, corno bien se ha dicho hasta el momento, se interesa primordialmente por la verificacin emprica de la teora econmica. Corno veremos, a menudo el econometrista hace uso de las e.cuaciones propuestas por el economista matemtico, pero de tal forma que stas puedan estar sujetas a pruebas o comprobaciones de tipo emprico. Esta conversin de ecuaciones matemti~ cas a ecuaciones economtricas requiere, sin lugar a dudas, ingenio y destreza.

    La estadstica econmica centra su atencin en la recoleccin, procesa~ miento y presentacin de cifras econmicas en forma de grficos y tablas. Este es, en efecto, el trabajo del estadstico econmieo, cuya actividad prin-cipal consiste en recoger cifras de las cuentas nacionales, PIB, empleo, desem-pleo, precios, etc. La informacin as recogida se constituye en la materia prima de trabajo para el econometrista. Sin embargo, el estadstico econ-mico no va ms all de la recoleccin de informacin, ya que no est interesado en la utilizacin de la misma para validar ni refutar teoras; es, desde luego, el econometrista quien se ocupa de realizar este trabajo.

    Aunque la estadstica matemtica proporciona una buena parte de las herramientas utilizadas en esta ciencia, a menudo el econometrista requiere mtodos especiales en virtud del carcter sui gneris de la mayor parte de las cifras econmicas, debido a que stas no son el resultado de un experimento controlado. El econometrista, como el meteorlogo, generalmente depende informacin que no se puede controlar directamente; por tanto, las cifras

    , de consumo, ingreso, inversin, ahorro, precios, etc., recogidas por agencias pblicas y privadas, son de caractersticas no experimentales. El econometrista torna estos datos corno dados, hecho que gener~ problemas que se presentan normalmente en el campo de la matemtica estadstica. Adems, la informa-cin puede contener errores de medicin, situacia que el econometrist~ nllprlp. ~vudar a remediar desarrollando mtodos especiales de anlisis.

  • INTROOUCCION 3

    3. METODOLOGIA DE LA ECONOMETRIA En trminos generales, el anlisis economtrico sigue las siguientes lneas generales,de accin: 1. Enunciado de la teora o hiptesis. 2. Especificacin del modelo economtrico dirigido a probar la teora. 3. Estimacin de los parmetros del modelo escogido. 4. Verificacin o inferencia estadstica. S. Predicciones o pronstico. 6. Utilizacin del modelo para fmes de controlo formulacin de polticas.

    Para ilustrar la metodologa de la econometra, consideremos a continua-cin la teora keynesiana de la funcin consumo, ampliamente conocida.

    Enunciado de la teora o hiptesis Keynes plantea:

    La ley sicolgica fundamental consiste en que los hombres (y mujeres) estn dis puestos, por regla general y en promedio, a aumentar su consumo a medida que aumenta su ingreso, aunque no en la misma proporcin al incremento en dicho ingreSO.6

    En poca~ palabras, Keynes afirma que la propensin marginal a consumir {PMC), la tasa de cambio del consumo ante un cambio de una unidad (por ejemplo, un dlar) en el ingreso, es mayor que O pero menor que l.

    Especificacin del modelo economtrico Aunque Keynes postula una relacin positiva entre el consumo y el ingreso, no especifica la . forma precisa de la relacin funcional entre las dos variables. Para simplificar, un economista matemtico pued-e sugerir la siguiente forma para la funcin consumo de Keynes:"

    en donde, 1':" gastos de consumo X,. ingreso fll - interseccin con el eje Y fl2 ,. pendiente

    (1)

    , John Maynard Keynea, '171, c;",,,,,, '17Ieory 01 EmpIoyment, 1"""" lI1Id Monq, Barcourt Brace JaYlDmm, Ine., New York, 1936, p. 96.

  • 4

    o El

    ~ t: o tJ .. "O

    y

    INTRODUCCION

    FIGURA 1.1 Ingresos Funcin de consumo keynesiana.

    El coeficiente de la pendiente ~2 representa la propensin marginal a consumir (PMC). Geomtricamente, la ecuacin (l) se puede representar grficamente mediante la Figura 1.1.

    ,La ecuacin (1), que afirm que el consumo est relacionado linealmen-te con el ingreso, es un ejemplo de uro modelo matemtico. Un modelo es simplemente un conjunto de ecuaciones matemticas. Si el modelo, como el del ejemplo anterior, consta de una sola ecuacin, recibe el nombre de modelo uniecuacional; si tiene ms de una ecuacin, se denomina modelo multiecua-cionalo modelo de ecuaciones simultneas.

    No,obstante lo anterior, el modelo puramente matemtico de la funcin consumo que se presenta en (l) es de limitado inters para el econometrista, por cuanto supone una relacin exacta o determinstica entre el consumo y el ingreso. Sin embargo, las relaciones existentes entre las variables econmi cas son generalm'ente inexactas. De este modo, si furamos a obtener infor-macin de gastos de consumo y de ingreso disponible (despus de impuestos) de una muestra de 5000 familias norteamericanas, por ejemplo, graficando a continuacin dicha informacin, colocando los gastos de consumo en el eje vertical y el ingreso disponible en el eje horiz'ontal, seguramente no esperara-mos encontrar que las 5000 observaciones estuvieran exactamente sobre la lnea de la ecuacin (1), debido a que adems del ingreso, existen otras variables que afectan los gastos de consumo, tales como el tamao 'de la fa-milia, la edad de sus miembros, la religin y otros factores que suelen ejercer cierta influencia en los patrones de consumo.

    Para tener en cuenta la existencia de una relacin inexacta entre las va-riables econmicas, el econometrista debe modificar la funcin de consumo determinstica de (1), de la siguiente manera:

    (2)

  • INTRODUCCION

    y

    ~---------------------------x Inp'eaol

    P1GURALl Modelo econom'trico de la func:i6h de consumo keyneslana.

    5

    en la que u representa el trmino de perturbacin o de error, que es una variable aleatona (estocstica) con propiedades probabilsticas bien def1nidas. El trmino perturbaciJ}., u, suele representar todas aquellas fuerzas que afectan el consumo pero que no se tienen en cuenta de manera explcita en la ecuacin. .

    La ecuacin (2) es un buen ejemplo de un modelo economtrico. Tc-nicamente, dicha ecuacin es un ejemplo de un modelo de regresin lineal, modelo que constituir uno de los ms importantes objetivos de este libro. La funcin economtrica de consumo (2), plantea la hiptesis de que la va-riable dependiente Y (consumo) est relacionada linealmente con la variable explicativa X (ingreso), aunque no de manera exacta puestQ que est sujeta a variaciones individuales.

    El modeloeconomtrico en la e~acin (2) puede representarse grf1ca-mente tal como aparece en la Figura 1.2 .

    . Estimacin Habiendo especificado el modelo economtrico, la tarea siguiente del econo-metrista consiste en obtener estimaciones (valores numricos) de los parmetros del modelo, a partir de la informacin disponible, generalmente proporciona-da por el estadstico econmico. Estas estimaciones le confieren un contenido emprico a la te orla econmica. As, por ejemplo, si en el. estudio de la funcin consumo keynesiana anteriormente expuesta, se encuentra que fJ" = 0$, este valor no slo proporciona una estimacin numerica de la PMC sino que corrobora la hiptesis keynesiana segn la cual la PMe es me-norque 1.

    Cmo se estiman los parmetros 111 y fJ,,? La respuesta se hallar en los captulos siguientes. Por el momento, basta afirmar que la herramienta

  • 6 INTRODUCCION

    estadstica del anlsisi de regresin es la tcnica utilizada en este libro para I obtener dichas estimaciones.

    Verificacin (inferencia estadstica) Habiendo obtenido ya estimaciones de los parmetros, la tarea siguiente del econometrista consiste en desarrollar criterios apropiados dirigidos a estable-cer si las estimaciones obtenidas estn de acuerdo con lo que se espera de la teora que se est verificando. Como se mencion anteriormente, Keynes pretenda que la PMC fuese positiva y menor que l. Supongamos de otro lado, que en un estudio de la funcin consumo se encuentra que la PMC = 0.9; si bien es cierto que este resultado es menor que 1, podemos preguntarnos si es 10 suficientemente inferior a 1 como para que logremos convencernos de que no es el resultado accidental del proceso de muestreo. En otras pala-bras, es esta estimacin estadsticamente menor que 1? Si es as, se verifica la afirmacin keynesiana; de lo contrario, sta quedara refutada.

    La refutacin o confirmacin de las teoras econmicas, basndose en la evidencia emprica, se fundamenta en una rama de la teora estadstica conocida como inferencia estadfstica (prueba de hiptesis). A lo largo del libro veremos la manera como se lleva a cabo el proceso de inferencia esta-dstica.

    Predicciones o pronsticos Si el modelo escogido confirma la hiptesis o teora que se est investigando, se puede entonces proceder a predecir el (los) valorees) futuro(s) de la varia-ble dependiente Y con base en valores futuros, conocidos o esperados, para la (s) variable(s) explicativa(s) X. Supongamos, por ejemplo, que el gobierno contempla la posibilidad de decretar una reduccin en los impuestos persona-les con el fin de est~ular una economa en recesin. Cul ser el efecto de esta poltica sobre el ingreso y, por consiguiente, sobre el em'pleo y los gastos de consumo?

    Como la teora macroeconmica bien plantea, el cambio en los niveles de ingreso,originado como resultado de un incremento de un dlar en los gastos de inversin est determinado por el multiplicador de ingreso M, el cual se define como: M = [1/0 - PMC)1. Si la PMC = 0.8, M ser 5, lo cual implica que si el. nivel de inversin aumenta en un dlar, se producir final-mente un aumento en el ingreso de 5 veces el incremento en la inversin. El valor crtico a observar en estos cmputos es el del multiplicador del ingreso, que depende del valor de la PMC. Por tanto, una estimacin cuantitativa de la PMC proporciona. informacin invaluable para fines de poltica econmi-ca; conociendo la PMC, se puede predecir el curso futuro del consumo como consecuencia de los cambios en la poltica fis

  • INTRODUCCION 7

    y = 5.0+0.7 X (3) donde el gasto de consumo Y y el ingreso X se miden en miles de millones de -dlares. Adicionalmente se ,Supone que el gobierno cree que un nivel de gastos de 1060 (miles de millones de dlares) mantendr la tasa de desempleo aun nivel relativamente bajo, del orden del 5%. Qu nivel de ingresos (X) garan-tizar que se obtenga la cantidad presupuestada inicialmente de gastos de consumo? Suponiendt> que el modelo (3) es aceptable, mediante clculos aritmticos sencillos se puede mostrar que:

    1060 = 5;0 + 0.7 X o X = 1055/0.7 = 1507 (aproximadamente) Lo anterior implica que un nivel de ingresos de 1507 ~miles de millones de dlares), dada una PMC = 0.7, generar un gasto de 1060 (miles de millones de dlares). .

    Corno sugiere el clculo anterior, se puede utilizar un modelo que haya sido estimado para fines de control o para la formulacin de una poltica econmica. Utilizando las herramientas fiscales~ monetarias apropiadas, el gobierno puede controlar o manipular la variable de control X, dirigida a producir el nivel deseado para la variable objetivo Y.

    4. TIPOS DE ECONOMETRIA

    I Teri(:a

    Clsica Bayeaiana

    Econometra !

    clsiu

    Aplicada I

    Bayesiana

    De acuerdo con este esquema de clasificacin, la econometra puede dividirse en dos categoras generales: econometra terica y econometda aplicada. En cada categora se puede enfocar el terna siguiendo la escuela clsica o la baye-siana. En este libro se har nfasis en el enfoque clsico. El enfoque bayesiano puede encontrarse en el ibro de Zellner,7 pero infortunadamente este libro no est al alcance de un principiante en econometra. Hasta donde conozco, no existe un libro elemental sobre econometra bayesiana al mismo nivel de Econometra bsica.

    La econometra terica tiene que ver con el desarrollo de mtodos apro-piados para medir relaciones econmicas especificadas a travs de modelos economtricos. En este aspecto, la econometra se apoya fuertemente en la

    f '

    7 Arnold Zellner, An lntroduction 10 Bayesian lnference in Econometricl. 10hn Wiley el Sons, Inc., New York, 1971.

  • 8 INTROUUCCION

    estadstica matemtica. Por ejemplo, una de las herramientas ms utilizadas en este libro es el mtodo de los mnimos cuadrados. Es una de las preocupa-ciones principales de la econometra terica plantear y aclarar los supuestos de este mtodo, sus propiedades y la manera como se ven afectadas dichas propiedades cuando uno o varios de los supuestos no se cumplen.

    En. la econometra aplicada se utilizan las herramientas de la econome-tra terica para estudiar algunos campos especiales de la economa tales como la funcin de produccin, la funcin de consumo, la funcin de inver-sin, las funciones de oferta y demanda, entre otras.

    Este libro se concentra fundamentalmente en el desarrollo de mtodos economtricos, sus supuestos, usos y limitaciones. Dichos mtodos se ilustran con ejemplos adecuados tomados de diversas reas de la economa y de la administracin de empresas. Sin embargo, no es este un libro de econometra aplicada, ya que no profundiza en ningn tema de aplicacin econmica en particular. Se ha considerado conveniente dejar esta tarea a los libros explci-tamente destinados a ese fin.s

    S'. REQUISITOS PREVIOS DE MATEMATICAS y ESTADISTICA Este . libro, a pesar de estar escrito a nivel elemental, presupone cierta familia-ridad del lector con la estadstica elemental, especialmente con los conceptos bsicos de estimacin estadstica y pruebas de hiptesis. En lo tocante a las matemticas, es recomendable algn conocimiento, al menos elemental, de clculo diferencial. De otro lado se utiliza lgebra matricial en el Captulo 7. Sin embargo, con los conocimientos de lgebra matricial que se proporcio-nan en un curso de lgebra lineal, se superan las dificultades que pueda pre-sentar dicho captulo. Ntese, no obstante, que el lgebra matricial no es ':in

    'requisito previo de este libro y no se pierde la esencia del mismo al omitir ese apartado.

    6. PAPEL QUE JUEGA EL COMPUTADOR El anlisis de regresin, el pan de cada da de la econometra, no sera posi-ble en la actualidad sin contar con el computador y el acceso al software estadstico. Por fortuna hay disponible en el mercado una variada muestra de paquetes de regresin tanto para mainframe como para microcomputado-res; con el paso del tiempo, la lista es cada vez mayor. En el Apndice A analizaremos brevemente las principales caractersticas de algunos de los paquetes ms populares, tales como SAS, SPSS, TSP, BMD y SHAZAM. Estos paquetes, desarrollados originalmente para computadores de unidad

    . s Algunas referencias son J. S. Cramer, Empirical Econometrics. North-Holland PubJishing Company, Amsterdam. 1969; J. L. Bridge, Applied Econometrics, North-Holland Publishing Company. Amster-dam, 1971 y M. Desai,Applied Econometrics. McGraw-Hlll Book Company, New York. 1976.

  • INTRODUCCION 9

    central o mainframe, se encuentran disponibles en la actualidad' para micro-computadores personales. En los ejemplos ilustrativos que se encuentran en

    . este libro, utilizamos principalmente SAS y SHAZAM. Se aconseja a los estudiantes familiarizarse con alguno(s) de estos paquetes de manera que puedan solucionar los problemas numricos que se originan al fmal de los captulos, as como adelantar proyectos especficos.

    'l. PLAN DEL LIBRO El libro se divide en cuatro partes. Las tres primeras estudian los modelos de regresin uniecuacionales, vr. gr., aquellos en que el comportamiento de la variable Y (la variable dependiente) se explica por una o ms variables X (las variables explicatorias). En la Parte I se presenta el modelo de regre-sin lineal clsico, se desarrolla el mtodo de los mnimos cuadrados y se exponen sus supuestos. En la Parte 11 se analizan las consecuencias sobre las propiedades del mtodo de mnimos cuadrados cuando no se cumplen uno o varios de sus supuestos, as como los mtodos alternativos de estimacin disponibles. En la Parte lB se presentan algunos temas economtricos que por sus caractersticas pueden considerarse como objeto nico de la economa. En la Parte IV se presentan algunas caractersticas especiales de los modelos de ecuaciones simultneas y se discuten los mtodos espeCficamente disea-dos para estimar los parmetros de este tipo de modelos.

    Cada una de las partes incluye captulos que desarrollan diversas tcnicas economtricas, cada una de las cuales se ilustra con ejemplos adecllados tomados de la economa y la administracin de empresas.

    Los ejercicios que aparecen al final de cada captulo constituyen una parte integral del libro. Algunos de ellos exigen clculos de rutina, mientras que otros, de naturaleza ms terica, aclaran en mayor profundidad el material tratado en el captulo. Se espera, por tanto, que el estudiante intente desa-rrollar la mayora de estos ejercicios ya que ellos le permitirn conocer su grado de comprensin acerca del material estudiado.

    Con respecto a la notacin utilizada en el libro, es preciso recalcar que cada captulo se ha dividido en secciones numeradas secuencialmente dentro del mismo. As, la seccin 5.3 corresponde a la tercera seccin del Captulo 5. Las ecuaciones se identifican en cada captulo mediante el nmero de ste seguido por la seccin y por el nmero de la ecuacin, todo entre parnte-sis. Por ejemplo, (3.5.8) corresponde a la optava ecuacin de la quinta sec-cin del Captulo 3. Cuando aparece un asterisco, debe entenderse que el material es opcional. El libro est redactado de tal manera que puede omitirse el material opcional sin que esto ocasione prdida de continuidad.

  • PARTE 1

    MODELOS UN lE CUAC IONALE S

    DE REGRESION

    psta primera parte del libro introduce el concepto de modelos uniecuaciona-les. En estos modelos una variable, llamada variable dependiente, se expresa como una funcin lineal de una o ms variables denominadas variables expli-cativas. En tales modelos se supone implcitamente que las relaciones de causalidad, si existe alguna, entre la variable independiente y las explicativas, se. presentan en una sola direccin: de las variables explicativas hacia la varia-ble dependiente.

    En el Captulo 1 se hace una exposicin relacionada con la interpreta-cin tanto histrica como moderna del trmino regresin, ilustrndose las diferencias entre las dos interpretaciones mediante ejemplos provenientes de. la economa y de otros campos.

    En el Captulo 2 se presentan algunos conceptos fundamentales del an-lisis de regresin, utilizando como ayuda el modelo de regresin lineal en dos variables, en el ~ual la variable dependiente se expresa como una funcin lineal de una sola variable explicativa.

    En el Captulo 3 continuamos con el modelo de dos variables e introdu-cimos lo. que se conce como el modelo de regresin lineal clsico, modelo que tiene varis supuestos simplificadores. Con estos supuestos se examina

    11

  • 12 MODELOS UNIECUACIONALES DE REGRESION

    el mtodo de mnimos cuadrados ordinarios (MeO) para la estimacin de los , parmetros del modelo de regresin en dos variables. El mtodo de MeO es de aplicacin sencilla, y tiene algunas propiedades estadsticas muy valiosas.

    En el Captulo 4 se estudia el modelo de regresin lineal normal clsico (en dos variables) el cual supone que la variable dependiente aleatoria se ajus-ta a una distribucin normal de probabilidad. Con este supuesto, los estima-dores de MCO obtenidos en el Captulo 3 poseen propiedades estadsticas ms fuertes.que las de los modelos de regresin lineal clsicos no normales. Dichas propie'dades nos permiten recurrir a la inferencia estadstica y, en par-ticular, a las pruebas de hiptesis.

    El Captulo 5 se dedica a tratar el tema de pruebas de hiptesis. En este captulo tratamOs de averiguar si los, coeficientes de regresin estimados son compatibles con los valores hipotticos iniciales que se asignaron a tales coeficientes, los cuales fueron sugeridos por la teora y I o por un trabajo emprico previo.

    En el Captulo 6 consideramos algunas extensiones del modelo de re-gresin en dos variables. En particular, se analizan temas tales como: (l) la regresin a travs del origen, (2) escalas y unidades de medida y (3) for-mas funcioriales de los modelos de regresin, tales como los modelos doble logartmico, el semilogartmico y el recproco.

    En el Captulo 7 se desarrolla el modelo de regresin para K variables explic&tivas utilizando lgebra matricial. Aunque la notacin matricial no introduce ningn concepto nuevo, proporciona un mtodo muy compacto de presentar la teora de la regresin involucrando cualquier nmero de va-riables explicativas.

  • CAPITULO 1 LA NATURALEZA

    DEL ANALISIS DE REGRESION

    Como se mencion en la Introduccin, la I;egresin es una herramienta fun-damental de la econometra; en este captulo consideramos muy rpida-mente la naturaleza de este importante instrumento.

    1.1 ORIGENHISTORICO DEL TERMINO "REGRESION" El trmino regresin fue introducido por Francis GaIton. En un famoso ar-tculo, Galton hall que aunque exista una tendencia a que los padres de alta estatura tuvieran asimismo hijos altos, y de igual forma a que los padres de baja estatura tuvieran hijos de baja estatura; la estatura promedio de los nifios que nacan de padres con una determinada estatura tenda a moverse o "regresar" hacia la altura promedio de la poblacin total. 1 En otras pala-bras, la estatura de los hijos de padres inusualmente altos o inusualmente ba-jos, tenda a estar ms cerca de la estatura promedio de la poblacin. La ley de regresin universal d~ Galton fue confirmada por su amigo Karl Pear-son, quien coleccion ms de mil registros de estaturas de los miembros de diferentes grupos familiares. 2 Pearson encortr que la estatura promedio de los hijos de un grupo de padres altos era inferior a la estatura de sus padres, mientras que la estatura promedio de los hijos de un grupo de padres de baja

    1 Francis Galton, "Family Likeness in Stature", Proceedings 01 Royal Society, Londres, vol. 40, 1886, pp. 42-72. 2 K. Pearson y A. Lee, Biometrika, vol. 2, 1903, p. 357.

  • 14 MODELOS UNIECUACIONAlES DE REGRESION

    estatura era mayor que la estatura de sus respectivos padres, generndose un fenmeno mediante el cual los hijos altos y bajos de estatura "regresaban" hacia la estatura promedio de todos los hombres. Para utilizar las palabras de Galton, sta era una "regresin a la mediocridad".

    1.2. INTERPRETACION MODERNA DE LA REGRESION Sin embargo, la interpretacin moderna de la regresin es diferente. En tr-minos generales,

    El anlisis de regresin est relacionado con el estudio de !a dependencia de una variable, la variable dependiente, de una o ms variables adicionales, las variables explicativas con la perspectiva de estimar y/o predecir el valor (poblacional) medio o promedio .de la primera en trminos de valores conocidos o fijos (en muestreos repetidos) de las segundas.

    La trascendental importancia de este punto de vista del anlisis de regresin se har ms clara a medida que avancemos en el tema, pero algunos ejemplos facilitarn la aclaracin de este concepto bsico.

    Ejemplos: . 1. Consideremos nuevamente la ley de regresin universal de Galton. Galton

    estaba interesado en averiguar las razones por las cuales exista estabili-dad en la distribucin de las estaturas dentro de una poblacin. Pero desde el punto de vista moderno, nuestra preocupacin no est dirigida a esta explicacin sino, en cambio, a averiguar la manera como cambia la esta-

    ..

    ..

    -g .. "3 Q.

    = .. ~ o :=-

    .

  • LA NATURALEZA DEL ANALlSIS DE REGRESION 15

    70

    40

    12 13 "14 .; ~ '('

    'Edad, en aos FIGURA 1.2 DistTibucin hipottica de estaturas correspondientes a edades seleccionadas.

    tura promedio de los hijos, dada la estatura de los padres. En otras pala-bras, estamos interesados en predecir la estatura promedio de los hijos a partir de la estatura de sus padres. Para apreciar cmo puede llevarse esto a cabo consideremos la Fig~ra 1.1 qe corresponde a un diagrama de dispersin.

    La figura muestra la distribucin de las estaturas de los hijos en una poblacin hipottica, correspondiente al conjunto de valores fijos o da-dos de las estaturas de los padres. Ntese que existe un rango (distribu-cin) de estaturas de los hijos, correspondiente a cualquier estatura dada de un padre. Sin embargo, aprciese bien que la estatura promedio de los hijos aumenta a medida que aumenta la estatura de los padres. Para ob-servar esto claramente hemos trazado una lnea a travs de los puntos dis-persos, la cual muestra cmo la estatura promedio de los hijos aumenta con la estatura de los padres. Como veremos posteriormente, esta lnea se conoce como la lnea, de regresin.3 Obsrvese cmo esta lnea tiene una pendiente positiva pero menor que uno, lo cual est de acuerdo con la tegresin' de Galton hacia la mediocridad. (Por qu?)

    2. Considrese ahora el diagrama de dispersin que se presenta en la Figura

    3 En esta etapa del desarrollo del tema denominaremos.a este lnea de regresin,/inea de la relacin promedio entre la variable dejJendiente (la estatura de un hijo) y la variable explicativa (la e$tatura del padre).

  • 16 MODELOS UNIECUACIONALES DE REGRESION

    1.2 Y que muestra la distribucin de las est1lturas de ciertos nUlos, medida a determinadas edades, en una poblacin hipottica. Ntese que existe un rango de estaturas correspondiente a una edad determinada. Como es obvio, no todos los niftos a una determinada edad tienden a tener esta-turas idntias. Pero la estatura, en promedio, aumenta cpn la edad (ciertamente hasta una determinada edad). En consecuencia, al conocer la edad tambin estamos en posibilidad de predecir la estatura promedio que corresponde a esa edad. ' -

    3. Para utilizar ejemplos de la economa, un economista puede estar intere-sado en estudiar la dependencia que existe entre ,los gastos personales de consumo y el ingreso personal real o disponible despus de impuestos. Este tipo de anlisis puede ser de gran ayuda para est~mar la propensin marginal a consumir, es decir, el cambio promedio en los gastos de con-sumo ante una v~acin de, por ejemplo, una unidad ~n el ingreso real.

    4. Un monopolista que puede fijar el precio o la cantidad (pero no ambos factores), puede estar interesado en averiguar la respuesta de la demanda de un producto ante los cambios en el precio. Este experimento permite la estimacin de la elasticidad precio (es decir, la respuesta a variaciones en el precio) de la demanda de un producto y puede ayudar a determinar el precio que maximiza las ganancias de una empresa.

    S. Un profesional en economa laboral puede estar interesad0 en studiar la relacin existente entre el porcentaje de cambio en los salarios monetarios o nominales y la tasa de desempleo. En el diagrama de dispersin que apare-ce en la Figura 1.3 se presenta informacin histrica al respecto. La curva

    i ~ e o

    1 ~

    +

    8 t " Ol-----~~.__----- Tasa de desempleo. % 'ti c:: 3 .~ : .g ! FIGURA!.3 Curva hipottica d~!hillips.

  • LA NATURALEZA DEL ANALlSIS DE REGRESION 17

    k=~ Ingresos

    o Tasa de inflacin ,

    FIGURA 1.4 Cantidad de dinero en poder del pblico con respecto a la tasa de inflacin (n).

    que aparece en la Figura 1.3 es un ejemplo de la famosa curva de Phillips, donde se relacionan los cambios en los salarios nominales con la tasa de desempleo. Este tipo de diagrama de dispersin permitir al economis-ta laboral predecir el cambio promedio en los salarios nominales, dada cierta tas de desempleo. Dicho conocimiento puede ser de gran ayuda para realizar conjeturas sobre el proceso inflacionario por el cual puede atravesar una determinada economa, puesto que los aumentos en sala-rios probablemente se reflejarn en aumentos en los precios.

    6. La economa monetaria plantea que, al permanecer constantes otros fac-tores, cuanto mayor sea la tasa de inflacin ( 1r ), menor ser la proporcin (k) del ingreso que la gente querr mantener en forma de dinero, como se ilustra en.la Figura 1.4. Un anlisis cuantitativo de esta relacin permitir al economista monetario predecir la cantidad de dinero, como proporcin de su ingreso, que la gente querr mantener, a diferentes tasas de inflacin.

    7. El director de mercadeo de una empresa puede estar interesado en cono cer la manera como se relacionan la demanda de su producto con los gastos de publicidad en que incurre dicha empresa. Este tipo de estudio sera de gran utilidad para averiguar la elasticidad de la demanda del pro-ducto en los gastos de publicidad de la empresa, es decir, la respuesta promedio de la demanda ante un aumento de una unidad, por ejemplo, un dlar, en el presupuesto de gastos de publicidad. Este conocimiento a su vez puede ser de mucha utilidad para determinar el presupuesto "ptimo" de publicidad.

    8. Finalmente, un agrnomo puede estar interesado en estudiar la depen-dencia existente entre los niveles de produccin de un cultivo de, por

    . ejemplo, trigo, y la temperatura, la lluvia, la cantidad de luz solar y el nivel de fertilidad de la tierra. Este anlisis de dependencia puede permi.:. tirle predecir o pronosticar la produccin promedio de ese cultivo, dada la informacin existente sobre las variables explicativas.

  • 18 MODELOS UNIECUACIONALES DE REGRESION

    El lector est en capacidad de proporcionar una amplia gama de ejem-plos adicionales relacionados con la dependencia de. una variable ante una o ms variables adicionales. Adems, las tcnicas del anlisis de regresin co-mentadas en este texto estn diseadas especialmente para el estudio de este tipo de dependencia entre variables.

    1.3 RELACIONES ESTADISTICAS VS. RELACIONES DETERMINISTICAS

    De los ejemplos que se enunciaron en la Seccin 1.2, el lector podr obser-var que dentro del anlisis de regresin nos interesa lo que se conoce como la dependencia estadistica y no la dependencia funcional odeterministica, entre las variables, como aquellas que se presentan en la fsica clsica. En las rela-ciones estadsticas entre variables tratamos esencialmente con variables aleatorias o estocsticas,4 es decir, variables que tienen distribuciones proba-bilsticas. Por otra parte, en la dependencia funcional o determinstica tam-bin tratamos con variables, pero stas no son aleatorias ni estocsticas.

    La dependencia de los niveles de produccin de un cultivo con respecto a la temperatura, la lluvia, el sol y la fertilidad, tiene, por ejemplo, una na-turaleza estadstica en el sentido de que las variables explicativas, aunque ciertamente importantes, no permitirn al agrnomo predecir la produccin de ese cultivo en forma exacta, debido a los errores involucrados en la me-dicin de estas variables, como tambin debido a otra serie de factores (va-riables), que en forma colectiva afectan la produccin pero que pueden ser difciles de identificar en forma individual. Por tanto, se va a presentar cierta variabilidad "intrnseca" o aleatoria en la variable dependiente rendimiento del cultivo, que no puede explicarse por completo, independientemente del nmero de variables explicativas que utilicemos.

    Por otra parte', en los fenmenos determinsticos tratamos con Cierto tipo de relaciones que surgen, por ejemplo, de la ley de la gravedad de Newton, que plantea: toda partcula en el universo atrae a otra partcula con una fuerza directamente proporcional al producto de sus masas e inversa-mente proporcional al cuadrado de la distancia entre ellas. En smbolos, F = k (m 1 m2 /r2 ), donde F = fuerza, m 1 y m2 son las masas de las dos par-tculas, r = distancia y k = constante de proporcionalidad. Otro ejemplo lo constituye la ley de Ohm, que dice: para los conductores metlicos que estn en un rango limitado de temperatura, la corriente e es proporcional al vol-taje V; es decir, v/e = k, donde k es la constante de proporcionalidad. Otros ejemplos de este tipo de relaciones determinsticas son la ley de los gases de Boyle; la ley de la electricidad de Kirchhoff y la ley del movimiento de Newton.

    4 La palabra "estocstico" proviene del griego Stokhos que significa "centro del blanco" o "tiTo acer-tado que da en el centro del blanco". El resultado que se obtiene al lanzar dardos sobre un tablero es un proceso estocstico, es dech, un proceso acompaado con errores.

  • LA NATURALEZA DEL ANAlISIS DE REGRESION 19

    En este texto no estamos interesados en este tipo de relaciones determi-nsticas. Sin embargo, ~s preciso aclarar que si existen errores de medicin, digamos en el valor de k en la ley de la gravedad de Newton, las relaciones que de otra manera seran determinsticas se convertiran en rela:ciones estads-ticas. La razn radica en que en esta situacin la fuerza puede predecirse nicamente en forma aproximada, a partir de un valor dado de k (y ml' m2 y r) que contiene errores. La variable F, en este caso, se convierte en una variable aleatoria.

    1.4 REGRESION VS. CAUSACION Aunque el anlisis de regresin tiene que ver con la .. dependencia de una va-riable con relacin a otras variables, esto no implica necesariamente que exista una relacin de causalidad. Utilizando las palabras de Kendall y Stuart: "Una relacin estadstica, independientemente de qu tan fuerte y aparente sea, nunca puede establecer una conexin causal: nuestras ideas de causacin deben provenir de las estadsticas externas, y, en ltimas, de algn tipo de teora"5 que las soporte.

    En el ejemplo de la produ~cin del cultivo de trigo que antes menciona- mas, no existe una razn estadz'stica para suponer que la lluvia no depende de ,la produccin del cultivo. El hecho de que tratemos la produccin del cultivo como variable dependiente de los niveles de lluvias {entre otras cosas), se debe a consideraciones de tipo no estadstico: el sentido comn sugiere que la relacin no se puede invertir, puesto que no podemos controlar la lluvia variando la produccin del cultivo.

    En todos los ejemplos mencionados en la Seccip 1.2, el punto que de-bemos 'mantener en mente es que una relacin estadstica no puede por s misma implicar en forma lgica una causacin. Para atribuir causalidad se debe hacer uso de consideraciones tericas o a priori. Por tanto, en el tercer ejemplo antes mencionado se puede invocar la teora econmica al plantear que los gastos de consumo dependen del ingreso real.6

    1.5 REGRESION VS. CORRELACION Aunque el anlisis de correlacin est estrechamente relacionado con el anlisis de regresin, conceptualmente los dos son muy diferentes. En el anlisis de correlacin, el objetivo fundamental es la medicin de la fuerza

    s M. G. K~ndal1.y A. Stuart, The advanced Theory 01 Statistics, Charles Griffin Publishers, New York, 1961, vol. 2, cap. 26, p. 279. 6 Pero, como veremos en el Captulo 3, el anlisis de regresin clsico est basado en el supuesto de que el modelo utilizado en el anlisis es el modelo correcto. Por tanto, la direccin de la causalidad' puede est~r implcita en el modelo postulado.

  • 20 MODELOS UN1ECUACI0NALES DE REGRESION

    o grado de asociacin lineal entre dos variables. El coeficiente de correlacin, que estudiaremos en detalle en el Captulo 3, mide esta fuerza de asociacin (lineal). Por ejemplo, podramos estar interesados en averiguar la correlacin (el coeficiente de correlacin) entre el hbito de fumar y el cncer del pul-mn, entre las calificaciones de exmenes de estadstica y matemticrs, entre las calificaciones obtenidas en la escuela secundaria y en la universidad. Como ya se coment, e-n el anlisis de regresin no estamos fundamental-mente interesados en este tipo de medicin. En lugar de ello, se intenta estimar o predecir el valor promedio de una variable con base en los valores fijos de otras variables. En este orden de ideas, podra ser importante saber si se puede predecir la calificacin promedio obtenida en un examen de estadstica, co-nociendo previamente la calificacin obtenida en uno de matemticas.

    Las dos tcnicas de regresin y correlacin tienen ciertas diferencias fundamentales que vale la pena mencionar. En el anlisis de regresin existe una asimetra en la manera como se manejan las variables dependientes y explicativas. Se supone que la variable dependiente es estadstica, aleatoria o estocstica, 10 cual implica que tiene asociada a ella una distribucin pro-babilstica. Se supone, de otro lado, que las variables explicativas tienen valores fijos (en muestreos repetidos),' 10 cual se hizo explcito en la defi-nicin de regresin que se formul en la Seccin 1.2. De esta manera, en la Figura 1.2 suponemos que la variable edad era fija a ciertos niveles dados, obteniendo a partir de ella las mediciones de estatura para, cada uno de esos niveles. Por otra parte, en el anlisis de correlacin se manejan las (dos) variables simtricamente; no existe distincin alguna entre las variables dependientes y las explicativas. Despus de todo, la correlacin existente entre las calificaciones en matemticas y los exmenes de estadstica es la misma que la correlacin existente entre las calificaciones de estadstica y los exmenes de matemticas. Adicionalmente, se supone que ambas variables son aleatorias. Como veremos posteriormente, la mayor parte de la teora de la correlacin est basada en el supuesto de aleatoriedad de las variables, mientras que la mayor parte de la teora de la regresin que expondremos en este texto est condicionada al supuesto de que la variable dependiente es estocstica y que las variables explicativas son fijas o no estocsticas.8

    7 Es decisivo hacer la observaci6n de que las variables explicativas pueden ser intrnsecamente estocs-ticas, pero para los propsitos del anlisis de regresin suponemos que sus valores se mantienen fijos en muestreos repetidos (es decir, X tiene los mismos valores en diferentes muestras), hecho que les imprime car~ctersticas no al~torias o no estocsticas. Hay informaci6n adicional sobre este tema en el CaptulO 3, Seccin 3.2 8 En el tratamiento avanzado de la econometra se puede liberar el supuesto de que las variables expli-cativas no son estocsticas (vase Introducci6n a la Parte 11).

  • LA NATURALEZA DEL ANALlSIS DE REGRESION 21

    1.6 TERMINOLOGIA y NOTACION Antes de proceder a un anlisd ms formal de la teora de la regresin, exa-minemos brevemente la terminologa y la notacin a utilizar. En nuestra no-menclatura, los trminos variable dependiente y variable explicativa se defi-nen o describen de varias maneras. A continuacin se presenta una lista representativa de ellas:

    Variable dependiente li

    Variable explicada li

    Predicha li

    Regresada ti

    Respuesta li

    Endgena

    Variable explicativa li

    Variable independiente li

    Predictor li

    Regresor ti

    Variable de controlo estmulo li

    Ex6gena

    Aunque es un problema de gusto personal y de tradicin, en el presente libro se utiliza la terminologa variable dependiente - variable explicativa.

    Si estamos estudiando la dependencia de una variable en una sola varia-ble explicativa, tal como la dependencia existente entre el consumo y el ingreso real, dicho estudio se conoce como anlisis de regresin simple o en dos variables. Sin embargo, si estamos estudiando la dependencia de una va-riable en ms de una variable explicativa, como en el ejemplo del cultivo y su relacin con la temperatura, las lluvias y los fertilizantes, nos estamos refi-riendo al anlisis de regresin mltiple. En otras palabras, en el anlisis de re-gresin en dos variables existe slo una variable explicativa,. mientras que en el anlisis de regresin mltiple se trabaja con ms de una de dichas variables.

    El trmino aleatorio es sinnimo de estocstico, que a su vez es un sin-nimo de probabilidad. Como se anot anteriormente, una variable aleatoria o estocstica es aquella que puede tomar cualquier conjunto de valores positivos o negativos, con una probabilidad dada. 9

    A menos que se afirme lo contrario, la letra Y representar la variable dependiente y las X (Xl' X 2 , , Xk ) representarn las variables explica-tivas, siendo Xk la i-sima variable explicativa. Los subndices i o t deno-tarn la observacin o valor i-simo o t-simo Xu (o Xkt ) denotarn la i-sima (o t-sima) observacin de la variable X k N (o T) representarn el nmero total de observaciones o valores en la poblacion o en una muestra, segn el caso. En general, usaremos el subndice i para las series de corte transversal (vr. gr., informacin tomada en un punto en el tiempo). El sub-ndice t se usar para informacin de series de tiempo (vr. gr., datos recog-

    9 Vase Apndice A, para efectos de una def'micin formal y detalles adicionales.

  • 22 MODELOS UNIECUACIONALES DE REGRESION

    dos a lo largo de un cierto perodo). La naturaleza de la informacin de las series de corte transversal y de las series de tiempo, as como el importante tema de la naturaleza y las fuentes de informacin para anlisis emprico, se estudiarn en la siguiente seccin.

    1.7 NATURALEZA Y FUENTES DE INFORMACION PARA EL ANALlSIS ECONOMETRIC01o

    El xito de cualquier anlisis economtrico depende en ltima instancia, de la disponibilidad de informacin adecuada. Es, por tanto, esencial que se dedique algn tiempo para comentar la naturaleza, fuentes y limitaciones de la informacin con que se puede contar cuando se realiza anlisis emprico.

    Tipos de infonnacin Existen tres tipos de datos que generalmente se encuentran disponible~ para realizar anlisis emprico: 1. Series de tiempo. 2. Series de corte transversal. 3. Combinacin de series de tiempo y series de corte transversal.

    Los datos de series de tiempo son aquellos que se almacenan durante un determinado perodo, tales como la informacin sobre PNB, empleo, desempleo, oferta monetaria, etc. Estos datos se pueden recolectar en inter-valos regulares, ya sea diariamente (por ejemplo, los precios de las acciones), semanalmente (vr. gr., oferta monetaria), mensualmente (vr. gr., la tasa de desempleo), trimestralmente (vr. gr., el PNB) o anualmente (vr. gr., el presu-puesto nacional). Dicha informacin puede ser cuantitativa (por ejemplo, precios, ingresos, oferta monetaria), o cualitativa (vr. gr., hombre o mujer, empleado o desocupado, casado o soltero, blanco o negro). Como veremos posteriormente, las variables cualitativas, tambin denominadas variables dicotmicas o categricas, pueden ser tan importantes como las variables cuantitativas (vase Captulo 12).

    Las series de corte transversal se recolectan con base en una o ms varia-bles en un momento en el tiempo, tales como el censo de poblacin que lleva a cabo la oficina de censos cada 10 aos, las encuestas de gastos del consumidor llevadas a cabo por la Universidad de Michigan, las encuestas de opinin que adelantan diferentes empresas especializadas, etc.

    En los datos combinados ("pooled data" y de corte transversal) se tienen elementos de informacin proveniente tanto de series de tiempo como de corte transversal. Por ejemplo, los datos que se presentan en el Ejercicio

    10 Para una explicacin informativa, vase Michael D. Intriligator, Econometric Mode/s, Techniques, and Applications, Ptentice-Hall, Inc., Englewood Cliffs, N. J., 1978, Cap. 3.

  • LA NATURALEZA DEL ANALlSIS DE REGRESION 23

    1.1 son combinados debido a que la tasa de inflacin de cada pas durante . un perodo' de 21 afios, 1960-1980, est en la fonna de una serie de tiem-po, mientras que los datos sobre la tasa d inflacin durante un solo afio para cada uno de los cinco pases all considerados es de corte transversal. En los datos combinados se cuenta con un total de 105 observaciones. 21 observaciones anuales para cada uno de los cinco pases.

    Los datos longitudinales o de panel constituyen un tipo especial de da-tos combinados a ros cuales tambin se les denomina datos de micropanel; en stos la misma unidad de corte transversal (por ejemplo, una familia o una empresa) se encuesta a travs del tiempo. Por ejemplo, el Departamento de comercio de los Estados Unidos lleva a cabo un censo de vivienda a inter-valos peridicos. En cada encuesta peridica se entrevista a la misma familia (o a las personas que habitan la misma vivienda) buscando averiguar si se ha presentado algn cambio en las condiciones tanto finanCieras como de la vivienda misma de dicha familia desde la ltiina encuesta. Al entrevistar repetidamente a la misma familia a intervalos peridicOS, la infonnacin de panel proporciona infonnacin muy til sobre la dinmica del comporta-miento familiar.

    Las fuentes de infonnacinll

    La infonnacin que se utiliza en anlisis empricos puede recolectarse por parte de una agencia gubernamental (vr. gr., el Departamento de' comercio de los Estados Unidos), una agencia internacional (vr. gr., el FMI o el Banco Mundial), una organizacin privada (la empresa Standar & Poor's) o por parte de un individuo. Existen literalmente miles de estas agencias dedicadas a recolectar infonnacin para diversos propsitos.

    Los datos recolectados por estas empresas pueden tener una naturaleza experimental o no experimental. En los datos de tipo experimental, con frecuencia recopilados por las ciencias naturales, el investigador puede estar interesado en recolectar infonnacin en que se mantengan ciertos factores constantes, de tal manera que pueda evaluar el impacto de otros factores adicionales sobre un fenmeno detenninado. Por ejemplo, para evaluar el impacto de la obesidad sobre la presin sangunea, el investigador deseara recolectar infonnacin manteniendo factores tales como los hbitos alimen-ticios, las actividades de fumar o beber en fonna constante, de tal manera que se pueda minimizar la influencia de, estas variables sobre la presin sangunea. '

    En las ciencias so~iales generalmente los d'atos que se obtienen son de naturaleza no experimental, lo cual implica que no estn sujetos al control del irivestigaaor. As, por ejemplo, la infonnacin referente al PNB, al de-

    11 Para una explicacin muy clara, vase Albert T. Sorners, The U.S. Economy Demystified: What the Major Economic Statistics Mean and Their Significallce for BusinelS, D. C. Heath and Cornpany, Lexington, Mass., 1985.

  • 24 MODELOS UNIECUACIONALES DE REGRESION

    sempleo, al precio de las acciones, etc., no est directamente bajo el control del investigador. Como veremos posteriormente con frecuencia este hecho crea problemas especiales al investigador que 'intenta encontrar la causa o las causas que afectan una determinadastuacin. Por ejemplo, es la cantidad de dinero circulante la variable que deterlilina en PNB (nominal) o, por el contrario, ocurre la relacin de causalidad en la otra direccion?

    La exactirup de la infonnaciri l 1. Aunque existe mucha informacin disponitile para llevar a cabo investigacin econmica, la calidad de sta no es necesariamente tan buena. Existen dife-rentes razon~ para ello. En primer lugar, como se seal anteriorm~nte, la mayor parte

  • LA NATURALEZA DEL ANALlSIS DE REGRESION 25

    anlisis puede hacerse nicamente a ~n nivel muy agregado. Este. tipo de macroanlisis no refleja, sin embargo, la dinmica del comportamiento de las microunidades. De igual fonna, el Departamento de comercio de los Estados Unidos, agencia que lleva a cabo un censo emprsarial cada cinco afios en ese pas, no puede hacer pblica la informacion sobre produccip, empleo, consumo de energa, gastos en investigacin y desarrollo, etc., a nivel de cada empresa. Erl 'Consecuencia, es difcil estudiar las diferencias existentes entre una empresa y otra en relacin cn cada uno de estos as-pectos.

    Debido a estos y muchos otros problemas, el investigador siempre debe tener presente que ls resultados de la investigacion son tan buenos como sea la calidad de la infurmacin con que trabaje. Por tanto, si en ciertas situaci~ nes se encuentra que los resultados de la investigacin "no son satisfactorios", no se debe necesariamente a que se haya utilizado el modelo equivocado, sino a la mala calidad de los datos. Desafortunadamente, en razon de la na-turaleza no experimental de .los datos que se utilizan en la mayora de los estudios en las ciencias sociales, con frecuencia los investigadores no tienen otra opcin aparte de depender de la informacin disponible. Sin embargo, se debe recordar siempre que la informacin utilizada puede no ser la mejor, no debiendo, por lo tanto, ser demasiado dogmticos acerca de los resultados que se obtienen de un determinado estudio, especialmente cuando se sospe-cha de la calidad de la informacin con que se trabaja.

    1.8 RESUMEN Y CONCLUSIONES Este captulo estuvo dirigido a suministrar informacin relacionada con la naturaleza bsica del anlisis de regresin, de la manera ms informal e intui-tiva posible. La idea fundamental del anlisis de regresin consiste en la de-pendencia estadstica. de una variable, la variable dependiente, con. respecto a una o ms variables, las variables explicativas. El objeto de este anlisis es estimar y/o predecir la medida o el valor promedio de la variable dependien-te, con base en los valores fijos o conocidos de las variables explicativas.

    Aunque la teora y Jos mecanismos del anlisis de regresin se analizarn ampliamente en los prximos captulos, debe tenerse siempre en mente que el xito del anlisis de regresin depende de la disponibilidad de informacin adecuada. En este captulo analizamos la naturaleza, fuentes y limitaciones de la informacin generalmente disponible para la investigaGin, especialmente en las ciencias sociales. Debemos solicitar muy especialmente al lector que se mantenga muy alerta sobre los datos que se utilizan en el anlisis emprico. En cualquier investigacin, los investigadores deben enunciar claramente las fuentes de los datos utilizaqos en el anlisis, sus definiciones, su(s) mtodo(s) de recoleccin y cualquier omisin en los datos, as como cualquier revisin de los mismos. Recuerde siempre que el consultante quiz no cuente con el tiempo, energa ni recursos p"ara llegar a las fuentes originales de los datos o para verificar los resultados; tiene el derecho de suponer que se obtuvieron los mejores datos posibles y que los clculos y anlisis son correctos.

  • 26 MODELOS UNIECUACIONALES DE REGRESION

    EJERCICIOS 1.1 En la siguiente tabla se presentan las tasas de inflacin correspondientes a cinco pases

    industrializados para el perodo 1960-1980.

    Tasas de inflacin en cinco pases industria-lizados 1960-1980 (% anual) Ao Estados Gran Japn Alemania Francia

    Unidos Bretaa

    1960 1.5 1.0 3.6 1.5 3.6 1961 1.1 3.4 5.4 2.3 3.4 1962 1.1 4.5 6.7 4.5 4.7 1963 1.2 2.5 7.7 3.0 4.8 1964 1.4 3.9 3.9 2.3' 3.4 1965 1.6 4.6 6.5 3.4 2.6 1966 2.8 3.7 6.0 3.5 2.7 1967 2.8 2.4 4.0 1.5 2.7 1968 4.2 4.8 5.5 1.8 4.5 1969 5.0 5.2 5.1 2.6 6.4 1970 5.9 6.5 7.6 3.7 5.5 1971 4.3 9.5 6.3 5.3 5.5 1972 3.6 6.8 4.9 5.4 5.9 1973 6.2 8.4 12.0 7.0 7.5 1974 10.9 16.0 24.6 7.0 14.0 1975 9.2 24.2 11.7 5.9 11.7 1976 5.8 16.5 9.3 4.5 9.6 1977 6.4 15.9 8.1 3.7 9.4 1978 7.6 8.3 3.8 2.7 9.1 1979 11.4 13.4 3.6 4.1 10.7 1980 13.6 18.0 8.0 5.5 13.3

    Fuente: Richard Jackman, Charles Mulvey, and James Trevithick, The Economics oi Inflation, 2d. ed., Martin RobeTtson, 1981, tabla 1.1. p.5.

    (a) Grafique la tasa de inflacin para cada pas frente al tiempo. (Utilice el eje hori-zontal para el tiempo y el vertical para la tasa de inflacin).

    (b) Qu conclusiones generales se pueden inferir acerca de la experiencia con la inflacin en los cinco pases?

    (e) Qu pas parece tener la tasa de inflacin ms variable? Puede usted dar alguna explicacin?

    1.2 Utilice los datos del Ejercicio 1.1. (a) Grafique la tasa de inflacin para Gran Bretaa, Japn, Alemania y Francia fren-

    te a la tasa de inflacin en los Estados Unidos. (Utilice el eje horizontal para la tasa de inflacin en los Estados Unidos y el vertical para la tasa de inflacin de los dems pases. Si lo prefiere, puede hacer cuatro diagramas separados).

    (b) Haga comentarios generales sobre el comportamiento en la tasa de inflacin en los cuatro pases, en comparacin con su comportamiento en los Estados Unidos.

  • LA NATURALEZA DEL ANALlSIS DE REGRESION

    (e) .J

    Observa usted algn cambio significativo en el comportamiento inflacionario de cada pas a travs del tiempo, y de los cuatro pases en relacin con los Esta-dos Unidos?

    (d) Cree usted que los embargoS petroleros de 1974 y 1979 hayan tenido un efecto significativo en la tasa de inflacin de los diferentes pases? Si es as, por qu razn?

    (e)

  • CAPITULO 2 MODELOS DE REGRESION

    CON DOS VARIABLES: ALGUNAS IDEAS

    BASICAS

    En elCaptulo 1 nos ocupamos del concepto de regresin en trminos ms o menos amplios. En este captulo tratamos el tema de manera un poco ms formal; especficamente, ste y los tres captulos siguientes inician el estudio de la teora que sirve de fundamento al anlisis de regresin ms sencillo para el caso de dos variables, el cual se .considera en primer lugar, no necesa-riamente por su importancia prctica sino porque sirve para presentar en forma simple las ideas bsicas del anlisis de regresin y porque con l se pueden ilustrar algunas ideas usando diagramas en dos dimensiones. Adems, se ver ms adelante, el caso general del 'anlisis de regresin mltiple es en muchos aspectos una extensin lgica del caso de dos variables.

    2.1 EJEMPLO HIPOTETICO Como se seal en la Seccin 1.2, el anlisis de regresin est dirigido a esti-mar o predecir el valor medio o promedio (poblacional) de la variable depen-diente con base en los valores fijos o conocidos de la (s) variable (s) explicativa(s). Para cmprender la manera como se lleva a cabo este anlisis, examinemos el

    si~l1ieT\te ejemplo:

    28

  • MODELOS DE REGRESION CON DOS VARIABLES: ALGUNAS IDEAS BASICAS 29

    TABLA 2.1 .110 familiar por semana X, $

    ~ 80 100 120 140 160 180 100 210 240 160 Gastos de COIlSUmO 55 65 79 80 102 110 120 135 137 150 familiar por 60 70 84 93 107 115 136 137 145 152 semana y, $ 65 74- 90 95 110 120 140 140 155 1.75

    70 80 94 103 116 130 144 152 165 178 75 85 98 108 118 135 145 157 175 180 ... !l8 ... 113 125 140 ... 160 189 185 ... ... ... 115 ... .., . .. 162 . .. 191

    Total 325 462 445 707 678 750 685 1043 966 1211

    Imaginemos un pas con una poblacin total1 de 60 familias. Supngase que estarnos interesados en estudiar la relacin existente entre los gasts de consumo familiar semanal Y y el ingreso disponible familiar semanal despus de impuestos X. Ms especficamente, asmase que se desea predecir el nivel (poblacional) promedio de los gastos de consumo semanales, conociendo el ingreso de la familia en este lapso. Con este [m, supongamos que se dividen las 60 familias en 10 grupos con el mismo ingreso aproximadamente, para

    examin~ a continuacin los gastos de consumo,de las familias en cada uno de los grupos de ingreso. En la Tabla 2.1 se presenta informacin hipottica. (Por razones expositivas, se supone que solamente se observaron en ~a1idad los niveles de ingreso d.ados en dicha Tabla).

    La Tabla 2.1 debe interpretarse de la siguiente manera: para un ingreso' semanal de S80, existen 5 familias cuyos gastos' de consumo semanales osci-lan entre S55 'y S75. Anlogamente, para X = $240, existen 6 familias cuyos gastos de consumo semanal estn entre S137 y $189. En otras palabras, cada columna de la Tabla 2.1 muestra la distribucin de los gastos de consumo Y correspondientes a un nivel fijo de ingreso X; esto es, muestra la distribucin condicional de Y condicionada en los valores dados de X.

    Dados que los datos de la Tabla 2.1 representan la poblacin, podernos calcular fcilmente las probabilidades condicionales de Y p(Y I X). o la proba-bilidad de Y dado X, de la siguiente manera.2 Para X = S80, por ejemplo,

    1 Informalmente, una poblacin es el conjunto de todos los resultados posibles de un experimento o medicin, por ejemplo, cuando se lanza al aire una moneda varias veces o cuando se registran los pre-cios de todos los ttulos valores' transados en la Blsa de valores de Nueva York al fmal del da. 2 Unas palabras sobre lB notacin utilizada. La expresin p( y I X) o p( Y I XI) es una forma abreviada de p( r = 1) I X = X }, la probabilidad de que la variable aleatoria (discreta) Y tome el valor numrico Y dado que 'la variable aleatoria (discreta) X tome el valor numrico X" Sin embargo, pira no congestio-nar la. notaci6n utilizaremos el subndice i (el nmero de la observacin) para las dos variables; Por tanto,p(Y IX) o p(Y IX J significarp(Y '" 1'; I X = XJes decir, la probabilidad de que Y tome el valor Y, dado que X tome el valor XI, puesto que se desea aclarar el rango de los valores que 'toman X y Y. En la Tabla 2.1, cuando X = $220, Y toma siete valores diferentes, pero cuando X = $120, Y toma slo cinco valores diferentes.

  • 30 MODELOS UNIECUACIONALES DE REGRESION

    TABLA 2.2 Probabilidades condicionales p( Y I X ) para los datos de la Tabla 2.1

    ~Y;X~ 80 100 120 140 160 180 200 220 240 260

    Probabilidades 1 1 1 1 1 1 1 1 1 1 5 ; 5 7" 6 6 5 7 "

    ..

    condicionales 1 1 1 .), 1 1 1 1 1 1 j ;; 5 6 6 5 7 6 "7 p(Y I XI) 1 1 1 1 1 1 1 .J, 1 .J, 5 6 5 7 6 6 5 6

    1 1 t 1 1 1 1 1 1 1 5 6 7 6 6 5 7 ti 7" ~ 1 ~ o\- 1 1 1 1 1 t 6 ; 6 5 7 6

    1 1 1 1 t i 1 6 7 6 ti 7 o\- 1 1 7 7

    Medias condicionales de Y 65 77 89 101 113 125 137 149 161 173

    existen 5 valores de Y: $55, $60, $65, $70 y $75. Por tanto, dado que X == $80, la probabilidad de obtener uno de estos gastos de consumo es !. Simblica-mente, p(Y = 55\ X = 80) =!. De igual forma, p(Y = 150' X = 260) = t y as sucesivamente. Las probabilidades condicionales para los datos de la Tabla 2.1 se presentan en la Tabla 2.2.

    Ahora bien, para cada una de las distribuciones de probabilidad condi-cionales de Y se puede calcular su valor medio o promedio, trmino conocido tambin como la media condicional o esperanza condicional, que se denota comoE(Y, X = Xi) Y que se lee "el valor esperado de Y dado que X toma el valor especfico X"y que, para efectos de simplificar la notacin, se escribir como E(Y \ XJ (Nota: Un valor esperado es simplemente la media o valor promedio de la poblacin). Para nuestros datos hipotticos, estas esperanzas condicionales pueden ser calculadas fcilmente multiplicando los valores rele-vantes de Y dados en la Tabla 2.1, por sus probabilidades condicionales dadas en la Tabla 2.2 y sumando luego estos productos. Para ilustrar el concepto, se tiene que la media condicional o esperanza de Y dado X == 80 ser igual a: 5 5(!) + 60(!) + 65(}) + 70( *) + 7 5( ~) = 65. Las medidas condicionales cal-culadas se encuentran al final de la Tabla 2.2.

    t

    Antes de seguir es convenie'n te observar las cifras de la Tabla 2.1 a travs de un diagrama de dispersin, como se muestra en la Figura 2.1, en el cual se muestra la distribucin condicional de Y correspondiente a varios valores de X. A pesar de que ocurren variaciones en los gastos de algunas familias conside-radas individualmente, la grfica de la Figura 2.1 muestra claramente que, e,. promedio, los gastos de consumo aumentan al incrementarse el ingreso. Dicho de otra manera, la figura sugiere que los valores (condicionales) promedios de y aumentan cuando X se incrementa. La anterior afirmacin puede apreciarse mucho mejor si concentramos nuestra atencin en los puntos ms gruesos que representan diferentes valores condicionales medios de Y. El diagrama muestra la forma como estos puntos aparecen exactamente sobre una lnea

  • MODELOS DE REGRESION CON DOS VARIABLES: ALGUNAS IDEAS BASICAS

    M

    7i i a = o a a o u .. 'O .. o i c.?

    200

    150

    100

    50~~~~--~--~--~--~--~--~---L---L--80 100 120 140 160 180 200 220 240 260

    Ingreso semanal, $

    FIGVRA2.1 Distribucin condicional del gasto para deaentes niveles de Ingreso (datos de la Tabla 2.1).

    ,-

    31

    recta con pendiente positiva.3 Esta lnea se denomina lnea de regresin po-blacional o, ms genricamente, curva de regresin poblacional o, ms espe-cficamente, curva de regresin poblacional de Yen X.

    Desde el punto de vista geomtrico, una curva de regresin poblacional es simplemente el trazado o unin de las medlS condicionales o esperanzas de la variable dependiente para losvaloresfijosde 10/ s) variable( s) explicativolsJ. En la Figura 2.2 .se puede observar la curva de regresin poblacional, que

    mu~stra que para cada Xi existe una poblacin de valores de Y (que se supo-nen normalmente distribuidos, por razones que se explicarn ms adelante) y una media (condicional) correspondiente. La lnea o curva de regresin atra-viesa estas' medias condicionales. Con esta interpretacin d~ la curva de regresin es aconsejable releer la defmicin de regresin dada en la seccin 1.2.

    2.2 CONCEPTO DE LA FUNCION DE REGRESION POBLACIONAL (FRP)

    De la ~terior exposicin y especialmente de las Figuras 2.1 y 2.2, se deduce claramente que cada medJa condicional E(Y I Xi) est en funcin de Xi' Sim-blicamente, se tiene que:

    E(YIX) =f(X) (2.2.1)

    .

    3 El lector debe mantener presente la naturaleza hipottica de nuestra inforrnacion. No se est sugi-riendo que las medias condicionales deban siempre estar sobre una lnea recta; ellas pueden perfecta-mente estar sobre un~ curva.

  • 32 MODELOS UNIECUACIONALES DE REGRES!ON

    y

    @ Media condicional

    ....

    o ;149~----~--~~~--~~~ e

    ~ o IOII------+~-::iIIIF--.\ Distribuci6n de Y dado X = $220 e ~ 6S I------~F_I ...

    .. ..,

    S ~

    ~~--J80-----1~40-------22~O--------X Ingreso seman.al. $

    FIGURA 2.2 Lteas de regresin poblacional (datos de la Tabla 2.1).

    en donde f(X i) denota una funcin de la variable explicativa Xi' [En nuestro ejemplo hipottico, E(YI Xi) es una funcin lineal de X]. La ecuacin (2.2.1) se conoce como la funcin de regresin poblacional, FRP, (en dos varibles) o simplemente regresin poblacional (RP). Dicha funcin denota nicamente que la media (poblacional) de la distribucin de Y dado Xi est funcional-mente relacionada con XI. En otras palabras, nos muestra cmo el valor pro-medio (poblacional) de Y vara con las X. Dicho de otra fonna, nos dice cmo la respuesta media: o promedio de Y vara con X

    Qu fonna toma la funcinf(X i)? Esta pregunta es importante, dado que en una situacin real no se dispone de la totalidad de la poblacin para efectuar el anlisis. Por tanto, la fonna funcional de la FRP debe ser aproxi-mada de una manera emprica, aunque para casos especficos es necesario acudir a la teora. Por ejemplo, un economista puede afinnar que los gastos de consumo estn linealmente relacionados con el ingreso. En consecuencia, como una primera aproximacin o como hiptesis de trabajo, podemos supo-ner que la I;'RP E(Y I Xi) es una funcin lineal de Xi, por ejemplo, del siguiente tipo:

    (2.2.2)

    en la cual PI y P2 son parmetros desconocidos pero fijos que se denominan coeficientes de regresin, tambin llamados interseccin y coeficiente de la pendiente, respectivamente. La ecuacin (2:2.2) se conoce como la funcin de regresin lineal poblacional o, simplemente, como la regresin lineal poblo-donal. Otras expresiones equivalentes utilizadas son: modelo de regresin li-neal poblacional, o ecuacin de regresin lineal poblacional. Obviamente, los tnninos regresin ecuacin de regresin y modelo de regresin son sinnimos.

    En el anlisis de regresin, nuestro inters consiste en estimar una FRP como la de la ecuacin (2.2.2), esto es, estimar los valores de las incgnitas y

  • MODELOS DE REGRESION CON DOS VARIABLES: ALGUNAS IDEAS BASICAS 33

    TABLA 2.3 Modelo. de reresin lineal

    Modelo Un. en 10& parimeuo.? Modelo Uneal ea Ju Ylriablea? Si No

    s No

    MRI: MRNL

    NotG:MRL Modelo de rest_ln lineal MRNL Modelo de rell'esin no lineal

    MRL MRNL

    I I

    PI y P2 con base en las observaciones de Y y X, 10 cual se estudiar en detalle en el Capitulo 3. .

    2.3 . SIGNIFICADO DEL TERMINO "LINEAL" Dado que este texto est interesado principalmente en modelos lineales como los de (2.2.2), es esencial entender en qu consiste el trmino lineal ya que' ste puede ser interpretado de dos maneras diferentes.

    Linealidad en las variables ~ .

    El principal y quiz ms "natural" significado de linealidad es que la expec-tativa condicional de Y es una funcin lineal de X" por ejemplo en (2.2.2).04 Geomtricamente, la CUNa de re~sin es en este caso una lnea recta. En esta interpretacin, una funcin de regresin tal como E(Y I X J = PI -+ P2 xf no es una funcin lineal, debido a que la variable X aparece elevada al cuadrado.

    Linealidad en los parmetros El segundo sentido de linealidad es que la esperanza condic