Estadística Inferencial Sesión 11. Regresión y correlación múltiple
Contextualización
En la sesión anterior se presentó la regresión lineal simple y se mostró
su uso en la obtención de una ecuación de regresión estimada que
describe la relación entre dos variables.
En esta sesión se continúa con el estudio del análisis de regresión
considerando, ahora, situaciones en las que intervienen más de dos
variables.
Trabajaremos el concepto de regresión y correlación múltiple, veremos
ejemplos prácticos donde se aplica este modelo de análisis para
inferencia estadística.
Contextualización
La ecuación de regresión
múltiple estimada y su
aplicación en la prueba de
hipótesis y estimación por
intervalos, así como entender la
aplicación práctica del análisis
residual.
Introducción
“El análisis de regresión múltiple se empleó para obtener un mejor proceso de blanqueo en la fabricación de productos de papel blanco”
Lester Lefkowitz/Corbis.
¿Qué es el análisis de regresión múltiple?
¿Qué tipo de estimadores utiliza?
¿Cuál es la mejor distribución de probabilidad que se utiliza en este modelo?
Éstas y otras preguntas podremos responder en el desarrollo de este tema para el uso y aplicación práctica del análisis de regresión múltiple.
Fuente: http://www.revfacagronluz.org.ve/v16_4/164z0305.jpg
Explicación
Modelo de regresión múltiple
Estudia la relación de una variable dependiente con dos o más variables
independientes. Para denotar el número de variables independientes se
suele usar p.
Modelo de regresión y ecuación de regresión.
Modelo:
Donde 𝛽0, 𝛽1, 𝛽2, … 𝛽𝑝 , son parámetros y el término del error es una
variable aleatoria.
Explicación
Ecuación:
Ecuación de regresión múltiple estimada:
Donde b0, b1, b2,….bp son los estimadores de 𝛽0, 𝛽1, 𝛽2, … 𝛽𝑝
𝑦 = valor estimado de la variable dependiente.
Método de mínimos cuadrados
De la misma manera que se utilizó este método en la obtención de la
ecuación de regresión lineal estimada, se utiliza para la obtención de la
ecuación de estimación en regresión múltiple.
Criterio de mínimos cuadrados:
Explicación
Para ilustrar el análisis de regresión múltiple requerimos forzosamente del uso de un software que trabaje este tipo de modelos, estos software pueden ser el Minitab o Excel, ya que su proceso operativo es muy complicado.
A continuación se hace una breve descripción de un ejemplo práctico para entender mejor este concepto y su aplicación:
Una empresa se dedica al transporte de objetos y mercancías en el sur de California, su actividad principal es hacer entregas en su área local para mejorar el horario de trabajo, los gerentes deseaban estimar el tiempo total de recorrido diario necesario para hacer las entregas. Al principio los gerentes creyeron que el tiempo total del recorrido diario estaba estrechamente relacionado con el número de millas recorridas para hacer las entregas. Pero al cabo de la realización de un estudio de análisis de regresión lineal simple se dieron cuenta que no solamente estos dos factores estaban estrechamente relacionados, también se percataron que el número de entregas podría contribuir a la duración total del recorrido.
Explicación
Apoyándose en software de aplicación encontraron que la ecuación de
regresión estimada estaba dada por:
, con los siguientes resultados:
Explicación
Consideramos que b1=0.0611 este valor son las horas de estimación
del aumento esperado en el tiempo recorrido que corresponde al
aumento en una milla en la distancia recorrida cuando el número de
entregas permanece constante. De manera similar b2 = 0.923, una
estimación del aumento esperado en el tiempo de recorrido que
corresponde al aumento de una entrega permaneciendo constante el
número de millas recorridas es 0.923.
Coeficiente de determinación múltiple:
Coeficiente de determinación múltiple ajustado:
Explicación
Prueba de significancia
La prueba F se usa para determinar si existe una relación de
significancia entre la variable dependiente y el conjunto de todas las
variables independientes; a esta prueba F se le llama prueba de
significancia global.
Si la prueba F indica que hay significancia global, se usa la prueba t
para ver si cada una de las variables individuales es significativa.
Para cada una de las variables independientes del modelo se realiza
una prueba t. A cada una de estas pruebas t se les conoce como
prueba de significancia individual.
Explicación
Análisis residual
En la sesión anterior se indicó que los residuales estandarizados suelen
emplearse en la graficas de residuales y en la identificación de
observaciones atípicas.
Su fórmula es: 𝑦𝑖−𝑦
𝑠𝑦−𝑦 , donde el denominador es la desviación estándar del
residual i.
Conclusión
En esta sesión se presentó la regresión múltiple como extensión del análisis
de regresión lineal simple. El análisis de regresión múltiple permite entender
cómo está relacionada una variable dependiente con dos o más variables
independientes.
La ecuación de regresión indica el valor esperado o valor medio de la variable
dependiente y está relacionado con los valores de las variables
independientes x1, x2, …xp. Para obtener la ecuación de regresión estimada,
se emplean los datos muestrales y el método de mínimos cuadrados.
Debemos recordar el hecho de que los paquetes de software para estadística
son los únicos medios realistas para realizar los numerosos cálculos que se
requieren en el análisis de regresión múltiple.
Conclusión
En la siguiente sesión veremos los Números índice mayormente
utilizados en la administración y economía.
Bibliografía
Anderson, D., Sweeney, D., Williams, T. (2008). Estadística para
administración y economía. (10ª ed.). México: Editorial Cengage
Learning.
S.a. (s.f.). Modelos de regresión múltiple. Consultado el día 03 de enero
del 2014:
http://www.uam.es/personal_pdi/ciencias/abaillo/AmbEst/Tema4.pdf
Velasco, C. (2007). Análisis de regresión múltiple: Estimación.
Consultado el día 03 d enero del 2014:
http://www.eco.uc3m.es/~cavelas/EMEI/tema3.pdf
Top Related