CAPITULO 12
-
Upload
juan-diego-arizabal -
Category
Documents
-
view
229 -
download
0
description
Transcript of CAPITULO 12
© 2001 Alfaomega Grupo Editor
1-1
Capítulo doceRegresión lineal y correlación
OBJETIVOSAl termiar este capítulo podrá:
UNODibujar un diagrama de dispersión.
DOS Entender e interpretar los términos variable dependiente y variable independiente.
TRESCalcular e interpretar el coeficiente de correlación, el coeficiente de determinación y el error estándar de la estimación.
CUATRO
Realizar una prueba de hipótesis para determinar si existe una diferencia
entre las medias de bloques. © 2001 Alfaomega Grupo Editor
© 2001 Alfaomega Grupo Editor
1-1
Capítulo doce continuación
Regresión lineal y correlación
OBJETIVOSAl terminar este capítulo podrá:
CINCO Calcular la recta de regresión de mínimo cuadrados e interpretar la pendiente y las intercepciones.
SEISConstruir e interpretar intervalos de confianza e intervalos de predicción para la variable independiente.
SIETE
Establecer e interpretar una tabla de ANOVA.
© 2001 Alfaomega Grupo Editor
© 2001 Alfaomega Grupo Editor
Análisis de correlación
• Análisis de correlación: se usa un gupo de técnicas estadísticas para medir la fuerza de la relación (correlación) entre dos variables.
• Diagrama de dispersión: gráfica que describe la relación entre las dos variables de interés.
• Variable dependiente: la variable que se pronostica o estima.
• Variable independiente: la variable que proporciona la base para la estimación. Es la variable predictora.
12-3
© 2001 Alfaomega Grupo Editor
Coeficiente de correlación, r
• El coeficiente de correlación (r) es una medida de la intensidad de la relación entre dos variables.· Requiere datos con escala de intervalo o de razón
(variables). · Puede tomar valores entre -1.00 y 1.00.· Valores de -1.00 o 1.00 indican correlación fuerte
y perfecta.· Valores cercanos a 0.0 indican correlación débil.· Valores negativos indican una relación inversa y
valores positivos indican una relación directa.
12-4
© 2001 Alfaomega Grupo Editor
Correlación negativa perfecta
0 1 2 3 4 5 6 7 8 9 10
10 9 8 7 6 5 4 3 2 1 0
X
Y
12-5
© 2001 Alfaomega Grupo Editor
Correlación positiva perfecta
0 1 2 3 4 5 6 7 8 9 10
10 9 8 7 6 5 4 3 2 1 0
X
Y
12-6
© 2001 Alfaomega Grupo Editor
Correlación cero
0 1 2 3 4 5 6 7 8 9 10
10 9 8 7 6 5 4 3 2 1 0
X
Y
12-7
© 2001 Alfaomega Grupo Editor
Correlación positiva fuerte
0 1 2 3 4 5 6 7 8 9 10
10 9 8 7 6 5 4 3 2 1 0
X
Y
12-8
© 2001 Alfaomega Grupo Editor
Fórmula para r
2222 Y)()(
))(()(=
YnXXn
YXXYnr
12-9
© 2001 Alfaomega Grupo Editor
Coeficiente de determinación
• El coeficiente de determinación, r2 - la proporción de la variación total en la variable dependiente Y que está explicada por o se debe a la variación en la variable independiente X. · El coeficiente de determinación es el
cuadrado del coeficiente de correlación, y toma valores de 0 a 1.
12-10
© 2001 Alfaomega Grupo Editor
EJEMPLO 1
• Dan Ireland, presidente de la sociedad de alumnos de la Universidad de Toledo, está preocupado por el costo de los libros. Para tener un panorama del problema elige una muestra de 8 libros de venta en la librería. Decide estudiar la relación entre el número de páginas del libro y el costo. Calcule el coeficiente de correlación.
12-11
© 2001 Alfaomega Grupo Editor
EJEMPLO 1 continuación
Libro Páginas Costo ($)
1 500 28
2 700 25
3 800 33
4 600 24
5 400 23
6 500 27
7 600 21
8 800 31
12-12
© 2001 Alfaomega Grupo Editor
EJEMPLO 1 continuación
• r =.614 (verifique)• Pruebe la hipótesis de que no existe
correlación en la población. Use .02 de nivel de significancia.
• Paso 1: H0 la correlación en la población es cero. H1 la correlación en la población es distinta de cero.
• Paso 2: H0 se rachza si t>3.143 o si t<-3.143, gl = 6, = .02
12-13
© 2001 Alfaomega Grupo Editor
EJEMPLO 1 continuación
• El estadístico de prueba es t = 1.9055, calculado por
con (n - 2) grados de libertad• Paso 4: H0 no se rechaza
tr n
r
2
1 2
12-14
© 2001 Alfaomega Grupo Editor
Análisis de regresión
• Propósito: determinar la ecuación de regresión; se usa para predecir el valor de la variable dependiente (Y) basado en la variable independiente (X).
• Procedimiento: seleccionar una muestra de la población y enumerar los datos por pares para cada observación; dibujar un diagrama de dispersión para visualizar la relación; determinar la ecuación de regresión.
12-15
© 2001 Alfaomega Grupo Editor
Análisis de regresión
• La ecuación de regresión: Y’= a + bX, donde: • Y’ es el valor promedio pronosticado de Y para
cualquier valor de X.• a es la intercepción en Y, o el valor estimado de Y
cuando X = 0• b es la pendiente de la recta, o cambio promedio en Y’
por cada cambio de una unidad en X• se usa el principio de mínimos cuadrados para obtener
a y b:
bn XY X Y
n X X
aY
nb
X
n
( ) ( )( )
( ) ( )
2 2
12-16
© 2001 Alfaomega Grupo Editor
EJEMPLO 2
• Desarrollar una ecuación de regresión para la información dada en el EJEMPLO 1 que puede usarse para estimar el precio de venta basado en el número de páginas.
• Por el principio de mínimos cuadrados, b = .01714 y a = 16.00175Y’ = 16.00175 + .01714X
12-17
© 2001 Alfaomega Grupo Editor
Error estándar de la estimación
• El error estándar de la estimación mide la dispersión de los valores observados alrededor de la recta de regresión.
• Fórmulas usadas para calcular el error estándar:
SY Y
n
Y a Y b XY
n
Y X
( ' )
( ) ( )
2
2
2
2
12-18
© 2001 Alfaomega Grupo Editor
Suposiciones fudamentales de regresión lineal
• Para cada valor de X, existe un grupo de valores de Y que tienen una distribución normal.
• Las medias de estas distribuciones normales de valores de Y deben estar sobre la recta de regresión.
• Las desviaciones estándar de estas distribuciones normales son iguales.
• Los valores de Y son estadísticamente independientes. Es decir, que en la selección de una muestra, los valores elegidos de Y para un valor particular de X no depende de los valores de Y para otro valor de X.
12-19
© 2001 Alfaomega Grupo Editor
Intervalo de confianza
• El intervalo de confianza para el valor medio de Y para un valor dado de X está definido por:
Y t Sn
X X
XXn
Y X' ( )( )
( )
1 2
22
12-20
© 2001 Alfaomega Grupo Editor
Intervalo de predicción
• El intervalo de predicción para un valor individual de Y para un valor dado de X se define por:
Y t Sn
X X
XXn
Y X' ( )( )
( )
1
1 2
22
12-21
© 2001 Alfaomega Grupo Editor
EJEMPLO 3
• Use la información del EJEMPLO 1:· calcule el error estándar de la estimación:
· desarrolle un intervalo de confianza de 95% para los libros de 650 páginas: [24.03, 30.25]. Verifique
· desarrolle un intervalo de predicción de 95% para un libro de 650 páginas: [18.09, 36.19] Verifique
SY X = 3.471
12-22
© 2001 Alfaomega Grupo Editor
Más sobre el coeficiente de determinación
12-23
2
22
2
)-()'-(-)-(
=
totalvariaciónexplicada no variación- totalvariación
=
YYYYYY
r
Regresión = SSR = (Y’ - Y )2
Variación del error = SSE = (Y’ - Y )2
Variación total = SS total = (Y - Y )2
© 2001 Alfaomega Grupo Editor
Más sobre el coeficiente de determinación
rSSR
SS total
SSE
SS total
SSSE
nY X
2 1
2
12-24