Capitulo 34 - crodzmate3026.files.wordpress.com
Transcript of Capitulo 34 - crodzmate3026.files.wordpress.com
Capitulo
Describir la
relación entre dos
variables
© 2010 Pearson Prentice Hall. All rights reserved
34
Relación entre dos variables
4-2© 2010 Pearson Prentice Hall. All rights
reserved
Al estudiar conjuntos de variables con más de una
variable, una pregunta fundamental debe ser si
podemos utilizar el valor de una variable para predecir
el valor de alguna otra variable.
Ejemplos:
• ¿Existe una relación entre la estatura y el peso?
• ¿Existe una relación entre la dosis de un
medicamento y el tiempo de recuperación?
• ¿Existe una relación entre la tasa de criminalidad y
los cambios en la población?
4-3© 2010 Pearson Prentice Hall. All rights
reserved
Tipos de variables en un experimento
• Variable de respuesta
• variable bajo estudio;
• aquella variable cuyos cambios se desean
estudiar
• variable dependiente en el estudio
• Variable explicativa
• variable cuyos valores explican los valores de
la variable respuesta
• se estudian los efectos que tiene la variable
explicativa sobre la variable respuesta
• variable que el investigador manipula
• variable independiente en el experimento
4-44© 2010 Pearson Prentice Hall. All rights
reserved
Diagrama de dispersión
• Diagrama de dispersión es una gráfica que nos
permite observar la relación entre dos cantidades
cuantitativas que se miden en un mismo individuo.
• Se localizan en el plano-xy puntos en los cuales las
coordenadas se forman como sigue:
x → variable explicativa (variable de entrada)
y → variable de respuesta (variable de salida)
• El eje horizontal representa la variable explicativa, y el
eje vertical representa la variable respuesta.
EJEMPLO Construir e interpretar un diagrama de dispersión
Source: Penner, R., and Watts, D.G. “Mining Information.” The American Statistician, Vol. 45, No. 1, Feb. 1991, p. 6.
4-5© 2010 Pearson Prentice Hall. All rights
reserved
Los investigadores deseaban
determinar si el tiempo que se
necesita para perforar en seco una
distancia de 5 pies de roca
incrementa con la profundidad a la
que se comienza la perforación.
• La profundidad a la que comienza
la perforación es la variable
explicativa, x
• el tiempo (en minutos) para
perforar 5 pies a cierta
profundidad es la variable
respuesta, y.
Dibuje un diagrama de dispersión de
los datos.
Tipos de Relaciones en un
Diagrama de Dispersión
4-6
4-7© 2010 Pearson Prentice Hall. All rights
reserved
Correlación lineal
• Si a medida que los valores de una variable aumentan
los valores de la otra variable también aumentan,
entonces existe correlación positiva.
• Si a medida que los valores de una variable aumentan
los valores de la otra variable disminuyen, entonces
existe correlación negativa.
• Coeficiente de correlación lineal de una muestra (r)
es una medida de la fuerza y dirección de la relación
lineal entre dos variable cuantitativas (coeficiente de
correlación Pearson)
4-8© 2010 Pearson Prentice Hall. All rights
reserved
Coeficiente de correlación lineal de una muestra
4-9© 2010 Pearson Prentice Hall. All rights
reserved
Coeficiente de correlación lineal de una muestra
𝑟 =σ𝑧𝑥 ∙ 𝑧𝑦
𝑛 − 1
𝑧𝑥 𝑧𝑦
𝑟 =1
𝑛 − 1𝑧𝑥 ∙ 𝑧𝑦
ó
4-10© 2010 Pearson Prentice Hall. All rights
reserved
Propiedades del Coeficiente de correlación lineal
4-11© 2010 Pearson Prentice Hall. All rights
reserved
Tipos de correlación
Niveles de correlación entre dos variables
124-12© 2010 Pearson Prentice Hall. All rights
reserved
Determine e interprete el coeficiente de
correlación lineal para la siguiente data.
4-13© 2010 Pearson Prentice Hall. All rights
reserved
EJEMPLO Coeficiente de correlación lineal
x y
1 1
2 2
2 3
3 6
(a) Encuentre una ecuación lineal que relaciona x (la variable explicativa) con y, (la variable de respuesta) seleccionando dos puntos y luego, encontrar la ecuación de la recta que contiene los puntos.
(b) Traza la gráfica de la ecuación sobre el diagrama de dispersion.
(c) Use la ecuación para predecir y si x = 3.
Use la siguente muestra:
144-14© 2010 Pearson Prentice Hall. All rights
reserved
Determine el coeficiente de
correlación lineal de la data
sobre perforación en rocas.
4-15© 2010 Pearson Prentice Hall. All rights
reserved
EJEMPLO Coeficiente de correlación lineal -tecnología
EJEMPLO ¿Existe una relación lineal?
Determine si existe una relación lineal en la data sobre
perforación en rocas. Si existe, comente sobre el tipo de relación
que existe entre la profundidad a la cual se comienza a perforar y
el tiempo que toma perforar 5 pies..
164-16© 2010 Pearson Prentice Hall. All rights
reserved
17
Ejemplo: • Según datos recopilados por El Resumen Estadístico de
Los Estados Unidos, la correlación entre el porcentaje de la población femenina con grados de bachillerato y el porcentaje de nacimientos a madres solteras desde 1990 es 0.940.
Cierto o Falso: Un porcentaje mayor de féminas con bacillerato causa un porcentaje mayor de madres solteras.
4-17© 2010 Pearson Prentice Hall. All rights
reserved
Diferencia entre correlación y
relación causal
18
• Entre dos variables puede existir otro factor que provoca una correlación alta sin que haya una relación causal.
Ejemplo: Se ha encontrado que la relación entre la venta de helado y la taza de criminalidad tiene una correlación positiva alta.
Justificación
4-18© 2010 Pearson Prentice Hall. All rights
reserved
Variables ocultas (“lurking variables”)
4-19© 2010 Pearson Prentice Hall. All rights reserved
Línea de regresión por mínimos
cuadrados
• La línea de regresión por mínimos cuadrados es la línea que minimiza los residuales.
• Es la línea que minimiza la suma de los cuadrados de las distancias verticales entre los valores observados y los valores que predice el modelo.
4-20© 2010 Pearson Prentice Hall. All rights reserved
Línea de regresión por mínimos
cuadrados
La ecuación de la línea de regresión por mínimos cuadrados está dada por
ො𝑦 = 𝑏1𝑥 + 𝑏0donde 𝑏1 = 𝑟 ∙
𝑠𝑦
𝑠𝑥es la pendiente
y 𝑏0 = ത𝑦 − 𝑏1 ҧ𝑥 es el intercepto en y
EJEMPLO Determinar el modelo de regresión lineal
Usar los datos sobre perforación
de rocas
(a)Encuentre la línea de
regresión por mínimos
cuadrados.
(b)Predecir el tiempo de
perforación en caso de que la
perforación se inicia en 130
pies.
(c)Dibuje la línea de regresión
por mínimos cuadrados sobre
el diagrama de dispersión de
los datos.
4-21© 2010 Pearson Prentice Hall. All rights reserved
EJEMPLO Predecir peso del oso negro americano
Los datos muestran la longitud y el
peso de 10 osos blancos
americanos. Se quiere poder usar
el largo para predecir el peso.
(a) Construir un diagrama de
dispersión
(b) Encuentre la línea de regresión
por mínimos cuadrados usando
la fórmula.
(c)Compare la respuesta de b, con
la línea de regresión por
mínimos cuadrados que da la
calculadora.
4-22© 2010 Pearson Prentice Hall. All rights reserved
Si la línea de regresión por mínimos cuadrados se utiliza para hacer predicciones basadas en los valores de la variable explicativa que son mucho más grande o mucho más pequeño que los valores observados, decimos que el investigador está trabajando fuera del alcance del modelo.
Nunca usamos una línea de regresión por mínimos cuadrados para hacer predicciones fuera del alcance del modelo, porque no podemos estar seguros de que la relación lineal sigue existiendo.
4-23© 2010 Pearson Prentice Hall. All rights reserved
Si una gráfica de los residuos contra la variable explicativa muestra un patrón discernible, tal como una curva definida, entonces, es posible que las variables no estén relacionadas linealmente.
4-24© 2010 Pearson Prentice Hall. All rights
reserved
Comentarios sobre los residuos
4-25© 2010 Pearson Prentice Hall. All rights
reserved
Un químico tiene una muestra de 1,000 gramos de un material radiactivo. Se registra la cantidad de material radiactivo restante en la muestra todos los días durante una semana y obtiene los siguientes datos.
Día Peso (en gramos)
0 1000.0
1 897.1
2 802.5
3 719.8
4 651.1
5 583.4
6 521.7
7 468.3
4-26© 2010 Pearson Prentice Hall. All rights
reserved
EJEMPLO Investigar residuos
El coeficiente de determinación
• El coeficiente de determinación, 𝑅2, mide la proporción de variación total en la variable de respuesta que se explica por la línea de regresión de mínimos cuadrados.
• 0 ≤ 𝑅2 ≤1.
• Si 𝑅2 = 0, la línea no tiene valor explicativo.
• Si 𝑅2 = 1, la línea explica el 100% de la variación en la variable de respuesta.
© 2010 Pearson Prentice Hall. All rights reserved
27
EJEMPLO Determinar el Coeficiente de Determinación
Encuentre e interprete el coeficiente de
determinación para los datos anteriores de
perforación de rocas.
4-28© 2010 Pearson Prentice Hall. All rights
reserved