Coeficiente.de.correlación.de.Pearson.&.Análisis.de.regresión.lineal
-
Upload
rosa-carranza -
Category
Documents
-
view
8 -
download
1
description
Transcript of Coeficiente.de.correlación.de.Pearson.&.Análisis.de.regresión.lineal
Es un índice numérico que permite medir el grado de relación de dos variables
siempre y cuando ambas sean cuantitativas.
Coeficiente de correlación Relación
r = 1 Positiva, directa, perfecta, fuerte
0.8 < r < 1 Positiva muy alta
0.6< r < 0.8 Positiva alta
0.4< r < 0.6 Positiva moderada
0.2< r < 0.4 Positiva baja
0< r < 0.2 Positiva muy baja
r = 0 Nula
-0.2 < r < 0 Negativa muy baja
-0.4 < r < -0.2 Negativa baja
-0.6 < r < -0.4 Negativa moderada
-0.8 < r < -0.6 Negativa alta
-1 < r < -0.8 Negativa muy alta
r= -1 Negativa, inversa, perfecta, fuerte
El coeficiente de correlación de Pearson se encuentra comprendido entre los valores -1 y 1.
Correlación de la información (r) de las X y las Y
Correlación Positiva
Perfecta
0
5
10
15
20
25
0 5 10 15 20 25
X
Y
Correlación Negativa
Perfecta
0
5
10
15
20
25
0 5 10 15 20 25
X
Y
Correlación
Positiva
0
5
10
15
20
25
0 5 10 15 20 25
X
Y
Correlación
Negativa
0
5
10
15
20
25
0 5 10 15 20 25
X
Y
Sin Correlación
10
15
20
25
5 10 15 20 25
X
Y
0
5
0
R=1
R=>-1
R=-1
R=0
R=>1
El Equipo Directivo de un Centro de Educación Secundaria está interesado en conocer la relación que existe entre el tiempo semanal (horas) que dedican los alumnos al estudio y las calificaciones de los mismos al final del trimestre. Eligiendo 11 alumnos al azar, han encontrado los siguientes resultados. Calcular el coeficiente de correlación de Pearson
Ahora sí podemos aplicar la fórmula. Reemplazando los valores tenemos:
El valor de +0.94 significa una alta correlación positiva, es decir, las
horas semanales dedicados al estudio está asociado linealmente a las
notas del final del trimestre.
Para ello debemos encontrar los siguientes valores: media y la desviación
estándar de X e Y, respectivamente.
La media ( x ):
Desviación estándar (σx):
Ahora vamos a hallar los demás valores según como se presenta en la fórmula:
Reemplazamos los valores de la fórmula tenemos:
Viendo los resultados llegamos a la
conclusión de que estamos ante
una correlación muy alta, lo que
quiere decir a puntuaciones altas en
cuanto a notas se corresponden
altas horas de trabajo y estudio
semanal.
Ahora graficamos el diagrama de dispersión con los valores de la distribución
que hemos trabajado.
Las dos variables (X e Y) están correlacionadas positivamente
o su variación está en razón directa. Por ello la dirección que
adoptan los puntos es ascendente de izquierda a derecha.
13
Establece si existe una relación entre las variables y
responde a la pregunta, ”¿Qué tan evidente es esta
relación?"
Describe con más detalle la relación entre las variables.
Construye modelos de predicción a partir de información
experimental u otra fuente disponible.
Regresión lineal simple
Regresión lineal múltiple
Regresión no lineal cuadrática o cúbica
El siguiente diagrama de dispersión representa la relación entre la variable X (calificaciones en Matemática) y la
variable Y (calificaciones en Lenguaje).
Es un método de análisis numérico enmarcada dentro de la optimización matemática, en la que, dados un conjunto de pares ordenados: variable independiente, variable dependiente, y una familia de funciones, se intenta encontrar la función continua, dentro de dicha familia, que mejor se aproxime a los datos de acuerdo con el criterio de mínimo error cuadrático
Y= Valor de la variable dependiente o la puntuación pronosticada para Y
b= Pendiente
X= Valor de la variable independiente correspondiente al valor de Y
a= Ordenada de origen o la intersección de Y. Valor de Y cuando X =0