COEFICIENTE DE CORRELACIÓN DE PEARSON Y SPEARMAN - DR. ENRIQUE SIERRA
-
Upload
luisarriolaguillen -
Category
Documents
-
view
2.804 -
download
2
Transcript of COEFICIENTE DE CORRELACIÓN DE PEARSON Y SPEARMAN - DR. ENRIQUE SIERRA
Coeficiente de correlación
Coeficiente de correlación de Pearson: Paramétrico Permite medir la correlación o asociación entre dos variables
cuando se trabaja con variables numéricas con distribución normal. Es calculado en función de las varianzas y la covarianza entre ambas
variables
Coeficiente de correlación de Spearman:
No Paramétrico. Es un coeficiente que permite medir la correlación o asociación
entre dos variables cuando las mediciones se realizan en una escala ordinal, o cuando no existe distribución normal.
Se calcula en base a una serie de rangos asignados.
INTERPRETACIÓN
Tanto el coeficiente de correlación de Pearson como el de Spearman, siguen las mismas normas de interpretación:
Solamente toma en cuenta valores entre 1 y -1.
El 0 indica que no existe correlación.
El valor numérico indica la magnitud de la correlación.
El coeficiente de correlación cuantifica la correlación entre dos variables, cuando esta realmente existe.
El hecho de que exista correlación entre las variables no implica que exista causalidad o dependencia entre ellas.
El signo indica la dirección de la correlación.
Los valores cercanos a 1 nos indican una correlación muy buena y los cercanos a cero una correlación mínima o nula.
INTERPRETACIÓN
Tabla 16. Interpretación de los valores de los coeficientes de correlación según el rango de valores
Coeficiente Interpretación
0 Relación nula
0 – 0,2 Relación muy baja
0,2 – 0,4 Relación baja
0,4 – 0,6 Relación moderada
0,6 – 0,8 Relación alta
0,8 - 1 Relación muy alta
1 Relación perfecta
Cuando el signo es positivo refleja una correlación directa.
Mientras mas altos sean los valores de la variable independiente mas altos serán los de la variable dependiente.
Cuando el signo es negativo refleja una correlación inversa.
Mientras más altos sean los valores de la variable independiente mas bajos serán los de la variable dependiente.
Nivel de significancia
Para interpretar el coeficiente de correlación de Pearson y Spearman el valor de p debe ser menor a 0.05
Por ejemplo, si el coeficiente de correlación resultante fuera 0.56,
existiría una correlación moderada y se representaría de la siguiente manera:
Pearson r = 0.56 (p< 0.05).
Spearman rho= 0.56 (p< 0.05)
COEFICIENTE DE CORRELACIÓN DE PEARSON
El coeficiente de correlación de Pearson es un índice que mide el grado de variación entre distintas variables relacionadas linealmente
Esta fórmula representa al coeficiente de correlación de Pearson:
Donde:
σxy = Covarianza de X,Y
σx = Desviación típica de la variable X
σy =Desviación típica de la variable Y
Pasos para obtener el coeficiente de correlación de Pearson con el software SPSS
Analizar – Correlaciones - Bivariadas
Se seleccionan las variables que nos interesa correlacionar y se pasan al cuadro del lado derecho. Selecciona la opción de coeficiente de correlación de Pearson.
Podemos entrar a opciones y seleccionar medias y desviaciones típicas y después continuar.
Obtenemos de esta manera el estadístico descriptico de las variables de nuestro interés.
En el siguiente cuadro podemos ver las correlaciones entre las variables que introdujimos al programa.
INTERPRETACIÓN: °ANL–ANB: 0.425 (p 0.003). Correlación directa moderada °ANL-LSVV: -0.652 (p < 0.001). Correlación inversa alta °ANB-PgBVV:-0.848 (p < 0.001). Correlación inversa muy alta °EDAD-ANB: 0.230 (P 0.134). *En este caso no es posible interpretar la correlación ya que la significancia es mayor a 0.05.
Seleccioné los cuadros seleccionados a color para ejemplificar la interpretación del coeficiente de correlación de Pearson
Gráficos de disperción
Para obtener los gráficos de dispersión de puntos hay que seguir los siguientes pasos:
Gráficos – Cuadros de diálogo antiguos – Dispersión/puntos
Dispersión simple - Definir
Seleccionar las variables de las que nos interesa obtener el gráfico y pasarlas a Eje Y y Eje X – Aceptar.
Gráfico ANL–ANB: r = 0.425 (p 0.003).
Correlación directa moderada
Gráfico ANL-LSVV:
r = -0.652 (p < 0.001). Correlación inversa alta
GráficoANB-PgBVV: r = -0.848 (p < 0.001).
Correlación inversa muy alta
Gráfico EDAD-ANB: r = 0.230 (P 0.134).
*En este caso no es posible interpretar la correlación ya que la
significancia es mayor a 0.05.
Esta fórmula representa al coeficiente de correlación por rangos de Spearman:
Donde:
N = Número de casos
ΣD2 = Sumatoria de la diferencia de los rangos elevada
al cuadrado.
COEFICIENTE DE CORRELACIÓN DE SPEARMAN
Se ordenan todos los casos para cada una de las variables de interés y se les asigna un rango consecutivo.
Si la asociación entre ambas variables fuera perfecta se esperaría que el rango de ambas variables fuera exactamente igual.
El coeficiente de correlación se calcula en base a las diferencias registradas en los rangos entre ambas variables.
Para evitar que las diferencias positivas anulen a las negativas, el estadístico se calcula en función de las diferencias elevadas al cuadrado.
Metodología
Pasos para obtener el coeficiente de correlación de Spearman con el software SPSS
Analizar – Correlaciones - Bivariadas
Se seleccionan las variables que nos interesa correlacionar y se pasan al cuadro del lado derecho - Se selecciona la opción de coeficiente de correlación de Spearman – Aceptar.
En este caso el coeficiente de correlación de Spearman es: rho = 0.579 (p 0.003). Existe una correlación moderada.
El programa realiza la asignación de rangos a las variables y la aplicación de la fórmula de manera automática pero para entender como realiza este proceso lo explicaremos por partes:
Por ejemplo:
Si quiero ver si existe correlación entre la edad de los pacientes en años y el grado de movilidad dentaria si quisiéramos hacerlo paso a paso, esto es lo que tendríamos que realizar:
Asignar un rango a las variables.
Transformar – Asignar rangos a casos.
Añadir al cuadro de variables las variables que nos interesa asignar un rango y aceptar.
Así en la segunda columna podemos ver la edad de los pacientes y en la quinta columna “REDAD” la edad pero con un rango asignado y de igual manera en la tercer columna observamos el grado de movilidad dentaria y en la cuarta columna “RMOVILID” vemos el grado de movilidad pero con un rango asignado
Después de asignar los rangos a las variables se obtiene la diferencia de las variables y después se suman las diferencias y se elevan al cuadrado. Esta sumatoria es la que se introduce en la formula.
Muchas Gracias!!