Coeficiente de Correlación de Pearson y Spearman

16
Extensión Barcelona Escuela: Ingeniería en Mantenimiento Mecánico Cátedra: Estadística 1 Coeficiente de Correlación de Pearson y Spearman Profesor: Bachiller: Ramón Aray Enrique Beltran C.I: 25.687.801

Transcript of Coeficiente de Correlación de Pearson y Spearman

Page 1: Coeficiente de Correlación de Pearson y Spearman

Republica Bolivariana de VenezuelaMinisterio de Poder Popular para la Educación

Instituto Universitario Politécnico Santiago MariñoExtensión Barcelona

Escuela: Ingeniería en Mantenimiento MecánicoCátedra: Estadística 1

Coeficiente de Correlación de Pearson y Spearman

Profesor: Bachiller: Ramón Aray Enrique Beltran C.I: 25.687.801 Barcelona, Julio de 2016

Page 2: Coeficiente de Correlación de Pearson y Spearman

Es una medida de la relación lineal entre dos variables aleatorias

cuantitativas. A diferencia de la covarianza, la correlación de Pearson es

independiente de la escala de medida de las variables. De manera menos

formal, podemos definir el coeficiente de correlación de Pearson como un

índice que puede utilizarse para medir el grado de relación de dos variables

siempre y cuando ambas sean cuantitativas. En el caso de que se esté

estudiando dos variables aleatorias x e y sobre una población; el coeficiente

de correlación de Pearson se simboliza con la letra , siendo la expresión

que nos permite calcularlo:

Coeficiente de Correlación de Pearson:

Page 3: Coeficiente de Correlación de Pearson y Spearman

Coeficiente de Correlación de Pearson:

Donde; es la covarianza de (X,Y)

es la desviación típica de la variable X

es la desviación típica de la variable Y

De manera análoga podemos calcular este coeficiente sobre un estadístico muestral, denotado como a

Page 4: Coeficiente de Correlación de Pearson y Spearman

Ventajas del Coeficiente de Correlación de Pearson:

Ventajas:

El valor del coeficiente de correlación es independiente de cualquier unidad usada para medir variables.

Mientras mas grande sea la muestra mas exacta será la estimación.

Page 5: Coeficiente de Correlación de Pearson y Spearman

Desventajas del Coeficiente de Correlación de Pearson:

Desventajas:

Requiere supuestos acerca de la naturaleza o formas de las poblaciones afectadas.

Requiere que las dos variables hayan ido medidas hasta un nivel cuantitativo continuo y que la distribución de ambas sea semejante a la de la curva normal.

Page 6: Coeficiente de Correlación de Pearson y Spearman

Aplicaciones o Usos del Coeficiente de Correlación de Pearson:

Permite predecir el valor de una variable dado un valor determinado de

la otra variable.

Se trata de valorar la asociación entre dos variables cuantitativas

estudiando el método conocido como correlación.

Dicho cálculo es el primer paso para determinar la relación entre las

variables.

Consiste en la posibilidad de calcular su distribución muestral y así

poder determinar su error típico de estimación.

Page 7: Coeficiente de Correlación de Pearson y Spearman

Aplicaciones o Usos del Coeficiente de Correlación de Pearson:

Reporta un valor de correlación cercano a 0 como un indicador de

que no hay relación lineal entre 2 variables.

Reporta un valor de correlación cercano a 1 como un indicador de

que existe una relación lineal positiva entre las 2 variables. Un valor

mayor a cero que se acerque a 1 da como resultado una mayor

correlación positiva entre la información. Usos del Coeficiente de

Correlación de Pearson.

Page 8: Coeficiente de Correlación de Pearson y Spearman

Enfoque del Coeficiente de Correlación de Pearson:

En la perspectiva de Pearson, para establecer el nivel de significación

estadística habría que atender al impacto de cada tipo de error en el

objetivo del investigador, y a partir de ahí se decidiría cuál de ellos es

preferible minimizar. Pearson llamaron alfa al error tipo I y beta al error tipo

II; a partir de este último tipo de error, introdujeron el concepto de “poder de

una prueba estadística”, el cual se refiere a su capacidad para evitar el

error tipo II, y está definido por 1-beta, y en estrecha relación con éste se

ha desarrollado el concepto de “tamaño del efecto” que algunos han

propuesto como sustituto de los valores p en los informes de investigación

científica. Las pruebas paramétricas más conocidas y usadas son la

prueba T de Student, la prueba F, llamada así en honor a Fisher, y el

coeficiente de correlación de Pearson, simbolizado por “r”.

Page 9: Coeficiente de Correlación de Pearson y Spearman

El Coeficiente de Correlación de Spearman:

Es una medida de la correlación (la asociación o

interdependencia) entre dos variables aleatorias continuas.

Para calcular ρ, los datos son ordenados y reemplazados por

su respectivo orden. El estadístico ρ viene dado por la

expresión: Coeficiente de Correlación de Spearman

Page 10: Coeficiente de Correlación de Pearson y Spearman

El Coeficiente de Correlación de Spearman:

Donde D es la diferencia entre los correspondientes

estadísticos de orden de x - y. N es el número de parejas. Se

tiene que considerar la existencia de datos idénticos a la hora

de ordenarlos, aunque si éstos son pocos, se puede ignorar

tal circunstancia. Para muestras mayores de 20

observaciones, podemos utilizar la siguiente aproximación a

la distribución t de Student 

Page 11: Coeficiente de Correlación de Pearson y Spearman

El Coeficiente de Correlación de Spearman:

La interpretación de coeficiente de Spearman es

igual que la del coeficiente de correlación de Pearson.

Oscila entre -1 y +1, indicándonos asociaciones

negativas o positivas respectivamente, 0 cero,

significa no correlación pero no independencia. La

correlación estimada entre X e Y se halla calculando el

coeficiente de correlación de Pearson para el conjunto

de rangos apareados. La correlación de Spearman

puede ser calculada con la fórmula de Pearson, si

antes hemos transformado las puntuaciones en

rangos.

Page 12: Coeficiente de Correlación de Pearson y Spearman

El Coeficiente de Correlación de Spearman:

A partir de un conjunto de n puntuaciones, la formula que permite el calculo de la correlación entre dos variables X e Y, medidas al menos en escala ordinal, es la siguiente:

P=0 No hay correlación

p≠ 0 Hay correlación

Donde d es la distancia existente entre los puestos que ocupan las puntuaciones correspondientes a un sujeto i cuando estas puntuaciones han sido ordenadas para X y para Y.

Page 13: Coeficiente de Correlación de Pearson y Spearman

Ventajas del Coeficiente de Correlación de Spearman:

 No esta afectada por los cambios en las unidades de

medida.

Al ser una técnica no parámetra, es libre de distribución

probabilística. 

Page 14: Coeficiente de Correlación de Pearson y Spearman

Desventajas del Coeficiente de Correlación de Spearman:

 Es recomendable usarlo cuando los datos presentan valores

extremos, ya que dichos valores afectan mucho el coeficiente

de correlación de Pearson, o ante distribuciones no normales.

r no debe ser utilizado para decir algo sobre la relación entre

causa y efecto.

Page 15: Coeficiente de Correlación de Pearson y Spearman

Aplicación del Coeficiente de Correlación de Spearman:

 Para aplicar el coeficiente de correlación de Spearman se

requiere que las variables estén medidas al menos en escala

ordinal, es decir; de forma que las puntuaciones que la

representan puedan ser colocadas en dos series ordenadas, a

veces, este coeficiente es denominado por la letra griega ρs

(rho), aunque cuando nos situamos en el contexto de la

Estadística Descriptiva se emplea la notación rs

Page 16: Coeficiente de Correlación de Pearson y Spearman

Bibliografía

Correlación en Wikipedia (español):

http://es.wikipedia.org/wiki/Correlaci%C3%B3n Relación entre

variables cuantitativas.

http://www.fisterra.com/mbe/investiga/var_cuantitativas/

var_cuantitativas2.pdf Correlation en Wikipedia (inglés).

http://personal.us.es/vararey/adatos2/correlacion.pdf.

https://es.wikipedia.org/wiki/Coeficiente_de_correlaci

%C3%B3n_de_Pearson.