Presentación coeficientes Pearson y Spearman

13
República Bolivariana de Venezuela Ministerio del Poder Popular para la Educación Superior I.U.P.S.M ‘’Santiago Mariño’’ Barcelona edo. Anzoategui Escuela: Ingeniería Civil Coeficientes de correlación de Pearson y Spearman Profesor: Pedro Beltran Bachiller: Bello Carlos C.I: 26.886.828 Sección: ‘’CV’’ Barcelona, 25 de julio 2016

Transcript of Presentación coeficientes Pearson y Spearman

Page 1: Presentación coeficientes Pearson y Spearman

República Bolivariana de VenezuelaMinisterio del Poder Popular para la Educación Superior

I.U.P.S.M ‘’Santiago Mariño’’Barcelona edo. Anzoategui

Escuela: Ingeniería Civil

Coeficientes de correlación de Pearson y Spearman

Profesor:Pedro Beltran

Bachiller:Bello Carlos C.I: 26.886.828Sección: ‘’CV’’

Barcelona, 25 de julio 2016

Page 2: Presentación coeficientes Pearson y Spearman

• Coeficiente de Correlación de Pearson:• En estadística, el coeficiente de correlación de Pearson es una medida de la relación lineal

entre dos variables aleatorias cuantitativas. A diferencia de la covarianza, la correlación de Pearson es independiente de la escala de medida de las variables.

• De manera menos formal, podemos definir el coeficiente de correlación de Pearson como un índice que puede utilizarse para medir el grado de relación de dos variables siempre y cuando ambas sean cuantitativas.

• En el caso de que se esté estudiando dos variables aleatorias X y Y sobre una población; el coeficiente de correlación de Pearson se simboliza con la letra ρx,y ,siendo la expresión que nos permite calcularlo:

Page 3: Presentación coeficientes Pearson y Spearman

• Interpretación del Coeficiente de Pearson:• El valor del índice de correlación varía en el intervalo [-1,1]: Si r = 1, existe una correlación positiva perfecta. El índice indica una dependencia total entre

las dos variables denominada relación directa: cuando una de ellas aumenta, la otra también lo hace en proporción constante.

Si 0 < r < 1, existe una correlación positiva. Si r = 0, no existe relación lineal. Pero esto no necesariamente implica que las variables

son independientes: pueden existir todavía relaciones no lineales entre las dos variables. Si -1 < r < 0, existe una correlación negativa Si r = -1, existe una correlación negativa perfecta. El índice indica una dependencia total entre

las dos variables llamada relación inversa: cuando una de ellas aumenta, la otra disminuye en proporción constante.

Page 4: Presentación coeficientes Pearson y Spearman

Uso del Coeficiente de Correlación de Pearson

• Dado dos variables, la correlación permite hacer estimaciones del valor de una de ellas conociendo el valor de la otra variable.

• Los coeficientes de correlación son medidas que indican la situación relativa de los mismos sucesos respecto a las dos variables, es decir, son la expresión numérica que nos indica el grado de relación existente entre las 2 variables y en qué medida se relacionan. Son números que varían entre los límites +1 y -1.

• Su magnitud indica el grado de asociación entre las variables; el valor r = 0 indica que no existe relación entre las variables; los valores (1 son indicadores de una correlación perfecta positiva (al crecer o decrecer X, crece o decrece Y) o negativa (Al crecer o decrecer X, decrece o crece Y).

• Uso:• Identifica el dependiente variable que se

probará entre dos observaciones derivadas independientemente. Uno de los requisitos es que las dos variables que se comparan deben observarse o medirse de manera independiente para eliminar cualquier resultado sesgado.

Para cantidades grandes de información, el calculo puede ser tedioso.

Reporta un valor de correlación cercano a 0 como un indicador de que no hay relación linear entre las dos variables. Reporta un valor de correlación cercano al 1 como indicador de que existe una relación linear positiva entre las dos variables. Un valor mayor a cero que se acerque a 1 da como resultado una mayor correlación positiva entre la información.

Page 5: Presentación coeficientes Pearson y Spearman

• Ventajas y Desventajas del Coeficiente de Correlación de Pearson:

• Ventajas El valor del coeficiente de correlación es independiente de cualquier unidad usada para medir variables. Mientras mas grande sea la muestra mas exacta será la estimación.

• Desventajas Requiere supuestos acerca de la naturaleza o formas de las poblaciones afectadas Requiere que las dos variables hayan ido medidas hasta un nivel cuantitativo continuo y que la distribución de ambas sea semejante a la de la curva normal.

Page 6: Presentación coeficientes Pearson y Spearman

• Usos de enfoques de Pearson para problemas estadísticos: • Métodos Estadísticos para Investigadores”. Desde entonces, el contraste de Hipótesis es

considerado uno de los métodos de inferencia estadística de utilización obligada en casi todas las disciplinas. Si bien hoy en día los estudiantes de Estadística aprenden a testear hipótesis aplicando una secuencia de pasos más o menos estandarizada, es importante recordar que no estamos ante una teoría unificada, sino ante la amalgama de los estudios sistemáticos realizados separadamente por Fisher por un lado y Neyman y Pearson por el otro.

• Fisher desarrolló su teoría que denominó Pruebas de Significación y Neyman y Pearson las llamadas Pruebas de Hipótesis. Desde 1930, fecha en que aparecieron los trabajos de NP., la teoría de los tests de hipótesis fue dominada por el paradigma de la decisión. Esto ha llevado al estado actual de cosas en el cual predomina la teoría de Neyman-Pearson como modelo ó esquema de razonamiento para la toma decisiones, pero la práctica estadística en la investigación, aplicando los mismos procedimientos, interpreta los datos como evidencia para validar teorías.

Page 7: Presentación coeficientes Pearson y Spearman

• Coeficiente de Correlación de Spearman • En estadística, el coeficiente de correlación de Spearman, ρ(rho) es una medida de

la correlación (la asociación o interdependencia) entre dos variables aleatorias continuas. Para calcular ρ, los datos son ordenados y reemplazados por su respectivo orden.

• El estadístico ρ viene dado por la expresión:

• Donde D es la diferencia entre los correspondientes estadísticos de orden de x - y. N es el número de parejas. Se tiene que considerar la existencia de datos idénticos a la hora de ordenarlos, aunque si éstos son pocos, se puede ignorar tal circunstancia

• Para muestras mayores de 20 observaciones, podemos utilizar la siguiente aproximación a la distribución t de Student.

• La interpretación de coeficiente de Spearman es igual que la del coeficiente de correlación de Pearson. Oscila entre -1 y +1, indicándonos asociaciones negativas o positivas respectivamente, 0 cero, significa no correlación pero no independencia. La tau de Kendall es un coeficiente de correlación por rangos, inversiones entre dos ordenaciones de una distribución normal bivariante.

Page 8: Presentación coeficientes Pearson y Spearman

• Interpretacion del Coeficiente de Correlación de Spearman:• La interpretación de coeficiente de Spearman es igual que la del coeficiente de correlación de

Pearson. Oscila entre -1 y +1, indicándonos asociaciones negativas o positivas respectivamente, 0 cero, significa no correlación pero no independencia.

• La correlación estimada entre X e Y se halla calculando el coeficiente de correlación de Pearson para el conjunto de rangos apareados. La correlación de Spearman puede ser calculada con la fórmula de Pearson, si antes hemos transformado las puntuaciones en rangos

Page 9: Presentación coeficientes Pearson y Spearman

• Uso del Coeficiente de Correlación de Spearman: • Para aplicar el coeficiente de correlación de Spearman se requiere que las variables estén

medidas al menos en escala ordinal, es decir, de forma que las puntuaciones que las representan puedan ser colocadas en dos series ordenadas.

A veces, este coeficiente es denominado por la letra griega ρs (rho), aunque cuando nos situamos en el contexto de la Estadística Descriptiva se emplea la notación rs

La fórmula de cálculo para rs puede derivarse de la utilizada en el caso de rxy; bastaría aplicar el coeficiente de correlación de Pearson a dos series de puntuaciones ordinales, compuestas cada una de ellas por la n primeros números naturales.

A partir de un conjunto de n puntuaciones, la fórmula que permite el cálculo de la correlación entre dos variables X e Y, medidas al menos en escala ordinal, es la siguiente:

Donde d es la distancia existente entre los puestos que ocupan las puntuaciones correspondientes a un sujeto i cuando estas puntuaciones han sido ordenadas para X y para Y.

El coeficiente de correlación de Spearman se encuentra siempre comprendido entre los valores -1 y 1. Es decir, -1 < rs < 1.

Cuando todos los sujetos se sitúan en el mismo puesto para la variable X y para la variable Y, el valor de rs es 1. Si ocupan valores opuestos, es decir, al primer sujeto en X le corresponde el último lugar en Y, al segundo en X le corresponde el penúltimo en Y, etc., entonces el valor de rs es -1.

Page 10: Presentación coeficientes Pearson y Spearman

• Propiedades del Coeficiente de Correlación de Spearman: El Coeficiente de Correlación de Spearman se encuentra siempre comprendido entre los

valores -1 y 1. Es decir, -1 < rs < 1. Cuando todos los sujetos se sitúan en el mismo puesto para la variable X y para la variable Y,

el valor de rs es 1. Si ocupan valores opuestos, es decir; al primer sujeto en X le corresponde el ultimo lugar en Y, al segundo en X le corresponde el penúltimo en Y, etc. Entonces el valor de rs es -1

Page 11: Presentación coeficientes Pearson y Spearman

• Ventajas y desventajas del Coeficiente de Spearman:

• Ventajas:• No esta afectada por los cambios en las unidades de medidas• Al ser una técnica no parámetra, es libre de distribución probabilística

• Desventajas:• Es recomendable usarlo cuando los datos presentan valores extremos, ya que dichos valores afectan mucho el coeficiente de correlación de Pearson, o ante distribuciones no normales• r no debe ser utilizado para decir algo sobre la relación entre causa y efecto.

Page 12: Presentación coeficientes Pearson y Spearman

• Usos de enfoques del coeficiente de correlación de Spearman para problemas estadísticos:

• Una generalización del coeficiente de Spearman es útil en la situación en la cual hay tres o más condiciones, varios individuos son observados en cada una de ellas, y predecimos que las observaciones tendrán un orden en particular. Por ejemplo, un conjunto de individuos pueden tener tres oportunidades para intentar cierta tarea, y predecimos que su habilidad mejorará de intento en intento.

• El coeficiente de correlación de rangos de Spearman debe utilizarse para series de datos en los que existan valores extremos, pues si calculamos la correlación de Pearson, los resultados se verán afectados. La interpretación del resultado del coeficiente de correlación de Spearman se encuentra entre los valores de -1 y 1. La significación estadística de un coeficiente debe tenerse en cuenta conjuntamente con la relevancia clínica del fenómeno que se estudia.

Page 13: Presentación coeficientes Pearson y Spearman

Bibliografía

• https://es.wikipedia.org/wiki/Coeficiente_de_correlaci%C3%B3n_de_Pearson• https://es.wikipedia.org/wiki/Coeficiente_de_correlaci%C3%B3n_de_Spearman• http://es.slideshare.net/PatriciaCastillo31/coeficiente-de-correlacion-de-pearson-y-spearman• http://es.slideshare.net/8291766/coeficientes-de-correlacin-de-pearson-y-de-sperman-50117

900