Diagrama de Dispersión

22
DIAGRAMA DE DISPERSIÓN Los Diagramas de Dispersión o Gráficos de Correlación permiten estudiar la relación entre 2 variables. Dadas 2 variables X e Y, se dice que existe una correlación entre ambas si cada vez que aumenta el valor de X aumenta proporcionalmente el valor de Y (Correlación positiva) o si cada vez que aumenta el valor de X disminuye en igual proporción el valor de Y (Correlación negativa). En un gráfico de correlación representamos cada par X, Y como un punto donde se cortan las coordenadas de X e Y:

description

Dispersión

Transcript of Diagrama de Dispersión

Page 1: Diagrama de Dispersión

DIAGRAMA DE DISPERSIÓN

Los Diagramas de Dispersión o Gráficos de Correlación permiten estudiar la

relación entre 2 variables. Dadas 2 variables X e Y, se dice que existe una

correlación entre ambas si cada vez que aumenta el valor de X aumenta

proporcionalmente el valor de Y (Correlación positiva) o si cada vez que

aumenta el valor de X disminuye en igual proporción el valor de Y (Correlación

negativa).

En un gráfico de correlación representamos cada par X, Y como un punto donde

se cortan las coordenadas de X e Y:

Page 2: Diagrama de Dispersión
Page 3: Diagrama de Dispersión

¿CÓMO SE UTILIZA?

La secuencia a seguir para realizar un diagrama de dispersión es:

1. Recoger y ordenar los datos que se cree que tienen una posible

correlación.

Los datos son recogidos en una tabla, indicando el número de muestras y

los valores de las características que se quiere investigar.

Es conveniente que el número de mediciones sea de al menos 30.

Page 4: Diagrama de Dispersión

EJEMPLO:Una empresa se plantea cambiar la composición de uno de sus productosutilizando un nuevo material. Antes de tomar una decisión, la empresa decide realizar un ensayo para estudiar la posible relación entre la utilización de dicho material y el número de defectos. Para ello analiza lotes con diferentes porcentajes del nuevo material y toma los siguientes datos:

Page 5: Diagrama de Dispersión
Page 6: Diagrama de Dispersión

¿CÓMO SE UTILIZA?2. Representar gráficamente los datos:1) Dibujar, en un diagrama cartesiano, los ejes vertical y horizontal de la misma

longitud. Observar los valores máximo y mínimo de los grupos de datos, para escoger la escala de representación adecuada a los mismos y evitar así errores de interpretación

2) Representar en el diagrama mediante puntos cada par de datos, reflejando los valores de la clase de datos que se considera dependiente (causa) sobre el eje horizontal X y los valores de la clase de datos que se considera independiente (efecto) sobre el eje vertical Y.

3) Si dos o más pares de datos caen en el mismo punto, dibujar círculos concéntricos alrededor del punto individualizado.

Page 7: Diagrama de Dispersión

EJEMPLO:La figura siguiente muestra la representación gráfica de los datos:

Page 8: Diagrama de Dispersión

3. Una vez construido el diagrama se analiza la forma que tiene la nube de puntos

obtenida, para así determinar las relaciones entre los dos tipos de datos. Este análisis

puede efectuarse por técnicas estadísticas que permitan determinar si existe o no

relación, y el grado de existencia en su caso. Las herramientas utilizadas son:

La recta de regresión, y

El coeficiente de correlación lineal.

Page 9: Diagrama de Dispersión

3.A. RECTA DE REGRESIÓNLa recta de regresión es la línea que mejor representa a un conjunto de puntos. La función que aproxima la recta es: y = a + bXdonde:y = variable dependiente (causa)a : ordenada en el origen.b: pendiente de la recta de regresiónx: variable independiente (efecto)

Page 10: Diagrama de Dispersión

La pendiente se halla mediante la

expresión:

x: valores de la variable

independiente

y: valores de la variable

dependiente

: media de los valores de x

: media de los valores de y

n: número de observaciones o pares de datos

La ordenada en el origen se calcula como:

Page 11: Diagrama de Dispersión

Calculamos la recta de regresión a partir de los siguientes datos:

Page 12: Diagrama de Dispersión

Representamos en el gráfico la recta de regresión:

Observamos que existe una clara correlación entre los datos.

Page 13: Diagrama de Dispersión

3B. COEFICIENTE DECORRELACIÓN

El coeficiente de correlación lineal r, viene determinado por la expresión:

Toma valores comprendidos entre –1 y1. Cuanto más próximo a 0 sea r menor será la

relación entre los datos, y cuanto más próximo a 1 (en valor absoluto) mayor será dicha

relación. Su signo indica si se da una relación positiva o negativa entre las variables x e y.

Page 14: Diagrama de Dispersión

EJEMPLO

Calculamos el coeficiente de correlación:

r = 0,918

El valor obtenido es muy próximo a 1, lo que nos confirma que la correlación

es fuertemente positiva.

Page 15: Diagrama de Dispersión

Ejercicios

Calcula la media, la varianza, la desviación típica y el coeficiente de

variación de Pearson tras encuestar a 25 familias sobre el número de

hijos que tenían, se obtuvieron los siguientes datos:

SOLUCIÓN:Las cuatro distribuciones de frecuencia serán:

Page 16: Diagrama de Dispersión
Page 17: Diagrama de Dispersión

La Media Aritmética de las veinticinco familias encuestadas será:

es decir, las familias encuestadas tienen un número medio de hijos de 1,68.El Recorrido será R = 4 - 0 = 4. tambien

La Varianza es:s2 = 4,24 - (1'68)2 = 1,4176.Y la Desviación Típica s = 1,19 para datos agrupados:

Page 18: Diagrama de Dispersión

Para este ejemplo el Coeficiente de Variación de Pearson, Vp, toma el valor:

En cuanto a la simetría, el Coeficiente de Variación de Pearson, Ap,es igual a:

Con lo que la distribución es ligeramente asimétrica a la izquierda.

Page 19: Diagrama de Dispersión
Page 20: Diagrama de Dispersión

GRÁFICA LENGUAJE VS. MATEMATICA

Page 21: Diagrama de Dispersión

EJERCICIO PROPUESTO

La Dirección de una mina está preocupada por el alto porcentaje de

indisponibilidad de sus máquinas cargadoras. Encarga al Jefe de Mantenimiento

que analice si está influyendo la antigüedad de dichas máquinas en su

porcentaje de indisponibilidad. Para ello, recoge la información de la fecha de

compra y del porcentaje de indisponibilidad de cada máquina y la traslada a la

siguiente tabla. Utilizar un diagrama de correlación para realizar este estudio.

Page 22: Diagrama de Dispersión