Dispersion04

Post on 27-Jul-2015

3.023 views 5 download

Transcript of Dispersion04

MEDIDAS DE DISPERSIÓN O VARIABILIDAD

ESTADÍSTICAProf. Alejandra Camors

Algunas consideraciones

1. Variación, se refiere a la cantidad en que los datos u observaciones varían entre si, esta variación puede medirse.

2. Los datos que están relativamente cercanos entre si, tienen bajas medidas de variabilidad, mientras que los que están mas alejados entre si tienen medidas de variación mas grandes.

MEDIDAS DE DISPERSION

Definición 1

Una medida de dispersión de un conjunto de datos, mide cuan esparcidos se encuentran estos o que tan heterogéneos son.

Clasificación de las Medidas de Dispersión:

MEDIDAS DE DISPERSIÓN ABSOLUTA

No hacen referencia a ningún promedio: Recorridos.

Hacen referencia a algún promedio:Desviación Absoluta Media respecto a un promedio. Desviación Cuadrática Media respecto a un promedio:

Varianza, Desviación Típica.

MEDIDAS DE DISPERSION RELATIVA

No hacen referencia a ningún promedio: Coeficiente de Apertura, Recorrido relativo, Recorrido Semi-intercuartílico

Hacen referencia a algún promedio: Coeficiente de Variación,

1.- Introducción

Recorrido o rango: Re = x(k) - x(1)

(En el ejemplo anterior 60 – 10 = 50 y 33 – 28 = 5 respectivamente, la 1ª más dispersa)

Recorrido Intercuartílico: RI = C3 - C1

Longitud del intervalo que recoge el 50% de las observaciones centrales

Recorrido Décil: RD = D9 - D1

Recorrido Percentil: RP = P99 - P1

150 160 170 180 190

0.0

00

.01

0.0

20

.03

0.0

40

.05

150 160 170 180 190

25% 25% 25% 25%

Mín. P25 P50 P75 Máx.

Rango intercuartílico

Rango

2.2.1- Medidas de Dispersión Absolutas. Recorridos

RANGO

Ante la pregunta sobre número de hijos por familia, una muestra de 12 hogares, marcó las siguientes respuestas:2 1 2 4 1 32 3 2 0 5 1

Calcule el rango de la variable

SoluciónEl Rango es R = 5 – 0 = 5

R = X máx – X min

La varianza

N

xN

ixi

1

2

2

)(

2

2 1

( )

1

n

ii

x xs

n

Muestral

Poblacional

VARIANZA VARIANZA

La varianza es otra medida de dispersión que se basa en la diferencia entre el valor de cada dato (Xi) y la media ( ). La diferencia entre cada dato (Xi) y su media ( ) para una muestra se llama desviación con respecto a la media o promedio y se expresa con la siguiente fórmula:

Para calcular la varianza, las desviaciones respecto a la media se elevan al cuadrado y se dividen entre (N – 1).

x

(Xi – X)(Xi – X)

x

CONTINUACIÓN CONTINUACIÓN

Fórmula para calcular la varianza:

S =

Veamos como calculamos la varianza en el siguiente ejemplo:

Se tienen los siguientes datos; 15, 12, 18, 20 y 25.Primero, calculamos la media:

= = 18

2

1

)(

N

xxi2

N

xx

5

2520181512

CONTINUACIÓN CONTINUACIÓN

Segundo, buscamos la desviación estándar respecto a la media ( ), que es la diferencia entre cada valor de (Xi) y el promedio ( ) luego, calculamos la sumatoria ∑( )2 , como se presenta a continuación:

Xi X ( ) ∑( )2 12 18 -6 3615 18 -3 918 18 0 020 18 2 4 25 18 7 49

total 98

2x

xx i

xx i

xx i

xx i

CONTINUACIÓN CONTINUACIÓN

Ahora, sustituimos las variables de la fórmula por los valores obtenidos como se presenta a continuación:

S = = = = 24.5 2

1

)(

N

xxi2

15

98

4

98

Desviación estándar Desviación estándar

N

xN

ixi

1

2)(

2

1

( )

1

n

ii

x xs

n

Muestral

Poblacional

DESVIACIÓN ESTÁNDAR

DESVIACIÓN ESTÁNDAR

Es una medida de la variabilidad de un conjunto de datos. Se calcula sacando la raíz cuadrada de la varianza. Nos indica cuánto tienden a alejarse los datos del promedio. Si los datos son de una muestra, la desviación estándar se representa como:

S = 2s

CONTINUACIÓN CONTINUACIÓN

En el ejemplo anterior la desviación estándar es:

S =

S =

S = 4.95

2s

5.24

Coeficiente de variación

Compara la variabilidad de series de datos que tengan unidades diferentes.

No tiene unidades de medida.Se calcula para variables medidas en

escala de razón

100%S

CVx

Muestral

Poblacional

100%CV

Ejemplo 4

Calcule el coeficiente de variabilidad para los datos del ejemplo 1

Solución:

%7759,641001667,2

4035,1

xcv

Medidas de dispersión en tablas de frecuencias (caso discreto)

Medidas de dispersión en tablas de frecuencias (caso discreto)

11

)(1

2

12

1

2

2

nn

fx

xf

n

xxfs

k

i

k

iii

ii

k

iii

21

2

1

2

2)(

N

xf

N

xfk

iii

k

iii

Muestral

Poblacional

18

Ejemplo_1Calificaciones de 100 alumnos de una clase en MatemáticasVariable discreta. Tabla ampliada.

xi fi xi fi |xi-x| |xi-x|.fi fi xi 2

3 40 120 1,80 72 360

5 30 150 0,20 6 750

7 30 210 3,20 96 1470

100 480 174 2580

VARIANZA

∑ fi .xi 2

V = ------------- - x 2 = 25,80 – 4,82

∑ fiV = 2,76

DESVIACIÓN TÍPICAS = √V =√2,76 = 1,66

DESVIACIÓN MEDIA

Dm = ∑ |xi-x| / ∑ fi = 174/100 =1,74

COEFICIENTE DE VARIACIÓN

CV = s / x = 1,66 / 4,8 = 0,346

19

clases xi = m.c. fi xi fi |xi-x| |xi-x|.fi fi xi 2

[0,5 , 3,5] 2 40 80 2,70 108 160

(3,5 , 6,5] 5 30 150 0,30 9 750

(6,5 , 9,5] 8 30 240 3,30 99 1920

100 470 216 2830

Ejemplo_2Calificaciones de 100 alumnos de una clase en MatemáticasVariable continua. Tabla ampliada.

VARIANZA

∑ fi .xi 2

V = ------------- - x 2 = 28,30 – 4,72

∑ fi V = 6,21

DESVIACIÓN TÍPICAS = √V =√6,21 = 2,49

DESVIACIÓN MEDIADm = ∑ |xi-x| / ∑ fi = 216/100 == 2,16

COEFICIENTE DE VARIACIÓN

CV = s / x = 2,49 / 4,7 = 0,53

Calcular y comparar (hombres/mujeres):

Coeficiente de Apertura, Recorrido Relativo y Recorrido Semi-Intercuartílico

Coeficiente de Variación

¿Qué salario es más homogéneo, el de hombres o el de mujeres?

Solución

0,37373,655

5,244

215,0)51,502777(

49,274

88,0875.1

650.1

33,8225

875.1

V

R

R

pA

s

r

Hombres

0,43251,556

55,240V

0,293)13,38138,696(

25,315

88,0875.1

650.1

33,8225

875.1

s

r

R

R

pA

Mujeres

MÁS HOMOGÉNEO