M E D I D A S D E T E N D E N C I A C E N T R A L

31
MEDIDAS DE TENDENCIA CENTRAL Medidas de localización Media Aritmética Se obtiene sumando todos los valores de una población o muestra y dividiéndolo entre el número de valores sumados. x = x i n µ = x i N Los valores extremos influyen sobre la media, y en algunos casos puede distorsionarla tanto que llega a ser indeseable como medida de tendencia central.

Transcript of M E D I D A S D E T E N D E N C I A C E N T R A L

Page 1: M E D I D A S  D E  T E N D E N C I A  C E N T R A L

MEDIDAS DE TENDENCIA CENTRAL Medidas de localización

Media Aritmética

Se obtiene sumando todos los valores de una población o muestra y dividiéndolo entre el número de valores sumados.

x = ∑ xi

nµ =

∑ xi

N

Los valores extremos influyen sobre la media, y en algunos casos puede distorsionarla tanto que llega a ser indeseable como medida de tendencia central.

Page 2: M E D I D A S  D E  T E N D E N C I A  C E N T R A L

Media ponderadaMedia que se obtiene asignando distintos pesos a los valores,

x

=Σ ( W . X )

Σ W Necesitamos una media de tres calificaciones de una prueba, 85, 90, 75, donde

la primera prueba tiene el 20%, la segunda el 30% y la tercera 50%

Triola 2004:66

x

=( 20 . 85 ) + (30 . 90) + (50 . 75)

20 + 30 + 50= 81.5

Page 3: M E D I D A S  D E  T E N D E N C I A  C E N T R A L

Medidas de localización La Moda

La moda de un conjunto de valores es aquel que ocurre con mayor frecuenciaSi todos los valores son diferentes, no hay moda.Un conjunto de valores puede tener mas de una moda

Ejemplo:

¿Cual es la moda en los siguientes datos?

12 14 09 04 12 33 23 17 33 31 12 24 09 18

16 09 25 07 15

Page 4: M E D I D A S  D E  T E N D E N C I A  C E N T R A L

Medidas de localización La Mediana

La mediana de un conjunto finito de valores es aquel valor que divide al conjunto de números ordenados en dos partes iguales.Ninguna observación extrema en un conjunto de datos afecta a la mediana, en consecuencia, siempre que una observación extrema esté presente, es adecuado usar la mediana en lugar de la media para describir un conjunto de datos.

50%50% n + 1

2=(Par)

Me

n = número de datos

Page 5: M E D I D A S  D E  T E N D E N C I A  C E N T R A L

Tendencia central (Resumen)Son medidas que buscan posiciones (valores) con respecto a los cuales

los datos muestran tendencia a agruparse.

Media: Es la media aritmética (promedio) de los valores de una variable. Suma de los valores dividido por el tamaño muestral.

Media de 2, 2, 3, 7 es (2+2+3+7)/4 = 3,5Conveniente cuando los datos se concentran simétricamente con respecto a ese valor. Muy sensible a valores extremos.

Mediana: Es un valor que divide a las observaciones en dos grupos con el mismo número de individuos. Si el número de datos es par, se elige la media de los dos datos centrales.

Mediana de 1, 2 ,4 ,5, 6 ,6, 8 = 5Mediana de 1, 2, 4, 5, 6, 6, 8, 9 = (5+6)/2 = 5,5Es conveniente cuando los datos son asimétricos. No es sensible a valores extremos.Mediana de 1, 2 , 4, 5, 6, 6, 800 = 5 La media 1, 2, 4, 5, 6, 6, 800 = 117,7

Page 6: M E D I D A S  D E  T E N D E N C I A  C E N T R A L

Medidas de Dispersión

• La dispersión de un conjunto de observaciones se refiere a la variabilidad que presentan estas.

• Una medida de dispersión conlleva información respecto a la cantidad total de variabilidad presente en el conjunto de datos

Tres distribuciones normales con diferentes dispersiones de los datos

x

Page 7: M E D I D A S  D E  T E N D E N C I A  C E N T R A L

MEDIDAS DE DISPERSIÓN Rango

Diferencia entre el valor mayor y el valor menor de un conjunto de datos obtenidos en una medición.

Rango = X más grande – X más pequeño

El rango mide la dispersión total en un conjunto de datos. Aunque es una medida sencilla de la variación total de los datos, su debilidad característica consiste en que no toma en cuenta como se distribuyen los datos entre los valores mas grande y más pequeños.

No es necesariamente una medida de típica de dispersión porque la presencia de un valor extremo puede cambiar radicalmente su valor

Page 8: M E D I D A S  D E  T E N D E N C I A  C E N T R A L

Miden el grado de dispersión (variabilidad) de los datos, independientemente de su causa.

• Amplitud o Rango:Diferencia entre observaciónes extremas.– 2,1,4,3,8,4. El rango es 8-1=7– Es muy sensible a los valores extremos.

• Rango intercuartílico:– Es la distancia entre primer y tercer cuartil.

• Rango intercuartílico = Q3 – Q1 – Parecida al rango, pero eliminando las observaciones más extremas inferiores y superiores.– No es tan sensible a valores extremos.

150 160 170 180 190

0.0

00

.01

0.0

20

.03

0.0

40

.05

150 160 170 180 190

25% 25% 25% 25%

Mín. P25 P50 P75 Máx.

Rango intercuartílico

Rango

Medidas de dispersión

Page 9: M E D I D A S  D E  T E N D E N C I A  C E N T R A L

MEDIDAS DE DISPERSIÓN La Varianza

La varianza es una medida de la dispersión que emplea todos los valores de los datos. Se basa en la diferencia entre cada valor y la media.

La diferencia entre cada valor del dato Xi y el promedio ( x para una muestra y µ para una población) se llama desviación respecto al promedio.

Para una muestra la desviación se expresa como: (Xi – x); para una población: (Xi - µ)

Varianza Mide el promedio de las desviaciones (al cuadrado) de las observaciones con respecto a la media.

Page 10: M E D I D A S  D E  T E N D E N C I A  C E N T R A L

MEDIDAS DE DISPERSIÓN Varianza

( X1 – X )2 + ( X2 – X )2 + ….........…. ( Xi – X )2

n - 1

∑ ( Xi – X )2

S2 =

La varianza de la muestra, es la suma de los cuadrados de las diferencias de los datos con relación a la media aritmética divida entre el tamaño de la muestra menos 1

∑ ( Xi – )2

Nσ 2=

VARIANZA MUESTRAL

VARIANZA POBLACIONAL

Unidades de la varianza son al cuadrado.

S2 =n - 1

Dado un conjunto de observaciones, se llama varianza de dicho conjunto a la sumatoria de las diferencias entre cada observación y la media aritmética elevadas al cuadrado, y dividido por el número de observaciones

Es sensible a valores extremos (alejados de la media). Sus unidades son al cuadrado.

Page 11: M E D I D A S  D E  T E N D E N C I A  C E N T R A L

MEDIDAS DE DISPERSIÓN Desviación estándar

Es la raíz cuadrada de la varianza Indica como se agrupa o distribuye un conjunto de datos alrededor de la

media.

La desviación estándar también se define como la raíz cuadrada positiva de la varianza.

σ = σ 2

s2s =

Desviación estándar población

Desviación estándar muestra

Page 12: M E D I D A S  D E  T E N D E N C I A  C E N T R A L

MEDIDAS DE DISPERSIÓN Coeficiente de variación (de Pearson)

• El CV, relativo a un conjunto de datos, que se define como el cociente entre la desviación típica y la media aritmética, es evidentemente un número adimensional. Siempre se expresa como porcentaje.

CV =S

X100 %( )

S = Desviación estándar de un conjunto de datos numéricos

X = Media aritmética

Permite establecer comparaciones válidas entre las dispersiones relativas expresadas en unidades de medida diferente

No debe usarse cuando la variable presenta valores negativos o donde el valor 0 sea una cantidad fijada arbitrariamente. Por ejemplo 0ºC ≠ 0ºF

Page 13: M E D I D A S  D E  T E N D E N C I A  C E N T R A L

También se la denomina variabilidad relativa.

Es frecuente mostrarla en porcentajes Si la media es 80 y la desviación típica 20 entonces CV = 20/80 = 0,25 = 25% (variabilidad relativa)

Es una cantidad adimensional. Interesante para comparar la variabilidad de diferentes variables.

Si el peso tiene CV = 30% y la altura tiene CV = 10%, los individuos presentan más dispersión en peso que en altura.

Page 14: M E D I D A S  D E  T E N D E N C I A  C E N T R A L

MEDIDAS DE DISPERSIÓNLocalización Relativa

Puntuaciones Z

• Valor Z: Medida que indica la dirección y el grado en que un valor se aleja de la media, en una escala de unidades de desviaciones estándar del número de desviaciones estándar que un valor se aleja de la media

Z =

X - X

S

X = Puntuación o el valor a transformar

X = Media de la distribución

S = Desviación estándar de la distribución

Z = Puntuación transformada en unidades de desviaciones estándar

Page 15: M E D I D A S  D E  T E N D E N C I A  C E N T R A L

Las puntuaciones Z, permiten estandarizar valores para comparar puntuaciones de dos distribuciones diferentes. (la forma de medición es la misma, aunque se trata de distribuciones distintas).

Ejemplo:

Supongamos que en una distribución de frecuencias (Conjunto de datos) )obtuvimos una media de 60 y una desviación estándar de 10, deseamos comparar una puntuación de 50 con el resto de la distribución, entonces:

Sampieri 2006:436

X = 50 X = 60 S = 1050 - 60

10Z = = - 1.00

El valor de “50” se encuentra localizado a una desviación estándar por debajo de la media de la distribución. (el valor de 30 está a tres desviaciones por debajo de la media.

Page 16: M E D I D A S  D E  T E N D E N C I A  C E N T R A L

Ejemplo:

Queremos comparar los resultados obtenidos en una preprueba con los obtenidos en una posprueba. Se trata de un estímulo que incrementa la productividad. Un sujeto obtuvo en la preprueba una productividad de 130; la media del grupo fue de 122,5 y la desviación estándar de 10. En la postprueba obtuvo 135, la media fue de 140 y la desviación estándar de 9,8. ¿Mejoró la productividad del trabajador?

Sampieri 2006:436

Sin transformar las dos calificaciones a puntuaciones Z, no es posible asegurarlo, porque los valores no pertenecen a la misma distribución.

Preprueba.

130 - 122,510

Z = = 0,75

Postprueba.

135 - 1409,8

Z = = - 0,51

En términos absolutos, 135 es una mejor puntuación que 130, pero no en términos relativos (en relación con sus respectivas distribuciones)

Page 17: M E D I D A S  D E  T E N D E N C I A  C E N T R A L

MEDIDAS DE FORMA

Page 18: M E D I D A S  D E  T E N D E N C I A  C E N T R A L

MEDIDAS DE FORMA

Asimetría: Una distribución es simétrica si la mitad izquierda de su distribución es la imagen especular de su mitad derecha. La distribución de los datos es simétrica o no lo es. Si no lo es, recibe el nombre de distribución asimétrica o sesgada.

media > mediana: Sesgo positivo o a la derecha

media = mediana: simetría o sesgo cero

media < medina: sesgo negativo o a la izquierda

En las distribuciones simétricas media y mediana coinciden. Si sólo hay una moda también coincide

Las discrepancias entre la media y la mediana indican asimetría.

Page 19: M E D I D A S  D E  T E N D E N C I A  C E N T R A L

La asimetría es positiva o negativa en función de a qué lado se encuentra la cola de la distribución.

Sesgo (+) Sesgo (-)

La simetría de una función de distribución se mide por el coeficiente de sesgo de la misma.

El coeficiente de sesgo no debe sobrepasar el valor de ± 2 (para considerarse una distribución Normal)

Page 20: M E D I D A S  D E  T E N D E N C I A  C E N T R A L

CURTOSIS El coeficiente de curtosis mide el mayor o menor

aplanamiento de la curva de distribución

Curtosis < 0Curtosis = 0 Curtosis > 0

El coeficiente de sesgo no debe sobrepasar el valor de ± 2 (para considerarse una distribución Normal)

Page 21: M E D I D A S  D E  T E N D E N C I A  C E N T R A L

DISTRIBUCION NORMAL

V1

100

80

60

40

20

0

µ

Page 22: M E D I D A S  D E  T E N D E N C I A  C E N T R A L

Características de la distribución normal

1.- Es simétrica respecto a su media. En la imagen anterior, la curva hacia cualquiera de los lados de es una imagen de espejo de la del otro ladoµ

2.- La media, la mediana y la moda son iguales

3.- El área total bajo la curva sobre el eje de las X es una unidad de área. Esta característica se deduce del hecho de que la distribución normal es una distribución de probabilidad.

4.- Si se levantaran perpendiculares a una distancia de una desviación estándar desde la media hacia ambos lados, el área delimitada por esas perpendiculares, el eje de las X y la curva será del 68 % del área total, aproximadamente. A dos desviaciones estándar, estará incluido aproximadamente el 95 % del área, y a tres desviaciones estándar, aproximadamente 99,7 del área total estará englobada.

Page 23: M E D I D A S  D E  T E N D E N C I A  C E N T R A L

Dispersión en distribuciones ‘normales’

• Centrado en la media y a una desv. típica de distancia hay aproximadamente el 68% de las observaciones.

150 160 170 180 190

0.00

0.01

0.02

0.03

0.04

0.05

xs

68.5 %

150 160 170 180 190

0.00

0.01

0.02

0.03

0.04

0.05

x2s

95 %

A dos desviaciones típicas tenemos el 95% (aprox.)

Page 24: M E D I D A S  D E  T E N D E N C I A  C E N T R A L

Tres distribuciones normales con diferentes desviaciones estándar pero con la misma media

σ 3

σ 2

x

σ 1

DISTRIBUCIÓN NORMAL ESTÁNDAR

Page 25: M E D I D A S  D E  T E N D E N C I A  C E N T R A L

Como obtener la normalidad de un conjunto de datos?

Page 26: M E D I D A S  D E  T E N D E N C I A  C E N T R A L

MEDIDAS DE POSICIÓNNO CENTRALES

INFORMAN ACERCA DE LA POSICIÓN QUE OCUPA UN DATO DENTRO DE UNA SERIE ORDENADA EN FORMA CRECIENTE.

DECILES Dividen el conjunto de datos ordenados en diez partes

iguales. Nueve deciles dividen las observaciones en diez partes iguales. Se denotan: D1 D2 D3……………… D9 ; D5 = Mediana

PERCENTILES Dividen el conjunto de datos ordenados en 100 partes

iguales. El percentil 90 es un valor tal que el 90% de todos los valores son menores y el 10 son mayores que él. Se denotan: P1 , P2 P3 , P4 ……………. P99 ; P50 = Mediana; P25 Se corresponde con el primer cuartil ; P75 Se corresponde con tercer cuartil

CUARTILES Dividen el conjunto de datos ordenados en cuatro partes iguales. Los cuartiles

son: Q1 ; Q2 ; Q3 . Se necesitan solamente tres cuartiles para dividir los datos en cuatro partes. El cuartil Q2 = Mediana

Page 27: M E D I D A S  D E  T E N D E N C I A  C E N T R A L

Datos

Q1 Q2=Me Q3 Ls

0% 25% 50% 100%75%

CUARTILES

Li

Page 28: M E D I D A S  D E  T E N D E N C I A  C E N T R A L

Datos

DECILES 1 2 3 4 5 6 7 8 9 10

Page 29: M E D I D A S  D E  T E N D E N C I A  C E N T R A L

Variable Descripción Estadísticos y gráficos

Cualitativa en escala nominal

Valores no numéricos con ausencia de orden entre

ellos

Distribución de frecuencias

ModaDiagrama de barras

Cualitativa en escala ordinal

Valores no numéricos con

presencia de orden entre

ellos

MínimoMáximoMedianaCurtiles

PercentilesRango

IntercuartílicoGráfico de caja y

bigotes

Cuantitativa en escala de intervalo o de razón

Cuantitativa discreta Cuantitativa continua

En escala de intervalo En escala de razón

MediaRango

VarianzaDesviación Típica

Coeficiente de Variación

Coeficiente de asimetría

Coeficiente de curtosis

HistogramaGráfico de tallo y

hoja

HERRAMIENTAS BÁSICAS EN LA ESTADÍSTICA DESCRIPTIVA

Page 30: M E D I D A S  D E  T E N D E N C I A  C E N T R A L

EJERCICIO

1. Abra el archivo que se encuentra en el CD “Ejercicios datos SPSS2. Abra el archivo “Regresión Multiple_13. Identifique los nombres de cada variable4. Analizar – estadísticos descriptivos – descriptivos pasar “medición del estrés” (pasos siguientes: próxima diapositiva)5. Analizar – estadísticos descriptivos – frecuencias pasar “medición del estrés” (pasos siguientes: próxima diapositiva)6. Interprete los resultados

Page 31: M E D I D A S  D E  T E N D E N C I A  C E N T R A L

FIN PRESENTACÍON ESTADÍSTICA DESCRIPTIVA