Distribución de Frecuencias

14

Click here to load reader

description

Estadistica

Transcript of Distribución de Frecuencias

Page 1: Distribución de Frecuencias

DISTRIBUCIÓN DE FRECUENCIAS

En un estudio estadístico una vez que se recopilan los datos del caso, es necesario

clasificarlos y ordenarlos antes de intentar su interpretación. Generalmente se tienen

números grandes de observaciones que se anotan simplemente en el orden en que esas

observaciones se vayan haciendo. La clasificación adecuada de esas observaciones es

necesaria y de gran importancia para poder llegar a conclusiones mediante su análisis.

ELABORACIÓN DE UNA DISTRIBUCIÓN DE FRECUENCIAS:

Es el agrupamiento de datos en categorías que muestren el número de observaciones en

cada categoría mutuamente excluyente.

EJEMPLO:

Se tiene las edades de los obreros de una cierta compañía:

28 34 43 30 47 38 34 40 31 33

42 33 42 39 30 32 47 37 32 35

41 35 37 33 39 34 32 43 40 38

CALCULAMOS EL RANGO (R):

La edad mínima es: 28. La edad máxima es: 47.

Entonces el rango es: R = 47 – 28 = 19.

CALCULAMOS EL NÚMERO DE CLASES O INTERVALOS (K):

Algunos métodos para hallar el número de clases, esto es sólo una sugerencia:

Primer método:

Donde “n” es el número total de datos. Para nuestro ejemplo:

Page 2: Distribución de Frecuencias

Segundo método:

Para nuestro ejemplo:

Tercer método:

Este es una sugerencia de los expertos:

N Kn < 50 5 a 7

50 ≤ n < 100 6 a 7100 ≤ n <250 7 a 12

N ≥ 250 10 a 20

Cuarto método:

La experiencia profesional puede determinar el número de clases. Demasiadas clases o

muy pocas no podrían dar a conocer la forma básica del conjunto de datos. Por regla

general, es mejor no utilizar menos de 5 ni más de 15 clases en la elaboración de una

distribución de frecuencias.

Quinto método:

También se puede utilizar la regla de “la potencia de 2” para determinar el número de

clase. Seleccionamos el número entero más pequeño tal que 2k ≥ n, donde n es el número

total de observaciones. Veamos una pequeña tablita con esta regla:

Nº total de observaciones Nº recomendado de clases K9 – 16 4 24 = 1617 – 32 5 25 = 3233 – 64 6 26 = 6465 – 128 7 27 = 128129 – 256 8 28 = 256257 – 512 9 29 = 512513 – 1024 10 210 = 1024

Para nuestro ejemplo haremos caso del primer método, es decir K = 5.

CALCULANDO LA AMPLITUD DE INTERVALO (A):

Page 3: Distribución de Frecuencias

Cuando se trata de características cuantitativas, la amplitud de una clase en la distribución

de frecuencias, se llama intervalos de clase. Generalmente los intervalos de clase son de

igual amplitud. En este caso la amplitud de un intervalo de clase es la diferencia entre dos

marcas de clase sucesivas, o la diferencia entre los límites superiores (o inferiores) de dos

clases sucesivas. La amplitud de los intervalos de clase a usar al tabular un determinado

conjunto de datos, depende de la naturaleza de esos datos y del uso que de ellos se piense

hacer. Debe tenerse en cuenta que si los intervalos son muy amplios contendrán

observaciones de magnitudes bastante variables, las que estaremos considerando en

conjunto, como un grupo homogéneo, al hacer la distribución de frecuencias.

Para nuestro caso:

Tomaremos como nuestro intervalo como A = 4.

CONSTRUIR LOS LÍMITES DE CLASES:

Vemos que cada intervalo debe tener 4 números: Entonces 28 + 4 -1 = 31. Contiene al 28,

29, 30 y 31. Entonces las clases serán:

Límite Inferior Límite Superior28 3132 3536 3940 4344 47

CALCULANDO LOS LÍMITES REALES:

Sumamos o restamos la mitad de la unidad de medida: Es decir: ½ = 0.5.

Límites Límites RealesInferior Superior Inferior Superior

28 31 27.5 31.532 35 31.5 35.536 39 35.5 39.540 43 39.5 43.544 47 43.5 47.5

Page 4: Distribución de Frecuencias

CALCULANDO LAS MARCAS DE CLASE (Xi):

El punto medio de un intervalo de clase se acostumbra llamarlo además punto medio,

marca de clase o valor central.

Límites Límites Reales Marca de Clase

(Xi)Inferior Superior Inferior Superior

28 31 27.5 31.5 29.5

32 35 31.5 35.5 33.5

36 39 35.5 39.5 37.5

40 43 39.5 43.5 41.5

44 47 43.5 47.5 45.5

TABLA DE FRECUENCIA:

Límites Límites Reales Marca de Clase

(Xi)

Frecuencia

(ni)Inferior Superior Inferior Superior

28 31 27.5 31.5 29.5 4

32 35 31.5 35.5 33.5 11

36 39 35.5 39.5 37.5 6

40 43 39.5 43.5 41.5 7

44 47 43.5 47.5 45.5 2

Puede resultar conveniente convertir las frecuencias de clase a frecuencia de clase relativas

para mostrar el porcentaje del número total de observaciones en cada clase.

Xi Marca de clase.

ni Frecuencia absoluta.

Ni Frecuencia absoluta acumulada.

fi Frecuencia relativa.

Fi Frecuencia relativa acumulada.

Hallamos las frecuencias acumuladas y las frecuencias relativas:

Page 5: Distribución de Frecuencias

Límites

Límites Reales

Xi ni Ni fi Fi

Li Ls Lri Lrs

28 31 27.5

31.5

29.5

4 4 0.13

0.13

32 35 31.5

35.5

33.5

11 15 0.37

0.50

36 39 35.5

39.5

37.5

6 21 0.20

0.70

40 43 39.5

43.5

41.5

7 28 0.23

0.93

44 47 43.5

47.5

45.5

2 30 0.07

1.00

EJEMPLO:

Tenemos las notas de un concurso de matemática en un colegio, que participaron 170

estudiantes (la nota máxima es 100 y la nota mínima es 0).

54.5

52.0

88.0

45.0

68.9

40.0

84.1

71.9

89.0

75.5

69.0

77.4

74.0

60.0

70.2

71.4

30.0

59.8

77.1

58.5

15.1

52.3

80.0

74.5

53.0

70.5

63.0

90.4

67.2

81.4

25.3

70.0

60.5

89.5

41.0

63.5

58.0

56.4

62.3

64.7

73.8

85.2

45.0

56.5

72.2

69.5

80.1

24.0

58.6

75.8

54.0

94.1

70.5

61.5

30.0

54.5

72.2

69.0

55.4

72.9

91.2

99.0

47.6

51.5

64.0

64.2

56.6

60.0

80.1

75.3

Page 6: Distribución de Frecuencias

63.1

66.9

58.0

51.5

50.6

68.2

65.5

55.0

98.2

62.5

63.0

66.0

69.2

36.5

88.6

53.2

77.5

52.0

64.0

67.4

70.0

87.0

95.6

37.3

74.4

85.1

78.5

71.0

68.0

84.7

79.0

61.0

79.0

66.2

60.6

37.6

65.1

77.7

82.3

84.8

76.9

64.0

25.6

73.0

48.3

82.4

8.0 50.5

58.0

55.8

59.5

83.0

86.0

45.1

41.2

60.4

77.0

76.5

65.8

87.9

95.6

68.1

67.0

68.2

77.2

69.4

56.0

84.6

65.9

55.5

26.0

42.8

58.0

74.3

84.4

45.5

78.1

95.2

63.7

58.5

17.2

62.6

63.0

76.0

41.0

73.5

67.1

59.0

91.7

64.0

63.3

68.5

72.0

55.5

57.0

46.6

76.5

53.0

46.7

95.0

Vamos a organizar los datos en una distribución de frecuencias y para eso lo haremos en 3

pasos:

PASO 1: Estableceremos grupos más conocidos como clases. En este problema la primera

clase puede incluir a todos las notas que estén entre 0 – 10, es decir las notas que van de 0

hasta antes del 10 (no incluye el 10 pero si incluye el 9.999).

Intervalo de ClaseLimite Inferior Limite Superior

0 - 1010 - 2020 - 3030 - 4040 - 5050 - 6060 - 7070 - 80

Page 7: Distribución de Frecuencias

80 - 9090 - 100

PASO 2:

Vamos a distribuir en clases las notas de los estudiantes, sólo haremos las 7 primeras para

mostrar como se hace:

54.5 Pertenece a la clase de 50 – 60

52.0 Pertenece a la clase de 50 – 60

88.0 Pertenece a la clase de 80 – 90

45.0 Pertenece a la clase de 40 – 50

68.9 Pertenece a la clase de 60 – 70

40.0 Pertenece a la clase de 40 – 50

84.1 Pertenece a la clase de 80 – 90

PASO 3:

Contamos las notas que pertenecen a cada clase:

Intervalo de ClaseFrecuencia

Limite Inferior Limite Superior0 - 10 110 - 20 220 - 30 430 - 40 540 - 50 1350 - 60 3360 - 70 4570 - 80 3680 - 90 2190 - 100 10

HALLANDO INTERVALO DE CLASE Y PUNTOS MEDIOS DE CLASE:

En el ejemplo de las notas, hay 10 clases todas con intervalos de clases de 10 unidades y

las marcas de clase o puntos medios son sucesivamente 5, 15, 25, 35,…

CALCULANDO LAS FRECUENCIAS RELATIVAS:

Intervalo de Clase X Frecuencia Frecuencia Frecuencia Frecuencia

Page 8: Distribución de Frecuencias

i AbsolutaAbsoluta

AcumuladaRelativa

RelativaAcumulada

LimiteInferio

r

LimiteSuperio

r

0 10 5 1 1 0.0059

0.0059

10 20 15 2 3 0.0118

0.0177

20 30 25 4 7 0.0235

0.0412

30 40 35 5 12 0.0294

0.0706

40 50 45 13 25 0.0765

0.1471

50 60 55 33 58 0.1941

0.3412

60 70 65 45 1030.2647

0.6059

70 80 75 36 1390.2118

0.8177

80 90 85 21 1600.1235

0.9412

90 100 95 10 1700.0588

1

SUPONGAMOS:

En el ejemplo de las notas en vez de las 10 clases consideradas, tomáramos sólo las 4

siguientes:

0 – 2525 – 5050 – 7575 – 100

Vemos que no estaríamos diferenciando entre calificaciones tan diferentes como 50 y 74

por ejemplo. El caso contrario, o sea si los intervalos de clase son muy pequeños (y por lo

Page 9: Distribución de Frecuencias

tanto el número de clases grande) también tiene sus inconvenientes. Una distribución

hecha en esa forma revelaría demasiado detalle para poder obtener rápidamente una idea

clara de los aspectos importantes del fenómeno en estudio. Nótese, que esa es la razón por

la que el cuadro de los datos originales no se usa, sino que se hace la distribución de

frecuencias.

SUGERENCIAS PARA ELABORAR UNA DISTRIBUCIÓN DE FRECUENCIAS

A continuación se presenta algunas pautas, las cuales deben considerarse como guías para

la elaboración de una distribución de frecuencias:

Los intervalos de clase utilizados deben ser iguales. Los intervalos de clase desiguales

ofrecen problemas al representar en forma gráfica la distribución. Sin embargo, en algunos

casos pueden ser necesarios intervalos de clase desiguales para evitar un gran número de

clases vacías, o casi vacías.

EJEMPLO:

Veamos el ejemplo de las notas de otro concurso de matemática en donde participaron

1000 estudiantes:

Intervalo de ClaseFrecuenciaLimite

InferiorLimite

Superior

0 - 10 010 - 20 220 - 30 330 - 40 1540 - 50 9050 - 60 22060 - 70 35070 - 80 20080 - 90 10090 - 100 20

Entonces vemos que las clases de 0-10, 10-20, 20-30, no hay casi estudiantes. Entonces

podemos juntar con la clase 30-40:

Intervalo de ClaseFrecuenciaLimite

InferiorLimite

Superior

0 - 40 2040 - 50 90

Page 10: Distribución de Frecuencias

50 - 60 22060 - 70 35070 - 80 20080 - 90 10090 - 100 20

Trate de evitar tener clases abiertas.

Este tipo de clases ocasiona problemas al hacer gráficos, y al determinar ciertas medidas de

tendencia central y de dispersión.

EJEMPLO:

Los gastos de publicidad son un componente importante en el costo de mercancías

vendidas. A continuación se presenta una distribución de frecuencias que muestran los

gastos de publicidad de 60 compañías productoras.

Gasto de publicidad (millones de $)Número de compañías

( f )

Menos de 35 7

35 – 45 10

45 – 55 21

55 – 65 16

Más de 65 10

Total 64

Evite la superposición de límite de clases establecidas.

No deben utilizarse límites de clase como 10 – 20 y 20 – 30. Las clases establecidas de esta

manera no son mutuamente excluyentes, lo que infringe la definición de distribución de

frecuencias. Con la superposición de clases no estaría claro dónde clasificar un valor de 20.

¿Pertenece a la clase de 10 – 20 o la de 20 – 30? Estos son sólo para no complicarnos,

como en el ejemplo anterior.