UNIVERSIDAD NACIONAL TECNOLOGICA DEL CONO SUR DE LIMA
(UNTECS)
CARRERA PROFESIONAL: INGENIERIA MECANICA Y ELECTRICA
ASIGNATURA : ESTADÍSTICA DESCRIPTIVAUNIDAD I : PRESENTACION, INTERPRETACION Y ANALISIS DE DATOS
CONTENIDO : DISTRIBUCION DE FRECUENCIAS
Semana N° Contenido
2
1.1 Metodología1.2 Propiedades de las frecuencias1.3 Aplicaciones en variables
continuas unidimensionales1.4 Aplicaciones en variables
discretas unidimensionales1.5 Aplicaciones en casos
multidimensionales1.6 Problemas propuestos
ELABORADO POR: Ing. Walter Eduardo Blas Ramos
LIMA
2013
DISTRIBUCION DE FRECUENCIAS
Dentro de la Estadística la distribución de frecuencias y los gráficos estadísticos son
los instrumentos descriptivos más usados y con bastante aplicación práctica y común,
debido a que no requieren estudios estadísticos previos y mucho menos complejos.
La distribución de frecuencias consiste en ordenar los datos desordenados provenientes
de una muestra o población en categorías, clases o intervalos utilizando un determinado
procedimiento o método. Si se trata de una muestra, esta debe ser representativa de la
población para que los resultados obtenidos tengan cierto grado de confianza.
1.1. METODOLOGIA
El procedimiento metodológico para elaborar un cuadro de distribución de
frecuencias es el siguiente:
a) Identificar el tipo de variable.
El analista debe evaluar los datos numéricos y establecer si corresponden a una
variable discreta o continua.
Si los datos corresponden a una variable continua, entonces estos deben haberse
obtenido como resultado de una medición utilizando algún instrumento.
En caso contrario si los datos corresponden a una variable discreta, entonces
estos deben haberse obtenido como resultado de un conteo, de una evaluación
sensorial o alguna cualidad o atributo sin utilizar instrumento alguno.
b) Determinar el Rango o Amplitud (R) :
R = Xma - Xme
Donde: R es el Rango o Amplitud
Xma es el dato de mayor valor numérico
Xme es el dato de menor valor numérico
c) Establecer el número de clases (m) empleando la fórmula de
Sturges:
m = 1 + 3,322 log (n)
Donde: m es el número de clases
n es el número de datos
El criterio para establecer el número de clases que debe tener la distribución es
flexible, el analista puede optar por utilizar la formula de Sturges o establecer
un numero de clases en función a la naturaleza de la variable.
El número de clases debe ser un número entero, independiente del tipo de
variable, cuando el resultado de la ecuación de Sturges tenga decimales,
entonces se debe redondear utilizando las reglas matemáticas de redondeo.
d) Determinar el Intervalo de Clase (C) :
El intervalo de clase es la separación que existe entre las clases o categorías, y
es constante para todas las categorías en toda la distribución.
C = Rango / Número de clases
C = R/m
Cuando se está ordenando valores correspondientes a variables continuas, el
valor de “C” puede contener decimales, siendo recomendable procesar la
información con tres decimales para alcanzar errores del milésimo.
En caso de ordenar datos de variables discretas, el valor "C" debe ser entero,
para lo cual se debe emplear el redondeo matemático en primera instancia; y en
caso que no sea posible estructurar las clases, entonces se recurrirá al criterio de
adecuar la estructura de clases o categorías con redondeos a los enteros
inmediatos superiores. Sin embargo algunas variables discretas pueden admitir
decimales tales como: valores monetarios, porcentajes y calificaciones.
e) Establecer la primera clase o categoría
Cuando los datos a procesar corresponden a una la variable continua, la primera
clase tendrá el siguiente intervalo:
Xme -------------------- Xme+ C
En caso de procesar variables discretas, la primera case tendrá la siguiente
estructura:
Xme -------------------- Xme + (C - 1)
Donde: Xme es el dato de menor valor numérico.
C es el intervalo de clase determinado.
f) Construir la estructura de clases
Sean: mj = m1, m2,…………………..mk las clases o categorías
C el intervalo de clase determinado
Xme el dato de menor valor numérico
Xma el dato de mayor valor numérico
Para lo indicado se tendrá la siguiente estructura asumiendo que la variable es
continua:
CLASES ABSOLUTAS
m1
m2
m3
.
.
mj
.
.
mk
Primera clase
Segunda clase
Tercera clase
.
.
J-ésima clase
.
.
K-ésima clase
Xme … ………Xme + C
Xme + C . ……….. Xme + 2C
Xme + 2C ………… Xme + 3C
. .
. .
Xme + (j-1) C…………Xme + jC
. .
. .
Xme + (k-1).…………..Xme + kC = Xma
A la estructura de la tercera columna del cuadro anterior se le conoce como CLASES
ABSOLUTAS y son aquellas que resultan de la distribución inicial de datos; dentro
de las clases absolutas todos los valores que se encuentran al lado izquierdo del
intervalo se les conoce como LÍMITES DE CLASE INFERIOR y los que se
encuentran a la derecha LÍMITES DE CLASE SUPERIOR. Además cuando la
variable es continua la distribución se inicia con el dato menor en la primera clase
(Xme) y termina con el dato mayor en la última clase (Xma).
g) Tabular o distribuir datos en clases o categorías.
La distribución de frecuencias sirve para presentar información ordenada en clases o
categorías con sus correspondientes frecuencias o cantidades en cada una de ellas; lo
cual resulta económico y útil para su interpretación, análisis y toma de decisiones;
mientras tanto el aspecto negativo se refleja, debido a que dicha distribución
comienza a incorporar otro tipo de error al margen del error experimental.
Construida las clases absolutas, los datos en estudio deben distribuirse a las
categorías respectivas, algo así corno compartimentos, en los cuales se colocarán los
datos que se encuentran en cada una de estas clases.
La Frecuencia Absoluta, lo constituye el número de datos que una vez finalizada
la distribución, se encuentran en cada clase.
Los Límites Superior e Inferior de Clase, deben estar definidos
empleando la simbología matemática de intervalos. Para variables continuas
se emplea como norma, intervalo cerrado en el límite inferior e intervalo
abierto en el límite superior; y para variables discretas cerrando en ambos límites.
1.2. PROPIEDADES DE LAS FRECUENCIAS
a) Numero de datos (n): La suma de todas las frecuencias absolutas, debe
dar como resultado el número total de datos que se está evaluando (n).
b) Clases reales: En caso de variables discretas, dada la discontinuidad de la
función matemática, es necesario determinar Clases Reales; dichas clases se
obtienen determinando en primera instancia la diferencia que existe entre
el límite superior de una clase con el límite inferior de la clase que se
encuentra debajo de la anterior, la cual es constante en toda la distribución;
esta diferencia se divide en dos partes iguales, los que se distribuyen de la
siguiente manera : Una mitad se suma a los límites superiores absolutos y
la otra mitad se resta a los límites inferiores absolutos; de esta manera la
función tendrá continuidad numérica para los análisis posteriores.
c) Frecuencia relativa (f r): Son fracciones que representan a las clases
dentro de la distribución. Se obtienen dividiendo las frecuencias absolutas de
cada clase entre el número total de datos o entre la suma total de las
frecuencias absolutas. La sumatoria de todas las frecuencias relativas, da como
resultado la unidad (1). Es recomendable trabajar con tres decimales, para
disminuir el error de cálculo al milésimo.
d) Frecuencia porcentual (f%): Son porcentajes que representan a las
clases dentro de la distribución. Se determina multiplicando la
frecuencia relativa por 100. La suma total de estas frecuencias es 100 ó sea
cien por ciento.
e) Frecuencia angular (fg): Son frecuencias que están relacionadas a la
circunferencia, donde cada clase forma parte de una región angular cuando
dicha distribución es representada en un gráfico circular. Se obtiene
multiplicando las frecuencias relativas de cada clase por trescientos sesenta
grados (3600). La suma total de todas estas frecuencias angulares debe ser
360. Esta información se utiliza para la construcción de gráficos circulares, y
tiene mas aplicación cuando se describe variables discretas
f) Frecuencia acumulada (fa): Son frecuencias que se obtienen por sumatorias
sucesivas en forma ordenada con un sentido definido. Se pueden
acumular las frecuencias absolutas, relativas y porcentuales. El sentido de la
acumulación puede ser ascendente y descendente.
g) Marca de clase (xi): Son indicadores que representan el valor central de cada
clase, y se obtienen como la semisuma del límite inferior y superior de cada
clase.
1.3. APLICACIONES EN VARIABLES CONTINUAS UNIDIMENSIONALES
Se tiene un lote de producción de 750 cajas de pernos de 2 pulgadas
de longitud, del cual se toma una muestra de tamaño 32,
determinándose el peso bruto de cada una de ellas, y obteniéndose los
siguientes resultados en (Kg).
29,4 28,2 30,8 30,0
29,3 29,6 31,4 30,5
30,4 30,6 31,3 30,6
30,7 31,1 32,4 32,0
31,4 31,0 32,9 33,4
31,5 31,7 31,0 32,5
32,6 33,1 30,9 31,9
34,8 29,9 31,0 30,1
Elaborar un cuadro de distribución de frecuencias, y desarrollar la aplicación
de todas sus propiedades.
Desarrollo. -
a) Identificación del tipo de variable
La variable cuantificada corresponde a una medición que es el peso en (Kg) por
lo tanto es un variable de carácter continua.
a) Cálculo del Rango o Amplitud ( R) :
R = Xma - Xme
Xma = 34,8
Xme = 28,2
R= 34,8 - 28,2 = 6,6
b) Cálculo del número de clases en función a la fórmula de Sturges :
m = 1 + 3,322 log (n)
m = 1 + 3,322 log (32)
m = 6,000
m = 6 clases
c) Determinación del intervalo de clase ( C) :
Es la separación que hay entre clase y clase, y es constante para todas las clases de
una distribución.
C = R/m
C = 6,6/6
C = 1,1
Como la variable es continua, C puede tener decimales.
d) Determinación de la primera clase :
Xme__________Xme + C
Reemplazando valores se tendrá
28,2___________28,2 + 1,1
entonces la primera clase será:
Desde 28,2 hasta 29,3
La primera clase es la base sobre la cual se va construir las demás clases,
sumándoles la constante C
f) Construcción de las clases
Se tendrá en cuenta que en la primera distribución se obtendrá las clases absolutas con
sus respectivas frecuencias absolutas. Además se empleará la simbología matemática
para definir la tendencia del intervalo, el cual será cerrado al lado izquierdo y abierto al
lado derecho.
CLASES ABSOLUTAS
[Xk ………… Xk +1)
[28,2 …………. 29,3)
29,3 …………. 30,4)
30,4 …………. 31,5)
31,5 …………. 32,6)
32,6 …………. 33,7)
33,7 …………. 34,8]
g) Tabulación de datos
Consiste en ordenar la información, ubicando los 32 datos en las respectivas clases o
categorías que la contienen:
CLASES ABSOLUTAS CONTEO FRECUENCIA ABSOLUTA
[Xk …………….. Xk +1) (fi)
28,2 ……………….. 29,3
29,3 ……………….. 30,4
30,4 ……………….. 31,5
31,5 ……………….. 32,6
32,6 ……………….. 33,7
33,7 ……………….. 34,8
II
IIIII
IIIII IIIII IIII
IIIIII
IIII
I
2
5
14
6
4
1
32
Observaciones:
La distribución comienza con el dato menor y termina con el dato
mayor, por ser una variable continua.
El resultado del conteo se define como frecuencia absoluta y queda representada
por (fi) con las unidades originales del problema.
La diferencia entre el límite superior de la primera clase con el límite
inferior de la segunda clase es cero, entonces no es necesario
determinar clases reales, dado que la variable es continua "y por lo tanto
las clases absolutas son a la vez son clases reales”
La suma de las frecuencias absolutas es igual al número de datos n= 32
Los valores que se encuentran al lado izquierdo comenzando con 28,2
constituyen los límites inferiores de clase; mientras que los valores que
se encuentran a la derecha, desde 29,3 se les conoce como límites
superiores de clase.
Los limites inferiores de la distribución son valores abiertos, por lo tanto en el
caso del problema si se tiene un valor de 33,7 este pertenecerá a la última clase y
no a la quinta clase.
Desarrollo de las propiedades de las frecuencias.
- Determinación de las frecuencias relativas (fr): fr=(1/ fi) fi ó fr=(1/ n)fi
fi fr = (1/n) fi fr
2
5
14
6
4
1
2 / 32
5 / 32
14 / 32
6 / 32
4 / 32
1 / 32
0,062
0,156
0,438
0,188
0,125
0,031
32 1,000
- Determinación de las frecuencias porcentuales (f%): f % = fr (100)
fi fr f% = frx100 f%
2
5
14
6
4
1
0,062
0,156
0,438
0,188
0,125
0,031
0,062 (100)
0,156 (100)
0,438 (100)
0,188 (100)
0,125 (100)
0,031 (100)
6,2
15,6
43,8
18,8
12,5
3,1
32 1,000 1,000 (100) 100,0
- Determinación de las frecuencias angulares (fg): fg = fr (360)
fi fr f% fg = frx360 fg
2
5
14
6
4
1
0,062
0,156
0,438
0,188
0,125
0,031
6,2
15,6
43,8
18,8
12,5
3,1
0,062 (360)
0,156 (360)
0,438 (360)
0,188 (360)
0,125 (360)
0,031 (360)
22,32
56,16
157,68
67,68
45,00
11,16
32 1,000 100,0 1,000 (360) 360.00
- Determinación de frecuencias acumuladas.
Acumulando en forma ascendente, en el sentido que indica la flecha ( ) tenemos:
fi fia fr fra f% f% a
2
5
14
6
4
1
2
7
21
27
31
32
0,062
0,156
0,438
0,188
0,125
0,031
0,062
0,218
0,656
0,844
0,969
1,000
6,2
15,6
43,8
18,8
12,5
3,1
6,2
21,8
65,6
84,4
96,9
100,0
Acumulando en forma descendente, en el sentido que indica la flecha ( ) tenemos:
fi fia fr fra f% f% a
2
5
14
6
4
1
32
30
25
11
5
1
0,062
0,156
0,438
0,188
0,125
0,031
1,000
0,938
0,782
0,344
0,156
0,031
6,2
15,6
43,8
18,8
12,5
3,1
100,0
93,8
78,2
34,4
15,6
3,1
donde:
fia es la frecuencia absoluta acumulada ascendente.
fra es la frecuencia relativa acumulada ascendente.
f%a es la frecuencia porcentual acumulada ascendente.
fia es la frecuencia absoluta acumulada descendente.
fra es la frecuencia relativa acumulada descendente.
f% a es la frecuencia porcentual acumulada descendente.
1.4 APLICACIONES EN VARIABLES DISCRETAS UNIDIMENSIONALES
Problema
La siguiente información corresponde al número de alumnos por aula en una escuela
primaria del Cercado de Lima.
38 46 51 42 54 36 50 45 53 56
50 53 58 31 47 55 56 49 60 64
47 43 65 51 50 44 49 40 46 53
53 63 56 50 37 51 33 57 61 49
39 55 42 63 45 59 57 47 55 66
49 58 35 54 46 41 49 43 62 51
Desarrollar un cuadro de distribución de frecuencias, complementando con todas sus
propiedades:
Solución:
a) Determinación del tipo de variable
El conteo del número de alumnos por aula es una variable discreta cualitativa.
b) Cálculo del Rango o Amplitud ( R ):
R = Xma – Xme
R = 66 – 31
R = 35
c) Cálculo del Número de clases empleando la fórmula de Sturges:
m = 1 + 3,322 log (n)
m = 1 + 3,322 log (60)
m = 69
como el número de clases no puede ser un valor con decimales, éste debe ser
redondeado en base al principio matemático.
m = 7
d) Determinación del Intervalo de Clase (C):
c = R/m
c = 35/7
c = 5
e) Construcción de la primera clase.
Xme ----------- Xme + (c=1)
31 ----------- 31 + ( 5 – 1)
31 ----------- 35
Entonces la primera clase será el intervalo desde 31 hasta 35, lo cual debe ser
considerado en el cuadro cerrado en ambos extremos.
f) Construcción de las clases absolutas
Clases Absolutas
Xk_________ Xk+1
31 35
36 40
41 45
46 50
51 55
56 60
61 65
66 70
g) Tabulación de datos.
Clases absolutas
Xk_________ Xk+1
Conteo Frecuencia absoluta
fi
31 35
36 40
41 45
46 50
51 55
56 60
61 65
66 70
III
IIIII
IIIII III
IIIII IIIII IIIII
IIIII IIIII III
IIIII IIII
IIIII I
I
3
5
8
15
13
9
6
1
La diferencia entre el límite superior de la primera clase y el límite inferior de la
segunda clase es uno (36-35 = 1) por lo tanto será necesario determinar CLASES
REALES para que esta diferencia sea cero en todas las categorías de la distribución.
La suma de todas las frecuencias absolutas es igual a n: (n = 60).
Desarrollo de las propiedades complementarias.-
- Determinación de frecuencias relativas (fr):
fr = fi /n
fi Fr
3
5
8
15
13
9
6
1
0,050
0,083
0,133
0,250
0,217
0,150
0,100
0,017
60 1,000
- Determinación de Frecuencias Porcentuales (f%):
f% = fr (100)
fi fr
3
5
8
15
13
9
6
1
5,0
8,3
13,3
25,0
21,7
15,0
10,0
1,7
60 100,0
La sumatoria de todas las frecuencias porcentuales debe ser exactamente
igual a cien.
- Determinación de Frecuencias Angulares (fg°)
fg° = fr(360)
fr fg°
0,050
0,083
0,133
0,250
0,217
0,150
0,100
0,017
18,00
29,88
47,88
90,00
78,12
54,00
36,00
6,12
1,000 360,00
La suma de todas las frecuencias angulares es igual a 3600
- Determinación de Frecuencias Acumuladas Ascendentes (fa↓) y
Descendentes (fa↑)
fi Fia↓
3
5
8
15
13
9
6
1
3
8
16
31
44
53
59
60
Fr fra↓
0,050
0,083
0,133
0,250
0,217
0,150
0,100
0,017
0,050
0,133
0,266
0,516
0,733
0,883
0,983
1,000
f% f%↓
3,0
8,3
13,3
25,0
21,7
15,0
10,0
1,8
5,0
13,3
26,6
51,6
73,3
88,3
98,3
100,0
fi fia↑
3
5
8
15
13
9
6
1
60
57
52
44
29
16
7
1
Fr fra↑
0,050
0,083
0,133
0,250
0,217
0,150
0,100
0,017
1,000
0,950
0,867
0,734
0,484
0,267
0,117
0,017
f% f%a↑
5,0
8,3
13,3
25,0
21,7
15,0
10,0
1,7
100,0
95,0
86,7
73,4
48,4
26,7
11,7
1,7
En el primer caso se llama ascendente por que las frecuencias acumuladas
van aumentando en el sentido de la lectura normal.
En el segundo caso se llama descendente por que las frecuencias
acumuladas van descendiendo o disminuyendo en el sentido de la lectura
normal
- Determinación de Marcas de clase (xi):
Xi = (LIC + LSC) / 2
Donde: LIC = Límite Inferior de Clase
LSC = Límite Superior de Clase
Clases Absolutas
Xk_________ Xk+1
Marcas de clase
Xi
31 35
36 40
41 45
46 50
51 55
56 60
61 65
66 70
33
38
43
48
53
58
63
68
- Determinación de las Clases Reales:
Clases Absolutas
Xk_________ Xk+1
Clases Reales
Xk_________ Xk+1)
31 35
36 40
41 45
46 50
51 55
56 60
61 65
66 70
30,5 ------------ 35,5
35,5 ------------ 40,5
40,5 ------------ 45,5
45,5 ------------ 50,5
50,5 ------------ 55,5
55,5 ------------ 60,5
60,5 ------------ 65,5
65,5 ------------ 70,5
En las clases absolutas la diferencia entre el LSC y el LIC de la clase inmediata
inferior es uno, lo cual es constante para toda la distribución. Esta diferencia
dividiendo en dos partes iguales es 0,5. Este valor se resta a los LIC de cada clase y
se obtienen los LIC de las clases Reales. Luego el mismo valor 0,5 hallado, se
suman a los LSC de cada clase y se obtienen los LSC de las Clases Reales.
Matemáticamente se fundamenta en el hecho que si a un número le restas y luego
de sumas el mismo valor, el número no se altera.
1.5 APLICACIONES EN CASOS MULTIDIMENSIONALES
Estas distribuciones se realizan cuando el estudio está interesado en evaluar dos o
más variables. El caso más simple es el bidimensional o de doble entrada.
El siguiente cuadro presenta una distribución bidimensional de
doble entrada.
PESO (kg)
Xk – Xk+1)
ESTATURA (m)
Yk ----------- Yk+1)
1,55 – 1,61 1,61 – 1,67 1,67 – 1,73 1,73 – 1,79 1,79 – 1,85
50 – 55
55 – 60
60 – 65
65 – 70
70 – 75
75 – 80
80 – 85
3
5
4
1
15
14
7
4
27
23
6
1
9
14
12
2
1
6
15
13
4
1
Si se quisiera obtener una distribución unidimensional a partir de este cuadro se
tiene lo siguiente:
Peso (kg)
Xk _____ Xk+1)
fi
50 _______55
55 _______60
60 _______65
65 _______70
4
25
60
59
70 _______75
75 _______80
80 _______85
31
6
2
187
En el cuadro bidimensional, se pueden hacer
más clasificaciones en cada una de las
variables estatura o peso, convirtiéndose así en
multidimensional.
Por ejemplo, cada grupo de estatura se puede
subdividir en masculino y femenino; y por
otro lado cada grupo de peso también se puede
subdividir en masculino y femenino y de esta
manera se puede ir incorporando más variables en el cuadro.
El análisis debe realizarse en forma individual a cada variable.
1.6. PROBLEMAS PROPUESTOS
P.1 La siguiente muestra corresponde a la longitud en centímetros de brocas aceradas
para minería.
Estatura (m)
Yk _____ Yk+1)
fi
1,55_______1,61
1,61_______1,67
1,67 _______1,73
1,73_______1,79
1,79_______1,85
12
37
60
39
39
187
22,4
22,1
20,4
20,1
21,8
23,6
21,4
23,3
22,8
20,6
20,9
21,6
22,6
22,9
23,1
23,8
23,7
22,7
23,2
22,8
22,5
21,2
22,8
23,8
22,6
21,9
23,3
21,6
20,7
22,5
22,7
22,6
20,4
20,2
21,9
23,8
20,9
23,2
21,9
23,5
a) Construir un cuadro de distribución de frecuencias utilizando el criterio de
Sturges.
b) Construir un cuadro que contenga: fr, f%, fg°, fia↓, fra↓, f%a↑, Xi, y Clases
Reales.
P.2 Al calibrar una selladora de conservas se han obtenido las siguientes dimensiones
en milímetros.
74
79
75
66
74
72
73
64
77
61
71
70
73
62
71
62
70
71
70
63
61
63
65
71
69
72
63
64
75
71
66
66
62
71
62
77
68
65
72
62
72
74
68
65
68
73
65
70
68
74
64
68
78
78
63
70
76
79
a) Construir un cuadro de distribución de frecuencias utilizando la fórmula de
Sturges.
b) Construir un cuadro que contenga: fr, f%, fg°, fia↑, fra↓, f%a↓, Xi, Clases
Reales.
P.3. Luego de una evaluación en la asignatura de Matemática Aplicada
se obtuvieron los siguientes resultados:
9
12
4
13
5
15
8
6
15
2
6
11
12
9
13
10
11
12
12
14
17
11
9
5
14
14
12
10
8
15
15
14
14
15
16
12
14
16
12
13
7
10
8
16
14
5
12
8
10
14
12
16
11
15
3
12
14
18
8
3
4
16
12
11
9
18
19
8
10
11
12
10
19
17
8
14
13
17
7
13
12
14
19
11
7
17
10
a) Construya un cuadro de distribución de frecuencias utilizando el criterio de
Sturges.
b) Construya un cuadro de distribución de frecuencias con 6 clases.
c) Construya un cuadro que contenga: fr, f%, fg°, fia↓, fra↑, f%a↓, xi y Clases
Reales.
P.4. El siguiente cuadro representa el diámetro de una pieza metálica de motor.
Diámetro (cm)
Xk _____ Xk+1)
fi
30 40
40 50
50 60
60 70
70 80
80 90
90 100
5
11
19
28
16
8
2
Xk _____ Xk+1) fi Hi
20 _________30
30 _________40
Top Related