Post on 28-Oct-2015
UNIVERSIDAD NACIONAL JOSE FAUSTINO SANCHEZ CARRION
Facultad de Ingeniería Industrial, Sistemas e Informática
EESSTTAADDIISSTTIICCAA yy PPRROOBBAABBIILLIIDDAADDEESS
MOISES E. ARMAS
HUACHO, 2008
2
Presentación
A continuación se presenta una guía de prácticas de Estadística y
Probabilidades para que los alumnos puedan contar con un material
didáctico y tengan a la mano una serie de ejercicios y problemas de los
tópicos tratados en el desarrollo del presente curso.
Se hace esta publicación con el ánimo de contribuir a facilitarles el
proceso de aprendizaje y que este le sirva como guía preliminar para
compenetrarse en más profundidad revisando y ejercitándose con los libros
de texto que abundan en este curso y han sido enunciados en la bibliografía.
Un curso se hace interesante y didáctico cuando tiene una relación
con el entorno, micro y macro, y de paso de un sentido práctico a la carrera
elegida; en este sentido los problemas y ejercicios están orientados hacia
esto; como una mención adicional se introduce, al inicio de cada sección
frases célebres de los grandes hombres que tuvieron influjo en la sociedad e
invitan a la reflexión, tan necesario en nuestro medio.
3
Sección 1
Frases para meditar:
Uno no puede alcanzar el éxito, son los
demás quienes lo brindan.
La inteligencia es arma de dos filos; con
muy poca, uno no se puede dar abasto,
con demasiada, uno pierde contacto con
la realidad, adolece del síndrome del
profesor distraído.
Cuanto más inteligente es una persona,
tanto más dependerá de sí misma.
Para llegar a ser una persona libre y
sana, tienes que aprender a ser diferente
Estadística Descriptiva
Estadística: Parte de la matemática, que proporciona un conjunto de
métodos utilizados para recolectar, resumir, clasificar, analizar e
interpretar los datos.
Datos: Conjunto de individuos o elementos que de por sí no tienen ningún
significado; pueden ser de naturaleza cualitativa o cuantitativa. Un tipo de
dato de naturaleza cualitativa expresa una cualidad, tal como el color de un
objeto, o el estado civil de una persona, etc.; un tipo de dato cuantitativo
expresa una cierta cantidad que puede ser medida en términos de una escala
de medida.
Recopilación de datos: Los diferentes tipos de datos con los cuales se
trabajan en la estadística, pueden ser recopilados mediante diferentes
procedimientos, los cuales dependen de las oportunidades y facilidades con
las que se cuentan; dentro de ellas podemos obtenerlas mediante:
4
encuestas, entrevistas, diversas publicaciones, u observando directamente
el terreno de los hechos, cada metodología tiene sus propias
particularidades, ventajas y desventajas que deberán sopesarse al momento
de elegir la técnica más adecuada; las principales características de estas
técnicas se describen a continuación.
a) Encuestas. Mediante este procedimiento se recopilan datos ya
encasillados; para ello se diseñan formularios de preguntas donde el
encuestado contestará adecuándose a las características de las
respuestas presentadas en el formulario de la encuesta; el problema de
la veracidad de los datos podría ser si el que contestó lo dijo con
franqueza, sin omitirlo o sin mentirlo, o el tipo de pregunta estuvo mal
formulada, lo cual podría inducir a una respuesta equivocada; otro
problema que podría surgir es cuando las encuestas no son respondidas
en la medida de las expectativas; sin embargo su ventaja está asociado
a su costo y la rapidez de procesar la información.
b) Entrevistas. Mediante esta técnica se obtienen datos más fiables, dado
que se desarrolla un procedimiento de entrevista directa con la persona
a quién se desea obtener una información, para ello la persona que hará
la entrevistas, lo primero que deberá hacer es averiguar los
antecedentes de la información que deseará obtener, lo cual significa
que el entrevistador tendrá que ser una persona bien preparada, dado
que el entrevistador podría rehuir la respuesta correcta cuando las
preguntas no son bien formuladas o podrían comprometer alguna
situación que el entrevistado no quisiera dar. Es un buen procedimiento
para obtener informaciones más fidedignas, pero tiene el inconveniente
de ser costoso y de mayor tiempo de duración.
c) Publicaciones. Cuando las dos técnicas anteriores no son posibles
desarrollarlos o no son necesarios, pueden acudirse a esta fuente de
información; para ello existen diferentes medios publicitarios donde
podrían obtenerse los datos requeridos; así tenemos los que se ofrecen
a través de las revistas especializadas, libros, catálogos, periódicos,
tablas, informes, resúmenes, tesis, memorias, etc.
d) Observaciones. Finalmente, cuando no es posible obtener datos por
estos tres medios en razón de que lo que se desea obtener como fuente
de información es un producto nuevo, o no existen antecedentes sobre
ello, o no es conveniente las tres metodologías anteriores, puede
acudirse a la observación directa del fenómeno; esto consiste en que el
analista registrará paso a paso los acontecimientos observados para
luego ir seleccionado solo aquellos datos que les serán necesarios; es
5
obvio que la calidad de los datos capturados, estará en función del
conocimiento del problema, experiencia y habilidad del investigador.
Escala de medida de datos. Cuando trabajamos con datos cuantitativos,
estos pueden expresarse en las escalas nominales, ordinales, de intervalos o
de razón.
Escala nominal. Se refiere cuando a un elemento se le asigna un solo
número que lo identifique; así, el número de DNI de una persona es
único, como lo es también con el número telefónico, etc.
Escala Ordinal. Está referido a que los elementos guardan una
numeración ordenada; por ejemplo, el orden de mérito de los alumnos
en un salón de clase; también pertenece a esta escala, las numeraciones
de las calles, etc.
Escala de Intervalos. Es una escala ordinal, con la diferencia de que
puede establecerse una razón de intervalo entre dos numeraciones; por
ejemplo si hablamos de dos estudiantes cuyos órdenes de méritos son
tercer puesto y décimo puesto, entonces podemos decir, que éste último
está alejado siete veces más que aquel.
Escala de razón. Es una escala de intervalos, con la diferencia con tiene
un punto de partida, que comienza del cero; los números que están
hacia su derecha representan los positivos, y lo que están a su izquierda
los negativos.
Solo con los datos pertenecientes a esta última escala, pueden desarrollarse
todas las operaciones aritméticas; con las otras pueden hacerse construirse
tablas y hacerse representaciones gráficas.
Redondeo de datos. Cuando se desarrollan cálculos aritméticos o se
obtienen datos, éstas se presentan con diferentes características que deben
expresarse en forma homogénea, para ello se hacen ciertas aproximaciones
convencionales que permiten reducir los márgenes de error; así por
ejemplo, el número 46,8 redondeado en unidades enteras es 47 porque el
0,8 está más próximo al uno que al cero, en consecuencia 46,8 está más
cerca a 47 que a 46. Sin embargo 46,81634 redondeado a milésimos (tres
decimales) es 48,816, porque el 0,0003 está más próximo al 0,0000 que al
0,0009. En el caso de querer redondear 46,8165 a tres decimales, podría
generarse un pequeño problema, ya que 0,0005 está a la misma distancia
de 46,816 que a 46,817; en vista de que no se sabe a cuál de ellos
redondearlo se utiliza el siguiente criterio:
6
Así 46,8165 se redondea a 46,816 si el número que lo precede es par; en
este caso el número 6 es par.
46,8175 se redondea a 46,818 si el número que lo precede es impar,
como puede apreciarse, el 7 es impar.
Del mismo modo: 10,45 redondeado con un decimal es 10,4
10,55 redondeado con un decimal es 10,6
Dígitos significativos: Si un número se dice que está con buena precisión
como por ejemplo el número 1,7 significa, que éste está entre 1,65 y 1,75.
Los dígitos empleados, aparte de los ceros necesarios para localizar
el punto decimal se llaman dígitos significativos o cifras significativas.
1,7 tiene dos cifras significativas
3,472 tiene cuatro cifras significativas
9,72800 tiene seis
0,0245 tiene tres
0,002 tiene uno = 2 * 10-3
0,00493 = 4,93*10-3
tiene tres
Cálculos. Los resultados de las multiplicaciones, cocientes y raíces, solo
deben tener como dígitos significativos de uno de aquellos que tengan el
menor número de cifras.
Ejemplos: 3,875 * 2,14 = 8,0999 debe ser como cifras significativa 8,10
0,754 * 12,53 = 9,4478, su resultado final debe expresarse
en forma aproximada por 9,45, porque uno de los elementos
del multiplicador tiene dos cifras.
153,841/0,9214 = 166,9644; el resultado final debe
expresarse como 166,964; si se lo quiere expresar como un
entero será 167.
Información: Conjunto de datos procesados que proporcionan un
significado real; los siguientes ejemplos ilustran este concepto: a) El 90%
de los estudiantes provenientes de la educación secundaria de nuestro
sistema educativo, ocuparon el último lugar, entre concursantes similares
de otros países, en una olimpiada de matemáticas, b) De los quince mil
habitantes con las que cuenta una pequeña ciudad de la sierra peruana, diez
mil son varones y el resto mujeres; c) Sólo el 8% de los aficionados al
fútbol, creen que nuestra selección cuenta con buenos jugadores, capaces
de levantar la imagen de este alicaído deporte.
7
División de la estadística; la estadística se divide en dos grandes grupos:
descriptiva e inferencial.
1. Estadística Descriptiva: Constituye un conjunto de métodos que
permite recolectar, clasificar, presentar y analizar datos de una
población o muestra; tal como lo dice su nombre, la estadística
descriptiva permite describir los hechos tal como suceden, sin
tergiversarlos ni desnaturalizarlos. Las conclusiones obtenidas serán
basadas en estos acontecimientos.
2. Estadística Inferencial: Esta parte de la estadística, permite extraer
conclusiones o predecir el comportamiento de una población en base a
los resultados de su muestra elegida al azar.
Población: Es una colección de individuos u objetos que poseen al menos
una característica en común; puede ser finita o infinita; es finita cuando sus
elementos son contables, e infinita, cuando son incontables. Generalmente
la población está asociada a números grandes; por ejemplo la población de
los habitantes de la provincia de Huaura, que es numerosa tiene una
característica en común, como el de estar habitando en ese lugar, etc.
Parámetro de una Población. Es una medida resumen que describe una
característica representativa; como unidades de medida se tienen la media
aritmética o el promedio al que se le simboliza por , la desviación
estándar al que se le simboliza por , su varianza poblacional 2 y la
proporción poblacional p.
Muestra: Parte de la población elegida mediante un proceso técnico
llamado muestreo; sus medidas se llaman estadísticos, dentro de los
cuales se tienen a la media aritmética y la desviación estándar,
simbolizados por x y s respectivamente; de igual manera se tiene la
varianza muestral y la proporción muestral. Ejemplo: El promedio de
ingresos mensuales de un grupo de ingenieros químicos que laboran en el
sector privado, seleccionados al azar, se le simboliza por x, y s a su
desviación estándar, si ambos se refieren a muestras poblacionales, de otro
modo se los denotará por y respectivamente.
Las técnicas de muestreo indican la forma cómo se seleccionarán
los elementos representativos de la población; para esto existen
básicamente cuatro tipo de muestreos: muestreo aleatorio simple,
8
muestreo sistemático, muestreo estratificado y muestreo por
conglomerados.
a) El muestreo aleatorio consiste en individualizar a cada elemento de
la población y por sorteo o al azar, se selecciona a la muestra; esto
quiere decir quiere decir que cada elemento de la población tendrá
las mismas oportunidades de salir seleccionado. También puede
asignarse a cada elemento de la población un número, y
seleccionando al azar ése número, elegir al elemento muestral.
b) El muestreo sistemático sigue una técnica parecida al anterior, con
la diferencia que a la población se le asigna un número correlativo
y se los divide en tantos grupos como elementos muestrales desea
obtenerse, luego del primer grupo se selecciona a la muestra
utilizando la técnica anterior, éste número más el número total del
subgrupo, será la segunda muestra, y así sucesivamente. El
ejemplo aclarará el concepto: Supongamos que una población está
compuesta de 1 000 individuos y queremos obtener diez individuos
que los representen; para ello numeramos del 1 al 1 000 a los
individuos y lo dividimos en diez grupos de cien personas; del
primer grupo seleccionamos al azar a un individuo, si a éste le
corresponde el número 55, el siguiente será el 155, el tercero el
255, y así sucesivamente.
c) Muestreo sistemático a los elementos de la población se los divide
en grupos homogéneos: por sexo, grupos de edad, procedencia,
etc., y sus elementos muestrales son seleccionado siguiendo
cualquiera de las dos técnicas anteriores.
d) Muestro por conglomerados a los elementos de la población se los
divide en conglomerados más pequeños, luego se selecciona al azar
un conglomerado y de allí a los elementos muestrales, siguiendo las
técnicas anteriores.
Variable. Es una característica de la población o de la muestra el que
puede tomar diferentes valores. Se clasifican en dos grandes grupos,
cualitativa o cuantitativa; como ya hemos mencionado, las variables
cualitativas expresan una relación de cualidad como blanco, negro o rojo,
en cambio las cuantitativas expresan relaciones numéricas de cantidad; con
las variables cualitativas pueden representarse en forma numérica o de otra
forma pero no pueden desarrollarse operaciones algebraicas. Ejemplo, si la
variable estado civil de una persona se expresara como: Casado por 0,
Soltero por 1, Divorciado por 2 y Viudo por 3, entonces los números 0, 1,
9
2, y 3 no indican ninguna relación entre sí, con los que podrían realizarse
operaciones aritméticas, sólo indican estados diferentes; sin embargo con
las variables cuantitativas si pueden desarrollarse las operaciones
aritméticas; estas pueden ser discretas o continuas; se dice que es discreta
cuando las variables toman valores enteros; por ejemplo cuando se cuenta
el número de personas que están reunidos en una sala de conferencias, y
continuas cuando toman cualquier valor dentro de un intervalo; por
ejemplo, el tiempo es una variable continua.
Las variables también pueden ser independientes o dependientes; se
dice que la variable es independiente cuando su valor depende de sí misma,
es decir que no está asociado a ningún otro factor; en cambio, una variable
es dependiente cuando su valor está asociado a la variable independiente;
por ejemplo, cuando se estudia la relación entre el nivel de consumo y el
nivel de ingresos de una persona, se tienen dos variables: consumo e
ingresos, el problema es decidir cuál es independiente y cuál dependiente;
es obvio que el nivel de consumo de una persona depende de su ingreso,
entonces se dice que el consumo es la variable dependiente y el ingreso la
variable independiente; de otro modo, puede afirmarse que el ingreso nada
tiene que ver con el nivel de consumo, por lo que aquel es una variable
independiente; de igual manera, el rendimiento académico de un alumno y
las horas dedicadas al estudio son dos variables, el rendimiento académico
es una variable dependiente, porque es dable suponer, que cuanto más horas
de estudio se dedica el alumno, su rendimiento académico tenderá a ser
mejor, de otra manera, ésta decaerá.
Se dice que una variable es aleatoria, cuando independientemente
puede tomar cualquier valor, sin estar sujeto a la voluntad del que lo
manipula; las variables aleatorias son parte inherente de la estadística,
debido a que se trabaja solo con variables aleatorias.
RReepprreesseennttaacciióónn ggrrááffiiccaa ddee ddaattooss.. Los datos procesados, según
correspondan a las necesidades de los interesados, pueden representarse
gráficamente, los cuales permitirán una mejor interpretación; para ello hay
distintas formas de hacerlo, dependiendo de la manera cómo se los quiere
representar y qué es lo que más se quiere resaltar; entre los diferentes tipos
de representarlos tenemos: gráficas de barras, gráficas circulares o de
pastel, gráficas de línea, histogramas, gráficas de áreas, etc., cada una de
ellas contienen sus propias particularidades y obedecen a una forma de
representar el comportamiento de los datos; en el mercado existen
diferentes tipos de software que simplifican el trabajo humano para hacer
10
estas representaciones, la hoja de cálculo Excel, la más accesible a todos,
proporciona una serie de modelos de estas gráficas que pueden aprenderse a
utilizarlo fácilmente.
GGrrááffiiccoo ddee bbaarrrraass:: Pueden representarse datos cualitativos o cuantitativos;
este gráfico se expresa como un conjunto de rectángulos, cuya base
representa una característica del dato y la altura el número de
observaciones o cantidades proporcionales a éste.
Ejemplo 1.1 Consideremos el caso de una encuesta desarrollada a u grupo
de personas donde se averiguó su estado civil; la tabla 1.1 proporciona el
resumen obtenido.
TTaabbllaa 11..11 Estado civil de un grupo de pobladores
Estado civil Número de
personas
Soltero 12
Casado 25
Viudo 8
Divorciado 10
Los datos proporcionados en esta tabla corresponden a los del tipo
cualitativo, ya que no se pueden sumar solteros con casados, etc. Estos
datos pueden representarse mediante el diagrama de barras bidimensionales
en la siguiente forma:
0
5
10
15
20
25
30
Soltero Casado Viudo Divorciado
Fig. 1.1 Gráfico de barras de la Tabla 1.1
11
También pueden representarse de otra manera, como un diagrama de barras
cilíndricas, mostrado en forma horizontal.
GGrrááffiiccooss cciirrccuullaarreess:: Sirven para hacer representaciones gráficas de datos
cualitativos; el conjunto de observaciones se muestra en forma circular;
cada porción de la observación es proporcional al valor observado; las
observaciones pueden expresarse en forma porcentual o absoluta, en el
sistema de coordenadas cartesianas; una forma parecida a ésta, es la gráfica
en pastel o tarta, en el que se puede vislumbrarlo espacialmente.
0 5 10 15 20 25
Soltero
Casado
Viudo
Divorciado
Fig. 1.2 Gráfico de barras cilíndrico de la Tabla 1.1
Soltero; 12
Casado; 25
Viudo; 8
Divorciado; 10
Soltero
Casado
Viudo
Divorciado
Fig. 1.3 Gráfico de tarta de la Tabla 1.1
12
Este ejemplo, también se puede representar en forma circular, como el
siguiente:
Fig. 1.4 Gráfico circular correspondiente a la Tabla 1.1
Viudo
Soltero
Divorci
Casado
En general, la forma de representar gráficamente un dato, depende de su
respectiva naturaleza, y la forma cómo pudiese mostrar una mejor
presentación.
GGrrááffiiccooss ddee llíínneeaass:: Este tipo de gráfico está relacionado cuando existen
dos variables, una independiente y otra dependiente, o sea datos de tipo
cuantitativo y presentados en forma ordenada; cada valor de la variable
independiente va asociado con un valor de la variable dependiente,
representándose ambos en el sistema de coordenadas cartesianas; se
asocian los pares por cada uno de ellos ubicándolos en el plano, luego estos
puntos son unidos mediante segmentos de recta, tal como podemos
apreciarlo en la Fig. 1.5, correspondiente a los datos de la Tabla 1.2. sin
embargo debe comprenderse que esta característica no es excluyente solo
para datos cuantitativos, dado que los datos cualitativos también pueden
representarse, pero teniendo en cuenta que no habrá ninguna relación de
dependencia entre los datos mostrados.
Ejemplo 1.2 Consideremos el caso de dos variables, donde la
independiente denota la edad de una persona, y la dependiente su peso; la
13
relación entre estas dos variables están expresadas mediante la siguiente
tabla.
Tabla 1.2 Edad versus peso de un grupo de personas
Edad en años Peso en kilos
5 18,5
10 32,3
14 42,8
19 52,1
25 65,2
34 67,9
40 72,3
Fig. 1.5 Gráfico de línea relacionando datos de la Tabla 1.2
GGrrááffiiccoo ddee bbaarrrraass ssuuppeerrppuueessttaass:: Conocido también como barras apiladas,
es utilizado cuando se quiere resaltar el total observado respecto a uno de
ellos. La Fig. 1.6 muestra este gráfico para los datos correspondientes a lo
proporcionado en la Tabla 1.1; la comparación puede ser en forma absoluta
o en forma porcentual; en este caso en forma absoluta.
12.5
22.3
42.8
52.1
65.267.9
72.3
0
10
20
30
40
50
60
70
80
5
14
GGrrááffiiccoo ddee ttrroonnccooss:: Es parecido al gráfico de barras, con la diferencia que
se va anotando el número de observaciones que aparecen dentro de una
determinada clase de datos; esta clase de datos es conocida como el tronco,
y el conjunto de troncos proporciona el gráfico de troncos
NNúúmmeerroo ddee ccllaasseess ddee ddaattooss kk:: Para saber cuántas clases deben formarse de
un conjunto de datos, se puede seguir un criterio empírico de escoger entre
5 y 20 clases, dependiendo de la cantidad de datos que hay; también se
puede seguir otro criterio, como el conocido como la Regla de Stuges, el
cual indica que el número de clases o el número de troncos estará
constituido por el entero inmediato de k = 1 + 3,3*log10N, siendo N el
número total de datos; de este modo si tenemos 50 observaciones, entonces
habrán k = 1 + 3,3*log1050 = 7 clases de datos.
CCllaassee ddee ddaattooss:: Indica que dentro de ella, éstas tienen algunas
características comunes; por ejemplo, los alumnos en cualquier centro
educativo están agrupados en clases comunes como: primer ciclo, segundo
ciclo, etc., o primer año, segundo año, etc.
AAnncchhoo ddee ccllaassee:: Una vez determinado la cantidad de clases con las que
serán agrupados los números, será necesario determinar qué amplitud o
ancho deberá tener cada clase; para ello identificamos el mayor y el menor
y lo restamos, este resultado lo dividimos entre el número de clases, lo cual
finalmente nos dará el ancho de cada clase. Sabiendo este ancho de clase,
empezamos a formar todas las clases, comenzando desde el menor número,
hasta finalizar en el máximo.
12
25
8
10
0
10
20
30
40
50
60N
úm
ero
de
in
div
idu
os
Fig. 1.6 Gráfico de barras superpuestas para indicar el estado civil de las personas
Divorciado
Viudo
Casado
Soltero
15
Ejemplo 1.3 Consideremos que las notas promocionales de 25 alumnos
del curso de Estadística y Probabilidades fueron los siguientes: 02, 12, 16,
14, 11, 10, 09, 06, 13, 04, 05, 08, 12, 11, 14, 10, 17, 07, 06, 13, 15, 10, 08,
18, 09. Construya un diagrama de troncos para este tipo de observaciones.
Solución. Como el número de observaciones son pocos, no es necesario
seguir la regla de Stuges, y podemos aplicar el criterio empírico de
subdividirlos en cinco clases, de ancho cuatro, donde el menor número será
cero y el mayor 20; de este modo construimos el rango de notas por cada
clase, y vamos marcando con un rectángulo el número de observaciones
que van apareciendo en cada clase, conforme se muestra en Fig. 1.7; por
ejemplo observamos que en la clase del 00 al 04, hay solo una nota, por lo
que se anota con el respectivo rectángulo.
Fig. 1.7 Gráfico de troncos, indicando la distribución de notas
promocionales de los alumnos del curso de Estadística y
Probabilidades. Rango de notas Número de alumnos
[00 – 04[ █
[04 – 08[ █ █ █ █ █
[08 – 12[ █ █ █ █ █ █ █ █ █
[12 – 16[ █ █ █ █ █ █ █
[16 – 20[ █ █ █
GGrrááffiiccoo ddee hhoojjaass:: Tiene las mismas características que el caso anterior,
con la diferencia que los datos que aparecen en el tronco son anotados uno
por uno, de modo que las características de la información se vean con más
detalles.
Continuando con el caso del ejemplo anterior, observamos que en
la primera clase, del 00 al 04, solo hay una nota el 02; entonces en esta
clase escribimos el 2; de igual modo, observamos que en clase
correspondiente del 16 al 20, hay tres notas: 16, 17 y 18, entonces en esta
clase, escribimos el 6, 7 y 8; y así sucesivamente; la Fig. 1.8 muestra los
resultados obtenidos.
16
Fig. 1.8 Gráfico de hojas del ejemplo de las notas promocionales del
curso de Estadística y Probabilidades.
Rango de notas
Número de alumnos
[00 – 04[ 2
[04 – 08[ 6 4 5 7 6
[08 – 12[ 1 0 9 8 1 0 0 8 9
[12 – 16[ 2 4 5 2 4 3 5
[16 – 20[ 6 7 8
Ejemplo 1.4 Interpretación y análisis de datos: A continuación vamos a
presentar un caso de interpretación y análisis de datos, mediante su
representación gráfica; para ello, consideremos que en una determinada
empresa manufacturera, existen tres tipos de máquinas llenadoras de
botellas de cerveza, según la procedencia del país donde se los fabricó, los
que funcionan en base a microprocesadores y supervisados por un personal
técnico especializado; estas máquinas trabajan en los tres turnos del día; la
primera es de marca alemana, la segunda italiana y la tercera brasilera; los
registros de llenado de botellas de cerveza, por hora en miles de unidades
se indican en la siguiente tabla.
Tabla 1.3. Registro de llenado de botellas en miles de unidades/ hora,
de acuerdo a la procedencia de los equipos, según turnos de trabajo
Turno de Trabajo
Llenadora botella
según marca de
procedencia
Mañana Tarde Noche
Brasilero 25 32 26
Alemán 40 35 31
Italiano 35 37 39
Represente gráficamente el comportamiento de esta producción y analice
las observaciones más impactantes de acuerdo al tipo de máquina,
procedencia y otros elementos.
Solución:
Las características de presentación de estos datos pueden expresarse como
en las dos siguientes figuras.
17
Fig. 1.9 Gráfico de tipo columna que registra el comportamiento de los
datos bivariados de la Tabla 1.3
Los datos observados se están representando mediante un gráfico de
columnas tridimensionales; en ella observamos que la producción de las
máquinas brasileñas son menores que sus similares, por lo que podemos
decir, que éstas son menos productivas que sus similares; además podemos
apreciar también, que quien mantiene uniformidad en la producción es la
máquina italiana, etc. Las mismas conclusiones también pueden extraerse
utilizando el gráfico tubular, representado horizontalmente en la siguiente
página.
0
5
10
15
20
25
30
35
40
MAÑANA TARDE NOCHE
25
32
26
40
35
31
3537
39
BRASILERO
ALEMAN
ITALIANO
18
Fig. 1.10 Gráfico tipo tubular horizontal que representa el
comportamiento de los datos bivariados de la tabla 1.3.
EEjjeerrcciicciiooss ssoobbrree eessttaaddííssttiiccaa ddeessccrriippttiivvaa
1.1. Defina el concepto de estadística.
1.2. ¿Por qué puede ser importante para su carrera profesional, el estudio
de la estadística?
1.3. ¿De cuántas formas se clasifica la estadística, y de qué trata cada una
de ellas?
1.4. ¿Qué diferencia existe entre un estadístico y un parámetro?
Proporcione ejemplos para cada caso,
1.5. ¿A qué se define una población, y a qué una muestra?
1.6. ¿Cuál es la diferencia entre una muestra y una muestra aleatoria.
1.7. Enuncie las técnicas de seleccionar muestras aleatorias.
1.8. ¿En qué se diferencia un muestreo aleatorio simple de un muestreo
estratificado?
1.9. Explique las diversas formas en que pueden obtenerse los datos, ¿y
cuál considera ser la más apropiada?
1.10. ¿En qué se diferencia una encuesta de una entrevista?
0 10 20 30 40
MAÑANA
TARDE
NOCHE
ITALIANO
ALEMAN
BRASILERO
19
1.11. ¿Qué técnica utilizaría para recopilar datos acerca del ingreso diario
que captan los negocios dedicados a brindar servicios de Cabinas de
Internet en las provincias de Huaura y Barranca?
1.12. ¿Porqué una entrevista podría ser mejor que una encuesta?
1.13. ¿En qué casos es más conveniente observar, antes que encuestar o
entrevistar, para recopilar datos?
1.14. Defina el concepto de variable, y enuncie sus clasificaciones.
1.15. Defina las escalas de medición de los datos.
1.16. ¿Pueden desarrollarse operaciones aritméticas con los datos
ordinales?, explique.
1.17. ¿De qué manera los datos pueden convertirse en información?,
proporcione ejemplos de estos casos.
1.18. ¿De qué manera puede explicarse objetivamente los datos
procesados?
1.19. ¿En qué casos se pueden usar las gráficas lineales?
1.20. Si usted está elaborando un nuevo producto y desea lanzarlo al
mercado para que sus clientes potenciales puedan comprarlo, y
como tal no sabe si este tendrá o no aceptación por parte de este
público, a fin de obtener mejor información sobre el estado de
ánimo de estos potenciales clientes, ¿qué técnica estadística
utilizaría para obtener esta información?
1.21. Explique las formas en que pueden graficarse los datos procesados.
1.22. En los gráficos circulares ¿pueden representarse variables
cualitativas?
1.23. La siguiente tabla presenta resultados del informe sobre desarrollo
humano hecho en el Perú:
Esperanza de vida al nacer 68,3 años
Hombres 65,9 años
Mujeres 79,9 años
Tasa de alfabetización de adultos 88,7%
Hombres 93,9%
Mujeres 83,7%
a) ¿Al conjunto de estos elementos puede considerarse como
estadística descriptiva o estadística inferencial?
b) Represente gráficamente el comportamiento de estas variables, de
acuerdo a los rubros principales, y dentro de ellos sus sub grupos.
1.24. La siguiente tabla muestra la evolución de siembras de algunos
productos agrícolas durante la campaña de producción, en el Perú,
comprendida entre los períodos del 2002 al 2004.
20
Campaña Agrícola de Producción de Alimentos: Período 2002- 2004
Producción en Toneladas métricas Productos
Cultivados 2002-2003 2003-2004
Variación:
Tn
Variación
Porcentual
Total Nacional 1 388 912 1 339 930
Maíz amiláceo 227 654 220 734
Maíz amarillo 154 383
Papa amarilla 206 348 176 534
Papa negra 117 364
Arroz en cáscara 152 387 173 232
Cebada grano 106 201 99 864
Trigo 82 737 76 453
Yuca 293 822 252 732
Algodón rama 57834 60283 Fuente: …..
a) Complete los casilleros vacíos con sus respectivos datos y
explique las características de las tendencias de cultivos de estos
productos.
b) ¿De qué manera puede explicarse el contenido de estas cifras?
1.25. ¿En qué circunstancias los siguientes numerales pueden ser
considerados como poblaciones, y en qué otros pueden ser muestras?:
a) Los estudiantes de la UNJFSC.
b) Los estudiantes del sistema universitario peruano.
c) Cemento Tipo V, exportada el pasado año a los mercados del grupo
andino.
d) Las mujeres que mueren por aborto en el Hospital de Barranca.
e) Los automóviles que circulan por el frontis de la Universidad en un
día cualquiera.
f) Cantidad de toneladas de cemento producidos en el Perú.
g) Consumo de ácido cítrico en la industria alimentaria durante el mes
pasado.
1.26. Redondee los siguientes números en las siguientes cifras decimales:
a) 123,4859 tres decimales
b) 0,89755 cuatro decimales
c) -85,4855 dos decimales
d) 100,355 un decimal
1.27. ¿Cuáles de las siguientes proposiciones son verdaderas, y cuáles
falsas?, sustente su respuesta:
a) Una población es una agrupación de elementos inconmensurables.
21
b) Un estadístico representa el dato de una población.
c) La estadística inferencial proporciona conocimientos generales.
d) La estadística inferencial permite generalizar conclusiones.
e) Una muestra puede tener elementos infinitos.
f) Los datos cualitativos pueden expresarse gráficamente mediante
diagrama de barras o diagramas circulares.
g) Una encuesta proporciona mejores elementos de información que
una entrevista.
h) La estadística descriptiva permite mostrar casos particulares.
i) Una muestra aleatoria no necesariamente representa a la
población.
j) La estadística es una técnica cualitativa que permite procesar
datos.
k) El parámetro es un valor representativo de una muestra.
l) Los estadísticos y los parámetros son los mismos.
1.28. El siguiente cuadro muestra el proyecto de presupuesto asignado al
Ministerio de Agricultura para el año 2006: Sector agricultura: Presupuesto 2005-2006
Millones S/. Variación Estructura %
Pliego PIA 2005 PIA 2006 Mill S/ % 2004 2005
Minag 373,4 414,5 41,2 11,0 68,1 72,5
Senasa 55,9 48,3 -7,6 -13,6 10,2 8,4
Conacs 5,3 5,3 0,0 0,4 1,0 0,9
Inrena 68,0 57,7 -10,3 -15,1 12,4 10,1
INIEA 45,9 45,7 -0,2 -0,4 8,4 8,0
Total 548,5 571,6 23,1 4,2 100,0 100,0 Fuente: La revista Agraria, N° 68, Setiembre del 2005. Diario la República, 14/10/05
Represente gráficamente el comportamiento de estos datos, y explique
las características asignadas a cada pliego, así como los cambios
totales, según muestra el cuadro.
1.29. En la provincia de Huaura, un día cualquiera se entrevista a un
conjunto de 200 personas para saber si estos estarían de acuerdo que en
la ciudad de Huacho se constituya una universidad particular; de este
grupo, 80 manifestaron no estar de acuerdo con ello:
a) ¿Cuál es la muestra?
b) ¿Cuál es la población?
c) La respuesta proporcionada, ¿a qué tipo de información
corresponde?
22
1.30. En los siguientes casos, ¿cuáles representan variables aleatorias
discretas y cuáles continuas?
a) Cantidad de kilocalorías que consume por día una persona.
b) Toneladas de cemento producido mensualmente por una planta.
c) Número de ladrillos comercializados por una distribuidora de
materiales de construcción.
d) Tiempo de llegada entre los clientes de un banco a una ventanilla.
e) La difusión de la luz en el firmamento.
f) Número de llamadas telefónicas registradas por la operadora de una
central telefónica.
g) Tiempo de llegada de un atleta en una maratón de 10 kilómetros.
h) Número de pacientes infectados con el virus del SIDA en un
hospital.
i) Cantidad de gas emitido por una fundición en un turno de trabajo.
j) Volumen de combustible transportado por un camión cisterna.
k) Nivel concentración de plomo en la sangre de una persona.
l) Virus y bacterias lanzadas en el escenario de una guerra química.
1.31. ¿Es la materia una variable aleatoria continua?
1.32. Una empresa cuenta con cuatro máquinas que les permite envasar
cajas de aceite; estas máquinas trabajan a tres turnos por día; los
registros de cantidad de aceites envasados en los tres turnos de trabajo
se indican en la siguiente tabla.
Registro de cajas de aceite envasadas según tipo de máquinas y
turnos de trabajo. Tipo Máquina Mañana Tarde Noche
A 302 312 366
B 240 401 411
C 334 286 298
D 285 253 319
Represente gráficamente el comportamiento de esta producción e
indique las observaciones más resaltantes.
1.33. ¿Qué tipo de variable representa el sonido?
1.34. ¿Puede considerarse el criterio de clasificación de las razas, en el
reino animal, como variables, y si así lo fuere cómo lo graficaría?
1.35. Como consecuencia del éxito de los megamercados implementados
en la ciudad de Lima, los promotores de esta están interesados en abrir
nuevos centros comerciales en diferentes ciudades del país; para ello
deben hacer estudios de mercado de modo que permita evaluar la
perceptibilidad de los clientes potenciales; para tales fines se considera
23
como factor de evaluación, la ubicación, la oferta de precios, trato de
personal, sistema de créditos y otros factores (higiene, entretenimiento,
remates, facilidades de crédito, etc.) en diferentes días de la semana; de
este modo se entrevistó a 500 clientes potenciales y se determinó los
siguientes resultados: El 23 % decía que un factor importante era la
ubicación del centro comercial, el 27 % decía que era importante la
oferta de precios, un 11% decían que era importante el sistema de
créditos, 20% optaba como factor importante el trato de personal, y el
resto se inclinaba por otros factores. Represente gráficamente el
comportamiento de estas respuestas y explique las conclusiones que
pueda obtener.
1.36. La siguiente tabla muestra la composición atómica de la bacteria
Escherichia coli en los seres vivos:
Porcentaje de composición atómica de la bacteria Escherichia coli
en los seres vivos Elemento Humanos Alfalfa Bacterias
Carbono 19,37 11,34 12,14
Hidrógeno 9,31 8,72 9,94
Nitrógeno 5,14 0,83 3,04
Oxígeno 62,81 77,90 73,68
Fósforo 0,63 0,71 0,60
Azufre 0,64 0,10 0,32 TOTAL 97,90 99,60 99,72
Fuente: Biología; Helena Curtis; N. Sue Barnes; Ed. Panamericana, Sexta ed.
Construya un gráfico y explique cualitativa y cuantitativamente la
existencia de estos elementos en los seres vivos.
1.37. Según estadísticas de la DIPROCT/PNP, relacionadas con las
causas de los accidentes de tránsito ocurridos en Lima metropolitana,
en el período Enero – Octubre del 2004, fueron atribuidos los
siguientes factores: El 27,7% se debía a la Imprudencia del conductor;
el 17,9% a la Imprudencia del peatón; el 13,5% a la Ebriedad del
peatón; el 12,1% por Exceso de velocidad; el 6,5% por Ebriedad del
conductor, y el porcentaje restante a otros factores (mal
funcionamiento de los semáforos, malas condiciones de la pista, etc.);
también en relación a estas causas, los accidentes fueron reportadas en
diferentes días de la semana; de este modo se reportó que el 35% de
ellos ocurrió los días sábados, el 40% los domingos, y el 25% otros
días. Mediante una representación gráfica del comportamiento de este
24
fenómeno explique las principales causas de los accidentes,
considerando que durante este período se registraron 562 accidentes.
1.38. La siguiente tabla muestra datos mundiales de producción de
camote anaranjado durante el año 2003:
Camote: datos mundiales 2003
Superficie
miles h.
Rendimiento
t/h
Producción
millones t
Mundo 9 026.10 13,49 121 799
Asia 6 126,71 17,56 107 583
África 2 494,99 4,32 10 787
América 291,05 9,58 2 788
Oceanía 113,35 5,66 641 Fuente: ……..
Represente gráficamente las características de esta producción y
explique la naturaleza de los datos.
1.39. En los siguientes casos indique cuál es la variable independiente, y
cuál la variable dependiente:
a) Temperatura vrs. Calor.
b) Velocidad vrs. Distancia recorrida.
c) Consumo vrs. Nivel de ingresos.
d) Peso vrs. Estatura de una persona.
e) Utilidad vrs, Oferta.
f) Cantidad de software vendido vrs. Número de estudiantes de
informática.
g) Rendimiento académico vrs. Horas de estudio.
h) Número de habitantes de una ciudad vrs. Tiempo transcurrido.
i) Velocidad de reacción vrs. Presión.
j) Peso de una persona vrs. Calorías consumidas.
k) Compra de vestidos vrs. Nivel cultural de la persona.
l) Estatura de una persona vrs. Edad de la misma.
m) Producto bruto interno vrs. Años transcurridos
n) Llegada de turistas al país vrs. Nivel de consumo del país
o) Preferencia de platos típicos vrs. Nivel de información respecto a
la existencia de platos típicos.
p) Fortalecimiento del Nuevo Sol, frente a la moneda norteamericana.
q) Alza del precio de los pasajes. Vrs. Precio del petróleo.
r) Aumento del terrorismo a nivel internacional vrs. Situación
económica de los países en vías de desarrollo.
s) Contaminación ambiental vrs. destrucción de la capa de ozono.
25
t) Número de postulantes a la universidad vrs. número de egresados
de la misma.
1.40. Utilizando la matriz de insumo-producto de 1994 que el Mincetur
utiliza, se ha determinado el empleo neto resultante de la aplicación del
TLC, como se muestra en la siguiente tabla:
Efectos directos del TLC Perú_EE.UU. en la creación de puestos
de trabajo Sector Efecto directo
por incremento
de exportaciones
(1)
Efecto directo
por incremento
de importaciones
(2)
Saldo neto
Número de
puestos de
trabajo (1-2)
Total 32 552 -27 108 5 444 Agricultura, caza
y silvicultura 18 578 -13 552 5 026
Fabricación de
textiles 1 870 - 1 798 72
Fabricación de
prendas de vestir 4 161 -842 3 219
Extracción de
minerales 1 733 -109 1 624
Otros sectores 6 210 -10 807 -4 597 Fuente: Bruno Seminario y Oswaldo Molina (setiembre 2004) Revista Agraria
N° 60 - La República, Nov. 2004
Gráficamente, analice el comportamiento de estas variables
1.41. El régimen del gobierno de Alberto Fujimori, en los años de 1990 al
2000, destinó los fondos de la privatización del siguiente modo: para el
pago de la deuda externa US $ 1 053, para la compra de armas $ 992,
para el gasto social politizado $ 1 356, para el gasto social normal $
528, y para otros rubros la cantidad de $ 429, todas estas cifras en
millones. Construya una tabla y su respectivo gráfico indicando el
comportamiento de estos pagos y explique, desde su concepción, la
naturaleza de estos ¿Considera que estos gastos estuvieron bien
orientados, o es que generó una fuente de corrupción, como se
considera hoy en estos tiempos?
1.42. ¿Para qué sirve la Regla de Stuges?
1.43. ¿Qué información proporciona un diagrama de hojas?
1.44. ¿Hasta cuántas clases pueden conformarse en un conjunto de
observaciones?
26
1.45. La siguiente tabla presenta cifras proyectadas del presupuesto de
ingresos del gobierno del Gobierno Central, para el año 2006, en
millones de Nuevos Soles:
Proyección de ingresos del Gobierno Central
(Millones de Nuevos Soles)
Años 2002 2003 2004 2005 2006
1.Gob. Central 28 307 30 872 33 426 36 113 39 529
Tributarios 24 048 26 953 29 347 31 698 34 598
Renta 6 011 8 020 8 335 9 516 10 642 Importación 2 487 2 560 2 782 2 873 2 998 IGV (incluye IPM) 12 611 13 958 15 690 16 534 18 323 ISC 4 184 4 550 5 000 5 370 5 796 Otros ingresos 1 737 1 295 1 340 1 414 1 165 Devoluc. Tributos -2 983 -3 430 -3 800 -4 008 -4 327 No Tributarios 4 258 3 919 4 079 4 416 4 931
2. Otras entidades 5 667 5 555 5 980 6 212 6 491
3. Total Ingresos 33 974 36 427 39 407 42 326 46 019
Explique el comportamiento de las proyecciones de estas cifras
macroeconómicas.
1.46. En la siguiente tabla se proporciona información de la evolución de
los sueldos y salarios en el país, en el último semestre del 2006, cifras
proporcionadas por el Ministerio de Trabajo, y publicadas por el Diario
el Comercio, el día 14 de julio de 2007.
Remuneraciones mensuales en Nuevos Soles
Sector productivo Sueldo de
Empleados
Salario de
Obreros
Agricultura 2 024 741
Minería 4 374 2 385
Industria 2 444 953
Electricidad, gas y agua 2 938 1 787
Construcción 2 015 1 236
Comercio 2 153 946
Transporte, almacenamiento
y comunicaciones
2 300 1 040
Establecimientos financieros
y seguros
2 772 993
Servicios gubernamentales 1 905 841
27
Comente, analítica y gráficamente el comportamiento de estas
remuneraciones en los diferentes sectores productivos de nuestra
sociedad.
1.47. Considere que mediante una encuesta desarrollada a través de los
alumnos, acerca de los ingresos mensuales percibidos por los
pobladores de una determinada región, permitieron recaudar los
siguientes sueldos y salarios: 1400, 1890, 1600, 1400, 1300, 750, 900,
1100, 1250, 650, 2400, 1700, 1350, 1380, 1540, 1560, 1610, 1615,
1610, 840, 1100, 1205, 1100, 760, 2300, 1990, 2000, 2308, 3000,
1300, 1265, 1150, 950, 980, 1200, 1950, 1875, 2654, 2535, 2900,
1500, 1620, 1290, 1350, 1410, 1580, 1700, 1890, 1900, 1856, 1700,
1650, 1740, 1680, 1800, 2100, 2110, 2200, 1985. Construya un
diagrama de árbol y un diagrama de hojas, de modo que represente
gráficamente el comportamiento de los ingresos mensuales; para ello
haga una subdivisión de estos datos en cinco sub intervalos.
1.48. ****
28
Sección 2
Frases para meditar:
Cuando hayas logrado modificar tus
pensamientos, entonces empezarán a
surgir nuevos sentimientos y habrás
dado el primer paso en tu camino hacia
tu libertad
Que las equivocaciones o el error te
sirvan de lección, haz el propósito de no
repetirlas.
El enemigo no es tan grande como
parece. Lo que sucede es que lo
vemos así porque estamos de
rodillas... ¡de pie¡
Distribuciones de Frecuencia
Consideremos el siguiente ejemplo: supongamos que de una
encuesta hecha a un grupo de alumnos de una universidad, se han
registrado sus respectivas edades en años, cuyos resultados fueron los
siguientes: 23, 25, 17, 26, 20, 21, 26, 24, 19, 16, 20, 23, 29, 19, 17, 23,
25, 24, 19, 16, 15, 22, 23, 27, 31, 24, 21, 20, 18, 25, 23, 28, 21, 24, 24, 18,
20, 23, 22, 19, 22, 17, 26, 23, 24, 22, 21, 20, 29, 23, 30.
Estos datos de por sí no proporcionan mucha información
respecto a la edad de los alumnos; así por ejemplo podría interesarnos
saber cómo están distribuidos estas edades, o qué porcentaje de alumnos
son menores de 22 años, o saber si existen demasiados alumnos mayores,
o qué tendencias muestran el comportamiento de estas edades, etc.; para
poder analizarlo y encontrar una información utilitaria, es necesario
agruparlos en un determinado número de clases, tal como se explicó en el
capítulo anterior; ello nos permitirá analizar el conjunto de ellos y extraer
conclusiones que podrán apoyar una mejor toma de decisiones.
Agrupándoles en cualquier determinado número de clases
podremos apreciar en primera instancia, que las edades de los alumnos
están comprendidos entre los 15 y 31 años, el alumno de menor edad, o el
más joven tiene 15 años, y el de mayor edad tiene 31 años; una
29
apreciación simple nos permitirá manifestar que el rango de edades
es de 16 años; de este modo podemos seguir prosiguiendo con una serie
de análisis los cuales nos permitirán encontrar otros elementos de
información, induciéndonos a una toma de decisiones en un proceso de
gestión, que pueden afectar los resultados de la organización. Para
uniformizar y comprender algunos términos, es preciso conocer los
términos utilizados en la estadística, que a continuación mostramos.
AAmmpplliittuudd ddee ddaattooss oo rraannggoo ddee ddaattooss:: Es la diferencia entre el mayor
valor observado y el menor valor observado.
CCllaassee:: Es un grupo de datos que contienen por lo menos una
característica en común. Ejemplo; en el servicio militar se agrupa a todas
las personas por año de nacimiento; si nacieron en 1988, se dice que
pertenecen a la clase 88, si nacieron en el año 2000, se dice que
pertenecen a la clase 2000, etc.; en los colegios los alumnos están
clasificados de acuerdo al año que están cursando; a los sectores
socioeconómicos de la sociedad se los pueden clasificar en cinco clases,
como las que conocemos, en concordancia a sus ingresos familiares: A.
B, C, D, E; de este modo los que pertenecen a la clase A puedes estar
incluidos las familias cuyos niveles de ingresos mensuales son los más
altos que los demás, y así sucesivamente.
AAnncchhoo ddee ccllaassee oo iinntteerrvvaalloo ddee ccllaassee:: Es la diferencia entre el mayor
valor y el menor valor de la respectiva clase.
NNúúmmeerroo ddee ccllaassee:: Como se explicó en el capítulo anterior, dependiendo
de la cantidad de observaciones, los datos pueden ser agrupados entre 5 y
20 clases; pero si aplicamos la regla de Stuges: K = 1 + 3,3 log10N,
podemos tener un número de clases ya explícito, donde K representa el
número de clase y corresponde a su entero inmediato y N el total de
observaciones.
Dividiendo la amplitud de datos entre el número de clases, se obtiene la
amplitud de clase = K
datosdeAmplitud __, que también es conocida
como intervalo de clase o ancho de clase.
30
MMaarrccaa ddee ccllaassee:: Es el punto medio de una clase, igual a xi =
2
1ii LL donde Li representa el límite inferior de la clase y Li+1 su
límite superior.
NNúúmmeerroo ttoottaall ddee oobbsseerrvvaacciioonneess:: Es la suma total de los elementos de la
población N o muestra n, y es N = n= x1 + x2 + …+xk, donde cada valor
de x representa un valor observado; cuando los datos se presentan
agrupados en clases se representan por N = n = ki
i
if1
siendo fi el
número de veces que aparece un valor para una clase i.
FFrreeccuueenncciiaa aabbssoolluuttaa:: Es el número de observaciones que aparece en una
clase, se le denota por fi..
FFrreeccuueenncciiaa rreellaattiivvaa:: Es la relación entre la frecuencia absoluta y el
número total de observaciones; también expresa una proporción de la
clase o un porcentaje de las observaciones, se le denota por hi = N
fi.
FFrreeccuueenncciiaa aabbssoolluuttaa aaccuummuullaaddaa FFrr:: Es la suma acumulada de
frecuencias absolutas correspondientes a la clase r; está expresado por
Fr = r
i
rf1
.
FFrreeccuueenncciiaa rreellaattiivvaa aaccuummuullaaddaa HHrr:: Es la suma acumulada de las
frecuencias relativas correspondientes a la clase r; de igual manera se lo
expresa por Hr =
r
i 1
ih .
TTaabbllaa ddee ddiissttrriibbuucciioonneess ddee ffrreeccuueenncciiaa:: Es la tabla donde se muestra en
forma cuantitativa las clases, marcas de clase, frecuencias de clase
(frecuencias absolutas y relativas), y frecuencias acumuladas (absolutas
y relativas), todas ordenadas en forma ascendente.
La tabla 2.1, denotada tabla de distribución de frecuencias
permite presentar de una manera objetiva el comportamiento de las
edades de una muestra de 820 alumnos captados de una universidad.
Estas edades se han agrupado en seis clases cuyos anchos tienen la
31
misma amplitud, presentados en un intervalo semi abierto por la
derecha; la primera clase está comprendida entre los 14 y 17 años, sin
incluir a esta última, y así sucesivamente. El rango total de las edades de
estas observaciones varía entre: 32 – 14 = 18 años, dividido entre 6,
proporciona un ancho de clase de 3 años.
Tabla 2.1 Distribución de frecuencias de edad de los alumnos
de la Universidad en el año …. Clase:
I
Marca de
clase
xi
Frecuencia
absoluta
fi
Frecuencia
relativa
hi
Frecuencia
absoluta
acumulada
Fi
Frecuencia
relativa
acumulada
Hi
[ 14 - 17[ 15,5 65 0.0793 65 0.0793
[ 17 - 20[ 18,5 167 0.2037 232 0.2829
[ 20 - 23[ 21,5 321 0.3915 553 0.6744
[ 23 - 26[ 24,5 186 0.2268 739 0.9012
[ 26 - 29[ 27,5 64 0.0780 803 0.9793
[ 29 - 32[ 30,5 17 0.0207 820 1.0000
Total 820
Fuente:….
Elaboración: …
NNoottaa::
1. Para construir esta tabla se omitió la regla de Stuges, por cuestiones de
comodidad y practicidad es que se dispuso esta forma de presentarlo.
2. Cuando se presentan tablas que proporcionan cualquier tipo de información,
deberán indicarse, cuándo y dónde se los obtuvieron, los cuales pueden ser
indicados a través de la Fuente, y si éstos fueron procesados previamente
por el autor, los cuales pueden ser indicados en Elaboración; de este modo
estaremos mostrando que los datos con los cuales trabajaremos y con los que
eventualmente podremos tomar decisiones, tendrán sustento sólido, dado que
están basadas en situaciones objetivas o reales.
HHiissttooggrraammaa:: La definición clásica manifiesta que este es un conjunto de
rectángulos formados por las clases y sus respectivas frecuencias
absolutas o relativas; con el avance de la informática y el desarrollo de
nuevos paquetes de software, este concepto no se presenta rigurosamente
como tal, dado que los histogramas no necesariamente pueden presentarse
tal como lo manifestado, dado que existen otras formas también de
hacerlo; si utilizamos el espacio tridimensional, pueden presentarse en
32
forma cilíndrica o formas de paralepípedos, etc.; en las
siguientes figuras se presentan diversas formas de histogramas para un
solo tipo de casos.
De este histograma podemos extraer algunas conclusiones:
a) Pocos son los alumnos comprendidos entre los 14 y 17 años.
b) Alumnos comprendidos entre los 29 y 32 años, representan una
minoría respecto al total.
c) La mayor cantidad de alumnos están comprendidos entre
lo s 20 a 23 años.
d) El promedio de edad de los alumnos está comprendido entre los 20 y
23 años.
e) La mayoría de los alumnos se concentran alrededor de los 20 a 23
años, etc.
La figura 2.3 permite apreciar el comportamiento de edades de los
alumnos del mismo caso.
14 -17
17 - 20
20 -23
23 -26
26 -29
29 - 32
0
50
100
150
200
250
300
350
1
Can
tid
ad d
e al
um
no
s
Grupos de edad (En años)
Fig. 2.1 Histograma presentada en forma
tradicional, que muestra la distribución de las
edades de los alumnos de una universidad .
14 -17
17 - 20
20 -23
23 -26
26 -29
29 - 32
33
Fig. 2.4 Histograma mostrado en forma columnas tridimensionales, el que
presenta las distribuciones de edades de los alumnos de una universidad.
0
100
200
300
400
14 -17
17 - 20
20 -23
23 -26
26 -29
29 - 32
Can
tid
ad d
e al
um
no
s
Grupos de edad (En años)
Fig. 2.3 Histograma mostrado en forma cilíndrica, el
que presenta las distribuciones de edades de los
alumnos de una universidad.
14 -17
17 - 20
20 -23
23 -26
26 -29
29 - 32
0
50
100
150
200
250
300
350
11 -14 14 -17 17 -20
20 -23 23 -26 26 -29 29 -32
32 -35
0
65
167
321
186
64
170
34
Como podemos apreciar, el histograma de la Fig. 2.3 tiene una
presentación tridimensional, lo cual puede generar mayor impacto visual,
lo cual podría coadyuvar a una mejor toma de decisiones; en la figura 2.4
también lo podemos presentar mediante barras tridimensionales, que
también podría generar otro tipo de impacto visual.
PPoollííggoonnoo ddee ffrreeccuueenncciiaass:: Figura geométrica que se obtiene uniendo las
marcas de clase con las frecuencias posteriores (absolutas o relativas).
OOjjiivvaa oo ccuurrvvaa ddee ffrreeccuueenncciiaa aaccuummuullaaddaa:: Es una curva geométrica
formada por las frecuencias absolutas o relativas acumuladas, con sus
respectivas clases: la curva corresponde a una función continua, que tiene
como cota inferior el mínimo valor de la clase inferior, y como cota
superior el máximo valor de la última clase. En el caso de la frecuencia
absoluta acumulada, el último punto debe ser igual al total de
observaciones, y en la ojiva de la frecuencia relativa acumulada, el último
valor es igual uno.
Fig. 2. 5 Polígono de frecuencias de la distribución de edades de los
alumnos de una universidad.
Edad Frec
11 -14 0 14 -17 65 17 - 20 167 20 -23 321 23 -26 186 26 -29 64 29 - 32 17
32 - 35 0
0
50
100
150
200
250
300
350
11 -14 14 -17 17 - 20 20 -23 23 -26 26 -29 29 - 32 32 - 35
35
Fig. 2. 6 Ojiva de la distribución de edades de los alumnos.
De la tabla de frecuencias y de sus respectivas figuras
geométricas, pueden seguirse extrayendo una diversidad de
conocimientos y conclusiones, los que podrán contribuir a apoyar a una
mejor toma de decisiones; los siguientes casos proporcionan los
siguientes conocimientos:
a) Cantidad de alumnos menores de 20 años: La frecuencia absoluta
acumulada proporciona la respuesta: 232 alumnos
b) Cantidad de alumnos mayores de 23 años; de igual manera, la columna
correspondiente a la frecuencia absoluta acumulada proporciona esta
información: Total de alumnos – alumnos comprendidos entre 14 y 23
años: 820 – 553 = 267; también puede determinarse sumando los fi de las
clases que corresponden a estas edades: 186 + 64 + 17 = 267.
Por otro lado, hay que tener en cuenta que no siempre la tabla
podrá proporcionar respuestas directas como los ejemplos presentados;
cuando esta situación no se da, deberán desarrollarse procesos de
aproximación matemática utilizando interpolación y razones geométricas;
en los dos siguientes ejemplos se proporcionan los procedimientos del
que deberán seguirse cuando esos casos sucedan:
c) Cantidad de alumnos comprendidos entre los 18 y 25 años.
Como no se puede obtener una respuesta directa, se hace el
siguiente razonamiento: En la columna correspondiente a la frecuencia
065
232
553
739803 820
0
100
200
300
400
500
600
700
800
900
11 -14 14 -17 17 - 20 20 -23 23 -26 26 -29 29 - 32
36
absoluta, en la clase de 17 a 20 años, hay 167 alumnos, en la clase
de 20 a 23 años hay 321 alumnos, y en la clase 23 a 26 años hay 186
alumnos; se busca calcular el número de alumnos comprendidos entre los
18 y 25 años; observando el diagrama lineal se nota que dicho valor
estará conformado por la suma de x + 321 + y alumnos; x, y se obtiene
por interpolación lineal de la ojiva o utilizando razones geométricas, en
forma matemática:
x
321
y
17 20 23 25 2618
167 186
167
1720 ==
x
1820 de donde x = 111,3;
186
2326 ==
y
2325 por lo que y = 124; de este modo entre los 18 y 25
años hay un total de 526 alumnos.
d) ¿Qué proporción de alumnos son menores de 21 años?
Siguiendo el mismo procedimiento, en la columna correspondiente a las
frecuencias relativas se obtiene el siguiente esquema:
0,0793 0,2037 x
14 17 20 21 23
Estableciendo las razones geométricas:
15,39,0
2023 =
x
2021, de donde x = 0,1305; luego, la proporción de
alumnos menores a los 21 años es: 0,0793 + 0,2037 + 0,1305 = 41,35%.
CCuurrvvaass ddee ffrreeccuueenncciiaa oo ccuurrvvaass ddee tteennddeenncciiaa: Curva suave y continua
que representa una curva de tendencia de la distribución de frecuencias
teóricas de la población; es el límite del histograma y del polígono de
37
frecuencias cuando el número de valores de la muestra es muy
grande y los intervalos de clase muy pequeños.
Curva simétrica: Cuando las curvas de frecuencias se asemejan a la
figura de una campana, se dice que es simétrica porque los datos
observados se distribuyen en la misma proporción a ambos extremos de
la línea media que divide a la campana; ahora, esta campana puede ser
achatada, alargada o mantener un punto neutral, ni chata ni alargada, al
que se le conoce como mesocúrtica; cuando la curva es muy achatada se
le conoce como platicúrtica, significa que los datos están demasiado
dispersos alrededor de su centro, en tanto que si es muy alargada, se le
conoce como leptocúrtica, lo cual significará que los datos estarán
bastante concentrados alrededor de la línea central.
Curva asimétrica: Cuando la curva de tendencia no se parece a una
curva de campana normal, sino que éste se degenera por uno de sus lados,
decimos que la distribución de los datos es asimétrica o está sesgada; si la
cola se deforma más por el lado derecho, decimos que la curva es
asimétrico positivo, y si la cola se deforma más por el lado izquierdo,
entonces la curva es asimétrico negativo.
En los siguientes ejemplos observaremos casos en que pueden
presentarse los tres tipos de distribuciones de frecuencia.
0
50
100
150
200
250
300
350
11 -14 14 -17 17 - 20 20 -23 23 -26 26 -29 29 - 32 32 - 35
Fre
cuencia
observ
ada
Grupos de edades
Fig. 2.7 Curva de tendencia de edad de los alumnos
38
Caso 1. Consideremos el siguiente caso del comportamiento
de ventas de equipos de PC, desarrollados en un centro comercial entre
los años 2000 al 2008; las cantidades vendidas se presentan tabuladas en
la tabla 2.2 Se trata de construir un histograma de frecuencias y analizar
el comportamiento de estas ventas, durante el período observado.
Tabla 2.2 Cantidades vendidas de PC
Entre los años de 2000 - 2007
Evolución durante los años
Cantidades vendidas en
und.
00 - 01 25
01 – 02 125
02 – 03 378
03 – 04 845
04 – 05 1368
05 – 06 784
06 – 07 423
07 – 08 137
Fuente: …..
Con estos datos se construye el histograma de frecuencias de
ventas absolutas, como el presentado en la Fig.2.8; éste muestra las
distribuciones de los datos expresados en el histograma; analizando el
comportamiento del histograma podría deducirse a simple vista , que su
curva de tendencia tiene dos características: primero que sigue una
tendencia lineal creciente durante los primeros cinco años, y a partir de
allí tiene una tendencia lineal decreciente; uniendo estas dos rectas, y
teniendo como referencia el eje X, podríamos deducir que se puede
formar un triángulo, concluyendo que el comportamiento de ventas de
las PC en este centro comercial sigue una distribución triangular; sin
embargo si buscamos una figura geométrica más utilizada en la
estadística, podría conjeturarse que el comportamiento de este fenómeno,
se aproxima más a una curva de campana, tal como se muestra en la Fig.
2.9; más adelante se presentarán los sustentos que validen esta
afirmación; continuando con el análisis podríamos seguir extrayendo una
serie de conclusiones; podemos decir que las ventas en los primeros cinco
años tuvo un crecimiento sostenido, pero a partir de ello, estas empezaron
39
a disminuir, razones que deberán ser analizados por las personas
inmersas en esta situación, etc.
Fig. 2.9 Curva de tendencia, simétrica del ejemplo de ventas presentadas en
la Tabla 2.2
Observando la curva de tendencia de esta figura, concluimos que
la curva de tendencia del comportamiento de ventas de las PC, sigue una
0
200
400
600
800
1000
1200
1400
25125
378
845
1368
784
423
137
Cantid
ades d
e P
C v
endid
as
Fig. 2.8 Gráfico del sistema de ventas de las PC(Curva de tendencia simétrica)
0
200
400
600
800
1000
1200
1400
1600
99 -00
00 -01
01 -02
02 -03
03 -04
04 -05
05 -06
06 -07
07 -08
08 -09
40
curva de campana simétrica, con una cierta cantidad vendida con
mayor frecuencia en los años 2004 al 2005, y escasas cantidades vendidas
en los primeros años, así como escasas cantidades vendidas en los últimos
años; podemos también concluir que el negocio tuvo sus buenos
momentos, y conforme transcurre el tiempo, las ventas tendrán tendencia
a ir disminuyendo, salvo que se adopten otras estrategias para seguir
manteniéndose con una tendencia creciente.
Caso 2. En un centro poblado se toma una muestra aleatoria de un grupo
de personas comprendidos entre los cero y 45 años de edad, con la
finalidad de conocer su distribución por edades; como resultado de este
proceso se registraron los siguientes resultados:
Tabla 2.3 Grupos de personas clasificadas de acuerdo
a sus respectivas edades en el Centro Poblado
Grupos de edades Número de
en años personas
[0 - 5[ 12
[5 - 10[ 38
[10 - 15[ 150
[15 - 20[ 90
[20 - 25[ 55
[25 - 30[ 27
[30 - 35[ 15
[35 - 40[ 9
[40 - 45[ 3
Fuente: ….
El histograma de frecuencias de la Fig. 2.10 muestra el
comportamiento de las edades de estas personas; podemos observar que la
mayor cantidad de personas comprende a aquellos que tienen entre los 10
y 15 años, y que a partir de éste último, el número va decreciendo; pero
también podemos decir que hay mayor número de personas mayores de
15 años, y así sucesivamente. Si buscamos una curva de tendencia para el
comportamiento de estas observaciones, encontraremos que este es
parecido a una curva de campana, salvo que la cola derecha de la
campana se deforma más (Fig. 2.11), por lo que decimos que esta
distribución es asimétrico (positivo).
41
Caso 3. El siguiente ejemplo corresponde a otro posible
comportamiento no asimétrico, donde los datos pueden presentarse de
modo que su distribución de frecuencias sea una curva de distribución
asimétrica negativa. Consideremos otra ciudad donde una muestra
0
20
40
60
80
100
120
140
160
12
38
150
90
55
27
159
3
Pers
onas o
bserv
adas
Grupos de edades en años
Fig. 2.10 Histograma de comportamiento de edades de las personas del centro poblado
0
20
40
60
80
100
120
140
160
Fig. 2.11 Curva de tendencia de la edad de las personas del centro poblado.
42
aleatoria de un grupo de personas, comprendidas entre los 0 y 45 años,
presentó el siguiente comportamiento de edades: Tabla 2.4 Personas clasificadas de acuerdo a
Grupo de edades en la ciudad X.
Grupos de edades en años
Número de personas
[0 - 5[ 3
[5 - 10[ 9
[10 - 15[ 15
[15 - 20[ 27
[20 - 25[ 55
[25 - 30[ 90
[30 - 35[ 150
[35 - 40[ 38
[40 – 45]_ 12
Fuente:
El histograma de frecuencias de esta tabla, permite apreciar que
la mayoría de las personas están comprendidas entre los 30 y 35 años, y
que también la gran mayoría son personas menores de los 35 años, etc. Al
construir su curva de tendencia, podemos afirmar que la distribución de
estos datos corresponde a una distribución asimétrica negativa (Fig. 2.12
y 2.13).
0
50
100
150
3 9 1527
55
90
150
38
12
Fre
cuencia
de p
edid
os
Amplitud de edades en años (cada 5)
Fig. 2.12 Curva de tendencia de la edad de las personas del centro poblado.
43
Fig. 2.13 Curva de tendencia del comportamiento de edades de las
personas de la ciudad X (Curva asimétrica negativa)
0
20
40
60
80
100
120
140
160
-5 - 0 0 -5
5 -10
10 -15
15 -20
20 -25
25 -30
30 -35
35 -40
40 -45
45 -50
44
EEjjeerrcciicciiooss ssoobbrree ddiissttrriibbuucciioonneess ddee ffrreeccuueenncciiaa
2.1. ¿Cuál es el objeto de clasificar y ordenar los datos?
2.2. Describa las características de clase y el de las frecuencias
absolutas y relativas.
2.3. ¿Es posible que solo los datos con variables discretas pueden ser
clasificados en distribuciones de frecuencia?
2.4. Defina el concepto de marca de clase y su respectivo uso.
2.5. ¿De qué depende el número de clases para poder construir una
tabla de distribución de frecuencias?
2.6. ¿Qué representa un histograma de frecuencias y qué tipos existen?
2.7. ¿Qué significado tiene la frecuencia relativa, y qué el de la
frecuencia relativa acumulada?
2.8. Con los datos que a continuación se muestran: 78,56 82,34
40,76 34,71 32,11 55,67 43,21 54,23 78,90 102,02
50,13 45,55 63,29 67,18 46,34 61,21 39,76 53,21 88,45
78, 65 64,66 68,62 90,56 39,46 40,04 58,68 98,99 61,73
60,03 74,34 74,00 100,25 85,99 100,98 47,74 35,94
40,12 76,51; determine: a) La amplitud de los datos, número de
clases y un intervalo de clase b) Su tabla de frecuencias c) Su
histograma de frecuencias absolutas y relativas así como las curvas
de frecuencias acumuladas absolutas y relativas d) Su polígono
de frecuencias absolutas y relativas e) ¿A qué distribución se
aproxima su curva de frecuencias?
2.9. Una empresa química está interesado en producir nuevos modelos
de zapatillas deportivas para hombres y mujeres cuyas edades
fluctúan entre los 16 y 40 años, todos residentes dentro del ámbito
de la provincia de Huaura; a fin de tener como punto de referencia
el promedio de edad de este grupo, el departamento de marketing,
hace un muestreo aleatorio un día cualquiera preguntando la edad,
en años, de cada persona que circulaba por la Av. 28 de julio,
obteniendo los siguientes datos: 18, 30, 17, 32, 21, 24, 45, 51, 42,
21, 29, 53, 28, 29, 32, 16, 45, 48, 50, 20, 23, 27, 21, 20, 26, 24,
33, 33, 38, 40, 37, 24, 26, 48, 38, 30, 32, 33, 45, 52, 37, 27, 40, 44,
21, 16, 18, 16, 21, 23, 27, 33, 32, 19, 21, 20, 36, 37, 23, 31, 33, 21,
27, 29, 40, 41, 50, 19, 21, 24, 20,18, 17, 40, 34, 31.
a) ¿Cuál fue el tamaño de la muestra? b) ¿Cuál es la amplitud de
edades? c) ¿Cuántos intervalos de clase pueden construirse con
estos datos? d) ¿Qué grupos de edades aparecen con mayor
45
frecuencia? e) Presente los datos en forma de un histograma de
frecuencias f) Trazar un polígono de frecuencias relativas g)
¿A qué forma puede aproximarse su polígono de frecuencias? h)
Grafique un polígono de frecuencia acumulada i) ¿Qué
porcentaje de personas son menores de 30 años? j) ¿Qué
porcentaje de personas son mayores de 28 años? k) ¿Qué
porcentaje de personas se encuentran entre los 20 y 30 años?
2.10. Construya el gráfico de tronco y hojas para el problema anterior.
2.11. Averiguando sobre los salarios percibidos semanalmente en
Nuevos Soles por un grupo de obreros del sector construcción civil se
pudo captar los siguientes datos: 350, 400, 360, 320, 400, 350, 380,
420, 360, 300, 360, 350, 380, 370, 330, 325, 300, 380, 370, 350, 320,
380, 350, 380, 400, 325, 320, 340, 410, 320, 350, 360, 400, 410, 330,
340, 350. Construya un histograma de frecuencias y determine su
curva de tendencia; del mismo modo construya el gráfico de hojas,
explicando sus principales características.
2.12. En un centro comercial se reportan ventas de PC cuyos precios
fluctúan entre los US $ 400 y $1 800, dentro de un período
determinado; las cantidades vendidas de estas PC se reportan en un
cuadro incompleto como el indicado a continuación:
Ventas de PC en el Centro Comercial durante el año …. Precios en
USA $
Cantidad
vendida
Cantidades
acumuladas
Proporción
de ventas
Proporciones
acumuladas
14 14 0.035
74
0.435
92
84
388 0.095
12
a) Complete este cuadro, graficando su histograma de frecuencias
relativas, su distribución de frecuencias y su ojiva porcentual
b) ¿Qué proporción de ventas de PC representa cantidades menores de
$1 100? R: 55%
c) Si a ventas superiores de $ 1 100 se les recarga con 20% de
impuestos a la renta, ¿qué cantidades se verán afectadas por estas
ventas? R: 180
46
d) Si el 25% de las ventas producidas se destinaron para el
mercado de Lima Provincias, sin considerar precio, ¿de qué cantidad
se dispuso?
2.13. Haga el siguiente experimento: Averigüe el promedio de notas de
sus compañeros de clase durante el pasado ciclo académico; luego
construya una tabla de frecuencias y determine: a) Su histograma de
frecuencias b) Explique a qué tipo de curva de frecuencias se
distribuye este comportamiento c) ¿Qué proporción de alumnos están
aprobados? d) ¿Qué proporción de alumnos fueron desaprobados?
e) Si se considera que solo aquellos que tienen promedio más de trece
“tienen buenas notas”, ¿cuántos y qué proporción de alumnos estarán
considerados dentro de esta categoría?
2.14. La siguiente tabla, proporciona datos sobre remuneraciones
mensuales, en Nuevos Soles, de una muestra de trabajadores
registradas en una determinada ciudad:
i Rango de
ingresos en S/
Cantidad de
trabajadores
1 [600 – 943[ 5
2 [943 – 1286[ 10
3 [1286 – 1629[ 18
4 [1629 – 1972[ 12
5 [1972 – 2315[ 8
6 [2315 – 2658[ 3
7 [2658 – 3001[ 2
a. Explique el comportamiento de ingresos de este grupo de
trabajadores; para ello construya su histograma de frecuencias y
luego establezca su curva de tendencia.
b. ¿Qué porcentaje de trabajadores ganan menos de S/ 1 605,34?
c. ¿Qué porcentaje de trabajadores ganan más de S/ 1 514,67?
d. ¿Qué porcentaje de trabajadores ganan más de S/ 2 000?
e. ¿Qué porcentaje de trabajadores ganan entre S/ 600 y S/ 1 500?
2.15. Considere los datos proporcionados en la Tabla 2.4 y determine:
a. Proporción de personas mayores de 23 años.
b. Proporción de personas comprendidas entre los 12 y 26 años.
c. ¿Cuántas personas hay cuyas edades están comprendidas entre los
24 y 36 años.
d. Si se considera que las personas mayores de 25 años, ya son
adultos, ¿cuántos estarán comprendidos en este grupo?
47
2.16. Sobre encuestas relacionadas con los sueldos de los
trabajadores correspondientes al sector privado, se encontró que estos
fluctuaban entre S/ 350 y un poco más de S/ 1 550 mensuales, según se
muestra en la siguiente tabla:
Sueldos de trabajadores del sector privado
Sueldo promedio (S/) Número de trabajadores
*350 – 500 178
500 – 650 440
650 – 800 816
800 – 950 576
950 – 1 100 120
1 100 – 1 250 85
1 250 – 1 400 60
1 400 – 1 550 36
1 550 a más 14 (*) Trabajan menos de las horas normales
Determine:
a) Su curva de frecuencias, explicando el tipo de distribución.
b) Su ojiva
c) Número de empleados que ganan menos de S/ 1 200. R: 2187
d) Número de empleados que ganan entre S/ 800 y S/ 1 300.
e) Número de empleados que ganan más de S/1 200.
f) Porcentaje de empleados que ganan menos de S/ 700.
g) Porcentaje de empleados que ganan más de S/ 900.
h) Porcentaje de empleados que ganan entre S/ 520 y S/ 1 000. R: 78%
i) La confederación que los agrupa solicita que a los trabajadores que
ganan menos de S/ 600 se les aumente un 15% más y a los que ganan
entre S/ 600 y S/ 700 se les aumente un 5% más, ¿cuántos
trabajadores se beneficiarían con este aumento, y cuántos no
percibirían ningún aumento? R: 890 y 1 435
48
Sección 3
Frases para meditar:
Haz que tu cabeza trabaje a favor tuyo y
poco a poco adquirirás la costumbre de
no molestarte cuando las cosas vayan mal
Sí estas seguro de ti mismo, y tienes
confianza en lo que piensas, no querrás ni
necesitarás que los demás sean como tú
Los accidentes ocurren, los triunfadores
aprovechan los accidentes; los que no
tienen éxito son personas orientadas a su
interior, no escuchan
Nunca se tiene una segunda oportunidad
para producir una primera impresión
Medidas de Tendencia Central y Medidas
de Variabilidad
Medidas de tendencia central: Una medida de esta naturaleza,
representa a la población o a la muestra; la media aritmética o su
promedio, la mediana, la moda, la media geométrica y la media armónica,
son ejemplos de estas medidas.
Ejemplo 3.1 Cuando se dice que el promedio de salario de los obreros de
una planta pesquera es de S/ 40 diarios; se está indicando que esta
cantidad está representando lo que en promedio gana el conjunto de todos
estos trabajadores, aunque algunos pueden ganar S/ 120 diarios y otros
pudieran ganar S/ 15 diarios, sin embargo el valor de S/ 40 diarios, es su
medida representativa.
Promedio o media aritmética: Se obtiene sumando todos los valores
observados y dividiéndole entre el total de estas observaciones.
49
Existen dos formas para determinarlo: Cuando los datos
están dispersos y cuando los datos están agrupados; cuando los datos
están dispersos, el promedio es igual µ = x = n
xxx n...21, donde n
corresponde al número total de observaciones; cuando los datos se
presentan agrupados, como en una tabla de distribución de frecuencias,
el promedio se determina de la siguiente manera:
µ = x = n
nn
fff
fxfxfx
...
...
21
*2*21*1
µ = x = n
i
i
n
i
ii
f
fx
1
1
*
, donde los xi representan las marcas
de clase y las fi sus frecuencias absolutas o frecuencias relativas.
Media aritmética ponderada: Se determina cuando el conjunto de
observaciones están afectadas por otro conjunto de factores de
ponderación o pesos. Así si se tienen las siguientes observaciones, x1, x2,
..., xn y a estas observaciones se les asignan las siguientes ponderaciones
o pesos w1, w2,...wn, entonces la media ponderada se obtiene:
µ = x = n
nn
www
wxwxwx
...
...
21
*2*21*1
µ = x = n
i
i
n
i
ii
w
wx
1
1
*
; si observamos esta última expresión, nos
damos cuenta que los wi están reemplazando a los fi en una tabla de
frecuencias.
Media con grupos de datos: Cuando a la población se los sub divide en
dos o más grupos de diferentes tamaños su promedio se obtiene del
mismo modo que una media ponderada: µ = x =
50
k
i
i
k
i
ii
n
xn
1
1
*
, donde los ni k
kk
nnn
xnxnxn
...
...
21
*2*21*1
=
representan los tamaños de los sub grupos y los xi sus respectivos
promedios, k el total de observaciones.
Ejemplo 3.2 Una empresa comercial cuenta con 50 empleados,
conformados por 50 varones y 30 mujeres; si el promedio de
remuneraciones de los empleados varones es de S/ 1 600 mensuales, en
tanto que el de las mujeres es de S/ 1 400 mensuales, determine el
promedio general de sueldos del personal de la empresa.
Promedio general de sueldos = 3050
1400*301600*50 = S/ 1 525.
En todos estos casos, el promedio aritmético o media ponderada
es un valor idealizado, debido a que representa un valor a los que todos
tenderían a ser.
Desviación: Cuando a un dato cualquiera xi se le resta una constante, al
proceso se le denomina una desviación respecto a esa constante; cuando
ese dato xi es restado por su media aritmética, se le denomina desviación
alrededor de su media; esto es di = xi – µ; la suma de todas estas
desviaciones es igual a cero.
0)(1 1
k
i
k
i
ii xd
Mediana o valor medio: Es otra medida de tendencia central; es un
número que divide al total de observaciones en dos partes iguales, su
significado es similar al dividir una naranja en dos partes iguales; en el
caso de tener una serie de observaciones, para obtenerlo, primero se les
ordena en forma ascendente, y si el conjunto de ellos es impar, la mediana
es el número que divide al conjunto en dos partes iguales; de esta
manera, la median se interpreta como que el 50% de las observaciones
están por debajo de éste, y el resto por su encima.
Ejemplo 3.3 Si un conjunto de observaciones presenta los siguientes
valores: 12, 15, 23, 7, 10, 25, 18; para determinar su mediana deberá
51
a mayor: 7, 10, 12, 15, 18, 23, 25; ordenársele previamente de menor
el número que divide a estas observaciones es el número 15; por lo tanto
la mediana es este número.
Si el conjunto de observaciones es un número par, la mediana se
obtiene promediando los dos números centrales.
Cuando los datos están agrupados, la mediana se calcula
determinando en primer lugar, la clase donde se encuentra la mitad de las
observaciones; de ésta se toma su límite inferior y la frecuencia
acumulada anterior a esta clase; de igual modo, se determina la frecuencia
modal de esta clase, y con ello la mediana se podrá calcular del siguiente
modo: Mediana = Li + cf
FN
m
i
*21
, siendo Li es el límite inferior de la
clase donde se encuentra la mediana, N el número total de observaciones,
Fi-1 frecuencias acumulada anterior a la clase i, c el ancho de clase y fm,
frecuencia donde se encuentra la mediana.
Moda: También es otra medida de tendencia central y denota el valor
observado que aparece con mayor frecuencia; pueden existir más de una
moda, si existen dos valores, se dicen bimodales porque hay dos modas,
o multimodales si hay más de dos; cuando la moda está constituido de un
sólo elemento se le llama unimodal; la expresión que permite calcular
este valor en datos agrupados es: Moda = Li + 21
1
ff
f*c, donde f1 es la
diferencia entre la frecuencia donde se encuentra la moda con la
frecuencia anterior y f2 la diferencia de la frecuencia donde se encuentra
la moda con la frecuencia posterior. Generalmente la moda se utiliza
para datos de tipo cualitativo.
Cuartil: Cuando se divide al conjunto de observaciones en cuatro partes
iguales, se dice que hay cuartiles; el cuartil uno Q1, representa la cuarta
parte de las observaciones, el cuartil dos Q2, la mitad de las
observaciones, y el cuartil tres Q3, las tres cuartas partes de las
observaciones; en la Fig. 3.1 se muestra esquemáticamente estos tres
cuartiles.
52
Fig. 3.1 Representación esquemática de los cuartiles.
Q1 Q2 Q3
La manera de determinar los cuartiles, en datos agrupados, se sigue el
mismo criterio empleado para obtener la mediana, teniendo en cuenta lo
mencionado con cada uno de los cuartiles; de este modo el cuartil uno es:
Q1 = Li + cf
FN
m
i
*41
; N/4 corresponde a la cuarta parte de las
observaciones donde se encuentre el primer cuartil, Fi-1, la frecuencia
acumulada anterior a N/4, Li el límite inferior de la clase donde se
encuentra el cuartil uno, fi la frecuencia que le corresponde a la clase
donde está el cuartil, y c el ancho de la clase. El primer cuartil indicará el
porcentaje de observaciones que está por debajo del 25% del total.
Decil: Sucede cuando se divide al conjunto de observaciones en diez
partes iguales; aquí el quinto decil es igual a la mediana; se los denotan
por D1, D2, ... D9. Para determinar sus respectivos valores, en caso de que
los datos se presenten agrupados, se sigue el mismo criterio de
determinación de los cuartiles.
Interpretar un decil es similar a interpretar un cuartil; por ejemplo
el decil dos, indicará que el 20% de las observaciones se encuentran por
debajo de todas las observaciones, etc.
Percentil: Sucede cuando se divide al conjunto de observaciones en cien
partes iguales; aquí el percentil 25 es igual al primer cuartil. Los
percentiles se denotan por P1, P2, P3, ....P99. Cada percentil, denota el
porcentaje de observaciones que están por debajo de este valor. Así el P50
y la mediana son iguales, entonces es viable decir que el P50 representará
el 50% de las observaciones que estarán por debajo éste, y etc.
Ejemplo 3.4 Consideremos que se registraron los ingresos mensuales en
Nuevos Soles, de un grupo de personas, los que están dados por las
siguientes cantidades: 900, 1 200, 1 500, 1 400, 800, 2 000, 770, 1 500.
Determine a) Promedio de ingresos. b) El sueldo medio. c) La moda
de estos sueldos. d) Los cuartiles uno y tres.
53
Solución: a) El promedio de los sueldos se determina fácilmente aplicando su
concepto: Promedio = S/ 1 258,75.
b) Para hallar el sueldo medio o la mediana, deberá ordenarse primero
los datos en forma ascendente: 770, 800, 900, 1 200, 1 400, 1 500,
1 500, 2 000. De acuerdo a esto, el sueldo medio, o mediana está
entre los 1 200 y 1 400, o sea: S/ 1 300.
c) La moda, o sueldo que aparece con mayor frecuencia es: S/ 1 500.
d) El cuartil uno, corresponde a la cuarta parte de las observaciones
registradas, esto querrá decir que el 25% de los sueldos estará por
debajo de este cuartil, estando comprendido entre 800 y 900, luego Q1
= S/ 850. De igual manera el cuartil tres, corresponde a las tres
cuartas partes de las observaciones, y su valor se determina
observando que su valor estará comprendido estará entre 1 500 y
1500, o sea Q3 = S/ 1 500.
Medidas de dispersión: También se conoce como medidas de
variabilidad o medidas de variación; es una medida que explica la forma
cómo los datos pueden estar agrupados o dispersos, referidos alrededor de
un valor representativo, que puede ser la media aritmética; la amplitud, la
desviación cuartílica, la desviación media, la varianza, la desviación
estándar y el coeficiente de dispersión, son medidas que explican la
dispersión de los datos.
Una medida de tendencia central no explica la forma cómo los
datos están agrupados; por ejemplo, si se tuvieran a cuatro personas cuyas
edades son de 24, 26, 22, y 28 años, es fácil darse cuenta que estas
personas parecerían tener las mismas edades, queriendo decir que estas
cuatro personas pueden aparentar tener en promedio 25 años; sin
embargo si tuviéramos a otras cuatro personas con estas edades: 42, 38,
15 y 5 años; aunque el promedio de edad de estas cuatro personas sigue
siendo de 25 años, sería ilógico pensar que este promedio representa la
edad de los cuatro, porque por más desarrollado que esté un niño o joven
de esas edades, jamás se podría pensar que aparenta una edad de 25 años,
o también al revés,, por más conservado que esté una persona de 42 o 38
años, jamás se podría decir que aparenta una edad de 25 años.
Estos dos situaciones permiten deducir que en el primer caso los
datos están bastante concentrados alrededor del promedio, en cambio en
el segundo, los datos están bastante alejados del promedio; hablando en
54
términos de variabilidad, podemos decir que en el primer caso, esta
es pequeña, en cambio en el segundo caso es grande; un valor pequeño o
muy pequeño en la medida de variabilidad indicará alta concentración de
datos alrededor del promedio, en tanto que un valor muy grande indicará,
que los datos estarán alejados o muy alejados de este promedio; de otra
manera también los datos pueden concentrase en un solo extremo, a esto
se dice sesgo; si están muy concentrados a la derecha, se dice sesgado a la
derecha, y si están muy concentrados a la izquierda, sesgados a la
izquierda.
Ejemplos de datos concentrados a la derecha: 2, 3, 34, 45, 28, 30;
ejemplos de datos concentrados hacia la izquierda: 3, 5, 1, 6, 2, 5, 8, 4,
17, 15, 16.
Las medidas de variabilidad pueden explicarse con la amplitud, la
desviación media, la desviación cuartílica, la varianza, la desviación
estándar y el coeficiente de dispersión.
Amplitud o rango: Es la medida de variabilidad más simple que indica
el rango de dispersión de los datos, se obtiene por diferencia entre el
mayor y el menor valor observado. Ejemplo: Si se conoce que las
edades de cuatro personas son de 12, 32, 54 y 20 años, entonces su
amplitud es de 54 – 12 = 42 años.
La amplitud es una medida de variabilidad muy simple, solo
proporciona información de la forma cómo están ubicados los datos
extremos, sin embargo no explica si éstos están concentrados hacia uno
de los extremos, o están próximos al promedio, por ello no proporciona
mucha información, de modo que su uso está muy limitado,
especialmente cuando se cuenta con muchos datos.
Desviación media DM: Es otra medida de variabilidad que se obtiene
sumando los valores absolutos de las desviaciones medias de los valores
observados y luego divididos entre el número total de datos.
DM = n
xi
, para datos dispersos
DM = N
xf ii *
, cuando los datos están agrupados y xi representa
las marcas de clase, y N = fi
55
La razón de tomar el valor absoluto de las desviaciones medias
se hace con la finalidad de anular la suma cero de todas las desviaciones;
esta medida con respecto al anterior proporciona mejor información,
dado que va tener en cuenta toda la variación de los datos.
Desviación cuartílica DQ: Se define como el promedio de la diferencia
entre el tercer cuartil y el primer cuartil.
DQ = 2
13 QQ
Varianza V(x): Es una medida de variabilidad que se obtiene sumando
al cuadrado la diferencia de las desviaciones alrededor de la media y
dividiéndole entre el total de observaciones menos uno.
V(x) = 2 = S
2x =
1
2)(
n
xi
, siendo n el número de
observaciones; en el caso de tener datos agrupados:
V(x) = 2 = S
2x =
1
)( 2*
N
xf ii
en este caso xi representa
las marcas de clase y N = fi.
Desviación estándar: Es la medida de variabilidad más utilizada, se
obtiene extrayendo la raíz cuadrada de la varianza.
= Sx = )(xv
Esta medida se le utiliza bastante junto con el promedio; un valor
grande indicará que los datos están muy dispersos, mientras que un valor
pequeño, indicará que estarán muy concentrados; el problema es que
altos valores de esta medida, no indicarán en qué extremos estarán
concentrados los datos, ya que su medida puede verse afectada por la
existencia de uno o más valores en sus extremos; así considerando a tres
personas cuyas edades son de 5, 8 y 80 años, el promedio de edad de estas
es de 31 años y su desviación estándar igual a 42,462 = años; en cambio
para otras tres personas cuyas edades son de 34, 30 y 29 años, el
promedio de edad estas también es igual a 31 años, en cambio su
desviación estándar es igual a 2,645 años; estos ejemplos muestran cuánto
puede verse reflejado una medida de esta naturaleza cuando uno o más de
sus valores están en situaciones muy extremas o muy anormales.
56
Ejemplo 3.5 Los ingresos mensuales en S/ de diez ingenieros es el
siguiente: 1 800, 2 000, 2 500, 1 600, 3 000, 2 600, 2 400, 1 700,
1 900 y 2 500; encuentre la varianza y su desviación estándar.
Solución: Primero deberá calcularse el promedio de ingresos:
= 10
2500...20001800= S/ 2 200
Luego habrá que determinar su varianza:
2 =
9
2)22002500(...2)22002000(2)22001800(=
2 =
9
1920000= 213 333,33, y finalmente su desviación estándar:
= S/ 461,19
Cálculos complicados de sumar y multiplicar números muy
grandes pueden simplificarse, extrayendo un factor común a todos los
valores observados; sea por ejemplo en este caso 1000; luego retomando
los cálculos:
= 10
)5,2...0,28,1(1000=
10
)0,22(1000S/ 2 200
Se observa que es más fácil sumar números pequeños, y al final el
resultado multiplicar por el factor común; de igual manera para la
varianza, extrayendo el factor común de 1000 a cada elemento dentro del
paréntesis:
2 =
9
2)20,250,2(...2)20,200,2(2)20,280,1(*2)1000(=
2 = 1000
2*1,92/9 = 213 333,33 y
= S/ 461,19.
A manera de conclusión, los cálculos de la media aritmética, de la
varianza y la desviación estándar pueden simplificarse extrayendo un
factor común a todos los valores observados y al final multiplicar los
resultados por ese factor común.
Índice de Asimetría: Cuán simétrica o no es una curva de distribución de
frecuencias, es un problema que se resuelve determinando su índice de
57
asimetría. Una curva es simétrica si su índice de asimetría es cero, de
otro modo será asimétrica; se determina mediante la relación:
Is = EstándarDesviación
ModaMedia
Si el Is es menor de cero significa que la moda es mayor que la
media, por lo tanto la curva tendrá asimetría negativa, en cambio si éste
índice es positivo, significa que la media es mayor que la moda, por lo
que la asimetría será positiva; si la media y la moda son iguales, significa
que la curva es simétrica; de otra manera, se dice que una distribución de
frecuencias es asimétrica positiva si: moda < mediana < promedio, lo cual
quiere decir que la mayoría de las observaciones están por debajo del
promedio, y que también existe una gran mayoría que está muy por
debajo de la mediana; en cambio si la distribución de frecuencias es
asimétrica negativa, sucederá que el promedio < mediana < moda, lo cual
quiere decir que la mayoría de las observaciones está por encima del
promedio.
Curtosis: Cuando la curva de distribución de frecuencias es simétrica, su
forma es acampanada; en este caso nos interesará conocer la forma cómo
se dispersan los datos alrededor de la media; la curtosis explica este
problema; si la mayor cantidad de datos se concentran alrededor de la
media, la curva simétrica es muy alargada en la media, a lo que se le
denomina leptocúrtica; si la mayoría de los datos están más concentrados
en sus extremos, la curva simétrica es más achatada, y se le denomina
platicúrtica, en los otros casos se le denomina curva de distribución
normal o mesocúrtica.
En una curva de distribución simétrica, la media, la moda y la
mediana coinciden, y estos están en el centro de la campana; cuando la
curva es normal, la desviación estándar se interpreta geométricamente
como el punto de inflexión de la curva y está exactamente a una distancia
de la media; también sucede que:
El 68,27% de las observaciones están comprendidos en el
intervalo µ ± ;
El 95,45% de las observaciones están comprendidos en el
intervalo µ ± 2 , y
El 99,73% de las observaciones están comprendidos en el
intervalo µ ± 3 .
58
El siguiente es el gráfico de una curva de distribución normal:
Fig. 3.2 Curva de distribución normal
Coeficiente de variabilidad o coeficiente de dispersión: Es la relación
entre la desviación estándar y su media aritmética CV = = x
Sx; es una
medida sin dimensiones, que puede ser expresado porcentualmente, y
mide la variación de la desviación estándar respecto a su promedio
aritmético. Se usa cuando se quiere comparar la variación de más de un
conjunto de observaciones, o cuando estos se expresan en diferentes
unidades de medida.
Ejemplo 3.6 Se cuenta con dos grupos de profesionales, uno conformado
por ingenieros de Sistemas y el otro conformado por ingenieros
Químicos, los primeros ganan en promedio S/ 4 000 mensuales con una
desviación estándar de S/ 475, en tanto que los segundos ganan en
promedio S/ 2 800 mensuales con una desviación estándar de S/ 350; a
simple vista no podría afirmarse que la distribución de sueldos en los
ingenieros químicos es más uniforme comparado con la de los ingenieros
de sistemas; para dilucidar estas dudas debe determinarse el coeficiente de
variabilidad para ambos grupos y compararlos; aquel que presenta menor
coeficiente de variabilidad, será el que presenta mayor homogeneidad en
los sueldos.
59
Ingenieros de
Sistemas
Ingenieros
Químicos
CVS = 4000
475*
100 = 11,87%
CVQ = 2800
350*
100 = 12,50%
Comparando estos dos coeficientes se concluye que mayor uniformidad
en los sueldos, los tienen los ingenieros de Sistemas.
Variable estándar o variable tipificada: Es también otra forma de
uniformizar datos que presentan diferentes grupos de distribuciones,
teniendo en cuenta la media y su desviación estándar y un valor
observado; la expresión que permite determinarlo es con z = x
, si
este valor es positivo, indicará que el valor observado es mayor al
promedio, y viceversa.
Ejemplo 3.7 Considerando el caso anterior, si un ingeniero de Sistemas
gana S/ 4 300 y un ingeniero Químico S/ 3 050, ¿cuál de ellos estará
mejor pagado en comparación al grupo?
Solución: Para responder a esto debe determinarse la variable estándar por
cada grupo:
Ingenieros de Sistemas
Ingenieros Químicos
zS = 475
40004300= 0,63 zQ =
350
28003050= 0,71
Analizando y comparando estos resultados, se observa que el
ingeniero Químico está mejor pagado en comparación al otro grupo;
aunque en apariencia un ingeniero de sistemas gana más en su entorno,
éste sueldo podría no ser muy alto comparado con lo que gana el otro
profesional, dado que en su medio el costo de vida, o cualquier otro tipo
de condiciones podría hacer que el sueldo no tendría las mismas
características. Un caso típico de esto se da en Lima, aunque aquí las
remuneraciones son más altas debido al alto costo de vida, los sueldos
también deberían tender hacia eso, comparadas con la ciudad de Trujillo,
donde el costo de vida es mucho menos, y lo poco que se gana, podría ser
suficiente como para llenar la canasta básica familiar.
60
Ejemplo 3.8 Otra manera de utilizar el coeficiente de variación y
las variables tipificadas, se dan cuando se quieren comparar poblaciones
diferentes; para ello consideremos el caso de dos universidades que
presentan sistemas de evaluaciones diferentes y que a simple vista es
difícil cuáles de los alumnos están mejor considerados en relación al
grupo. Supongamos que en una de ellas el promedio general de notas de
los alumnos de la universidad, en un determinado período académico fue
de 13,8 con una desviación estándar de 4,2, y en la otra universidad, el
promedio general fue de 12,6 con una desviación estándar de 3,5. Ahora
consideremos que a un puesto de trabajo se presentan dos postulantes,
ambos egresados de cada una de las universidades; si un criterio de
evaluación será el rendimiento académico, entonces supongamos que el
primer postulante, egresado de la primera universidad tiene un
rendimiento académico promedio de 14,6 y el segundo, de la otra
universidad, un rendimiento académico de 13,4, ¿en cuál de las
universidades hay mayor uniformidad de notas y cuál de los postulantes
está mejor en su rendimiento académico?
Solución: Para determinar en qué universidad hay mayor uniformidad en
la evaluación, se determinará el coeficiente de dispersión:
Coeficiente de dispersión: Primera universidad: = 8,13
2,4= 0,3043
Segunda universidad: = 6,12
5,3= 0,2778
Comparando estos dos índices, apreciamos que en la segunda
universidad el coeficiente de dispersión es menor que su similar, por lo
que concluimos que aquí hay mayor uniformidad en las notas, dado que
hay mayor concentración de datos alrededor del promedio de notas.
Para saber cuál de los postulantes presenta mejor rendimiento
académico, se compararán sus variables tipificadas o variables
estandarizadas:
Variable estandarizada:
Primera universidad: z = x
= 2,4
8,136,14= 0,19
61
5,3
6,124,13=0,23 Segunda universidad: z =
x =
De igual modo apreciamos que la variable estandarizada de la
segunda universidad es mayor que el de la primera, lo cual quiere decir
que el postulante de esta universidad está mejor que el de la primera, pese
a presentar un menor rendimiento académico que su competencia; esto
podría explicarse por las diferentes condiciones en que se presentan las
evaluaciones en ambas universidades.
Ejemplo 3.9 El siguiente caso resume el procedimiento de obtención de
cálculo de las principales medidas estadísticas tratadas en el presente
capítulo.
En un centro comercial, se venden computadoras personales, de
diferentes modelos, cuyo precio máximo alcanza los US $ 1 600; las
cantidades vendidas según estos precios están clasificadas en la tabla que
se adjunta:
Precio de venta Cantidad
De las PC en US $ Vendida
[0 – 200[ 21
[200 – 400[ 53
[400 – 600[ 98
[600 – 800[ 150
[800 – 1 000[ 127
[1 000 – 1 200] 98
[1 200 – 1 400[ 60
[1 400 – 1 600] 18
Solución: Para entender el comportamiento de la distribución de estos
datos, construimos su tabla de frecuencias, luego su histograma de
frecuencias absolutas y su curva de tendencia; posteriormente calculamos
sus estadísticos.
En primer lugar, la cantidad total de computadoras personales
vendidas es N = if = 625, y su tabla de distribución de frecuencias
se muestra en la siguiente tabla:
62
Tabla 3.1 Tabla de distribuciones de frecuencias de las PC vendidas
Precio venta Marca Cantid. Frec. Frec. Abs. Frec. Rel.
de PC: US $ clase vendida relativa acumulada Acumulada
clase i xi fi hi = fi /n Fi Hi
[0 – 200 [ 100 21 0.034 21 0.034
[200 – 400 [ 300 53 0.085 74 0.118
[400 – 600 [ 500 98 0.157 172 0.275
[600 – 800 [ 700 150 0.240 322 0.515
[800 – 1000 [ 900 127 0.203 449 0.718
[1 000 – 1 200[ 1 100 98 0.157 547 0.875
[1 200 – 1 400[ 1 300 60 0.096 607 0.971
[1 400 – 1 600] 1 500 18 0.029 625 1.000
Construido esta tabla, puede obtenerse los diferentes tipos de
gráficos, que se muestran a continuación.
Fig. 3.3 Histograma de frecuencias absolutas de ventas de PC en el Centro
Comercial
Observando esta figura podríamos asegurar que su curva de tendencia se
aproxima a una curva de campana simétrica.
0
50
100
150
21
53
98
150
127
98
60
18
Nú
mero
de
PC
ven
did
as
Precios de la PC en $
63
De igual manera, una curva de frecuencias relativas acumuladas se
muestra en la siguiente figura.
Fig. 3.5 Frecuencia relativa acumulada de la distribución de ventas de PC en
el Centro Comercial
Prosiguiendo con los cálculos, se determinará los principales estadísticos
que nos podrán permitir extraer algunas conclusiones sobre el
comportamiento de ventas de estas PC en el mercado informático.
Precio promedio de ventas de las PC: = N
fx ii
= $ 798,56. Quiere
decir que en el mercado puede conseguirse una PC en un precio promedio
de $ 798,56.
Precio medio de ventas de las PC que divide a estas observaciones en
dos partes iguales: N/2 = 312,5 (posición donde se encuentra la mediana),
Li = 600 (límite menor de la clase donde se encuentra la mediana), Fi-1 =
172 (frecuencia acumulada anterior al valor donde se encuentra la
mediana), fm = 150 (frecuencia donde se encuentra la mediana), C = 200
(rango de clase); por lo tanto Mediana = 600 + 150
1725,315*200 = $
787,33. También quiere decir que la mitad de las PC ofertadas costarán
menos de este valor.
0.000
0.200
0.400
0.600
0.800
1.000
1.200
1 2 3 4 5 6 7 8
64
Moda (Precio de venta de una PC que aparece con mayor regularidad);
observando el cuadro se nota que el mayor número de PC vendidas están
entre $ 600 y $ 800, luego se deduce que la moda debe estar comprendido
dentro de este intervalo; con las referencias para el cálculo de este valor,
la frecuencia modal, donde se encuentra la moda = 150, límite inferior
donde se encuentra la moda Li = 600, f1 = frecuencia modal – frecuencia
anterior = 150 – 98 = 52, f2 = frecuencia modal – frecuencia posterior =
150 – 127 = 23; por lo tanto Moda = 600 + 2352
52*200 = $ 738,67.
Comparando estas tres medidas de tendencia central, podríamos
darnos cuenta que tanto el promedio como la mediana y la moda son casi
aproximadamente iguales, por lo que podríamos estar tentados a decir que
la curva de distribución de frecuencias de ventas de estos aparatos, sigue
una distribución normal; más adelante, cuando se conozcan otras
herramientas de análisis, podrá aceptarse o refutarse esta suposición, por
ahora nos quedamos con esa afirmación superficial.
Cuartil 1, Los cálculos son similares al obtenido para la mediana con la
diferencia que este valor está referido al 25% de las observaciones, por lo
tanto: Q1: 0,25N = 156,25; L1 = 400; fm = 98; 1fi =74,
Q1 = 400 + 98
7425,156*200 = $ 567,86. Este cuartil indica que el
25% de las PC estarán por debajo del $ 567,86.
Cuartil 2: Igual a la mediana = $ 787,33. Se interpreta igual que la
mediana.
Cuartil 3: Q3: 0,75N = 467,85; L1 = 1 000; fm = 98; 1fi = 449,
Q3 = 1 000 + 98
44975,468*200 = $ 1 040,31. Interpretando este
cuartil se dice que las tres cuartas partes, o el 75% de ventas de las PC
están por debajo de los $ 1 040,31.
Decil 8; Cálculos similares a los obtenidos con los Cuartiles y la
mediana, solo que debe considerarse que las medidas están referidos a las
65
décimas partes; por lo tanto para este decir: 0,8N = 500; L1 = 1 000;
fm = 98; 1fi = 449
D8 = 1 000 + 98
449500*200 = $ 1 104,08, quiere decir que el 80%
de las PC estarán por debajo de este precio.
Percentil 42; 0,42N = 262,5; L1 = 600; fm = 150; 1fi =172
P42 = 600 + 150
1505,262*200 = $ 750,00; esto es, el 42% de las PC
vendidas estarán por debajo de este precio.
Desviación Media: = DM =
625/)56,7981500(*18...)!56,798100(*!21 $ 275,44
Desviación cuartílica DQ: (Q3 – Q1)/2 = $ 236,22
Varianza V(x) = 2 =
1
2)(
N
xf ii
que en su forma abreviada es
equivalente a: )1(
2)(2
NN
xfxfN iiii
= 108 603,692 (unidades
monetarias cuadráticas)
Desviación estándar: = $ 329,551
Coeficiente de variabilidad: 56,798
551,329*100 = 41,27%
Variable estandarizada para un valor observado x = $856:
z = 551,329
)56,798856( = 0,174
66
EEjjeerrcciicciiooss:: MMeeddiiddaass ddee tteennddeenncciiaa cceennttrraall yy mmeeddiiddaass
ddee ddiissppeerrssiióónn..
3.1. ¿Qué características tiene la media ponderada?
3.2. ¿Cuál es el significado de mediana?
3.3. ¿Qué significado tiene la moda?
3.4. ¿En qué se diferencian la mediana, la media aritmética y la moda?
3.5. Indique las ventajas y desventajas de usar el promedio
aritmético.
3.6. Defina el concepto de asimetría, y ¿en qué casos se dice que hay
asimetría a la derecha y en qué casos hay asimetría a la izquierda?
3.7. ¿Qué relación tiene la media, la mediana y la moda en una
distribución de frecuencias asimétrica?
3.8. En una fábrica el jefe de sección de la planta de entubado
increpaba a sus obreros en el sentido de que el rendimiento de
producción de su sección estaba por debajo del promedio general de
toda la planta, por lo tanto dijo que no quería obreros que
produjeran por debajo del promedio general, debiendo implementar
un programa de racionalización del trabajo o, cerrar la sección; según
su criterio, ¿qué podría decir acerca del juicio de este jefe?
3.9. En un laboratorio laboran 120 trabajadores conformados por
obreros y empleados, quienes perciben en promedio S/ 2 780 y S/ 3
440 mensuales; si el promedio general del grupo es de S/ 3 000
mensuales, determine el número de obreros y empleados. R: 80 y 40.
3.10. Según reportes observados en el Peaje de Huacho, un
determinado día pasaron por caja 5 760 vehículos, entre ligeros y
pesados, los vehículos ligeros pagaron en promedio S/ 5,50 por peaje,
en tanto los pesados S/ 16,50; determine el número de vehículos por
cada grupo que circularon por ese lugar, si el promedio general pagado
por estos vehículos ascendió a S/ 10,39; además diga el monto
recaudado.
3.11. Demuestre si en un conjunto de observaciones x1, x2, ….,xn, cada
uno de estos elementos es multiplicado por una constante k, su nueva
desviación estándar será 1 = k .
3.12. Demuestre que si a cada elemento de un grupo de observaciones
se le añade una constante k, el promedio del grupo se incrementa en k;
de igual manera, demuestre que su desviación estándar permanece
igual.
67
3.13. Demuestre que si a cada elemento de un grupo de
observaciones se le incrementa en p%, la media del grupo y su
desviación estándar se incrementarán en (1 + p)%.
3.14. Demuestre que 2 =
1
2)(
N
xfi
)1(
2)(2
NN
xfxfN iiii
,
donde N = if
3.15. Una empresa tiene 43 empleados y 87 obreros que en promedio
perciben mensualmente S/ 2 365 y S/ 1 764, respectivamente; debido
a la actual recesión económica, la dirección de la empresa está
dispuesto a despedir a un grupo de sus trabajadores a fin de bajar el
promedio general de remuneraciones y de paso elevar la rentabilidad
de la misma; sin embargo el Jefe de Personal sugiere que para no
generar reacciones traumáticas en estas personas se opte por reducir
en 22 por ciento las remuneraciones de los empleados y se despida
solo a un pequeño grupo de 15 obreros; el Técnico de Estadística cree
que este sistema no logrará reducir el promedio esperado. Apoye o
sustente los argumentos de este profesional.
3.16. Se está probando la efectividad de un nuevo fertilizante para la
producción de zanahoria en terrenos agrícolas de Lima y Huacho; en
tal sentido se toman parcelas del mismo tamaño en diferentes lugares
de estas dos provincias, y los rendimientos obtenidos en toneladas
después de la cosecha son los siguientes: Parcela N° Rendimiento Lima
(Tn zanahoria) Rendimiento Huacho (Tn de zanahoria)
1 1 875 2 616
2 2 108 2 484
3 3 188 2 768
4 2 956 3 002
5 1 844 2 517
6 3 502 4 403
7 3 979
8 1 601
a) ¿Cuáles son los rendimientos promedios de zanahoria en Lima y
en estos dos lugares?
b) ¿En cuál de las provincias hay más homogeneidad de producción?
c) ¿Por qué el cálculo de la media aritmética puede ser distorsionada
si quisiera hacerse comparaciones?
68
3.17. De una promoción de graduados de una universidad, el
23% eran de ingeniería química, el 38% eran de enfermería, el 26 %
de agronomía y el resto de derecho; si las calificaciones medias de los
graduados en química fue de 12,3, de los de enfermería 13,1, de los de
agronomía 12,8 y de los de derecho 14,5, ¿cuál fue la calificación
media de la promoción?
3.18. En el curso de Estadística y Probabilidades hay 25 alumnos que
los llevaron por primera vez, ocho los llevaron por segunda vez y tres
los llevaron por tercera vez. El promedio de notas de los que llevaron
por primera vez fue de 12, y de los que llevaron por segunda vez fue
de 13; determine el promedio de notas de los alumnos que llevaron
por tercera vez, si se sabe que el promedio general fue de 12,8 y la
suma total de las notas fue 575. Res. 14.
3.19. Un grupo de pacientes sometidos a la prueba de colesterol en la
sangre, presentó los siguientes resultados: 205, 210, 320, 300, 202,
240, 218, 190, 216, 270, 235, 212, 235, 196, 320, 350, 205, 190, 312,
210, 195, 188, 202, 205, 204, 290, 240. Construya un histograma de
frecuencias, así como su curva de frecuencias y determine: a) El
promedio del grupo b) ¿Qué significado tiene una persona que tiene
cantidades superiores a 220? c) La mediana d) La moda e) Si el
promedio normal de colesterol en la sangre es de 200, ¿cuántas
personas están por debajo de este promedio?
3.20. En una empresa los obreros ganan en promedio S/ 1 500
mensuales, en tanto que los empleados S/ 2 000 mensuales. ¿Qué
relación de obreros a empleados debería existir, si se deseara que el
promedio general de las remuneraciones de estos trabajadores fuese de
S/ 1 600 mensuales? R. 4:1
3.21. En una sección de Química del segundo ciclo, 32 alumnos llevan
el curso de Física por primera vez, siete los llevan por segunda vez, y
seis por tercera vez. Se conoce además que 13 es el promedio de los
que llevan por primera vez, y que las notas de los que llevan por
segunda vez es en promedio 10% más de los que los llevan por
primera vez. Determine el promedio de notas de los que llevan por
tercera vez, si el promedio general del grupo de alumnos es de 13,5. R:
13
3.22. Una entidad pública cuenta con 180 empleados que en promedio
tienen 15 años de antigüedad; a este total se los divide en grupos
ocupacionales de Profesionales, Técnicos y Auxiliares, siendo los
tiempos promedios de servicios por cada uno de ellos de 12,2 15,5 y
69
18 años respectivamente; encuentre el número de servidores
por especialidad si se sabe que la suma de los grupos ocupacionales
de profesionales y técnicos es de 85. R: 25, 50, 95
3.23. De la siguiente tabla de frecuencias: Clase Frecuencia
3,57 – 4,56 2
4,57 – 5,56 K
5,57 – 6,56 86
6,57 – 7,56 8k
7,57 – 8,56 45
8,57 – 9,56 3k
9,57 – 10,56 5
Calcule el valor de k si el promedio de estas observaciones es de 7,065;
además determine: a) Histograma de frecuencias relativas b) Mediana y
moda. R: k = 8; b) 7,12 6,90
3.24. De la tabla de distribución de frecuencias:
Clase Frecuencia
observada
[ 3 - 7 > 15
[ 7 - 11> 63
[11 - 15> 2k
[15 - 19> 81
[19 - 23> k
[23 – 27> 6
a) Determine el valor de k si el promedio observado fue de 14,28;
además determine los cuartiles uno y tres b) ¿Qué proporción de
observaciones corresponden a clases menores de 13,5? R: k = 45
3.25. Durante el pasado año, la empresa “Metálica Industrial S.A”
fabricó y vendió, en el mercado nacional, calderas a vapor, cuyos
precios fluctuaban entre los 2 500 y 25 000 US$. Las cantidades
vendidas se muestran de una manera incompleta en la siguiente tabla: Precio de venta de las Calderas USA $
Unidades vendidas
Proporción de ventas
4k
9k
6k 0,300
2
1
70
Determine:
a) El cuadro completo de las distribuciones de frecuencia de la
producción y venta de estas calderas b) El tipo de distribución de
frecuencias c) Porcentaje de calderas vendidas cuyos precios superan
a los $15 000 d) Precio promedio de las calderas vendidas e) Su
desviación cuartílica f) Percentil cinco. R: c) 11,67% d) $10 225 e)
$2 750 f) $ 3 625
3.26. Explique el significado de una medida de variabilidad.
3.27. Explique las razones por las que la desviación estándar, una
medida de variabilidad, es usado con mayor frecuencia.
3.28. Al clasificar 480 varillas de fierro de construcción en una tabla de
frecuencias, se obtuvo los siguientes resultados: fixi2 = 58 467,
promedio de peso de cada varilla 10,7 kg. Determine la desviación
estándar del peso de estas varillas. R: 2,70 kg
3.29. En el primer examen de Estadística y Probabilidades, el promedio
general de notas, obtenidos por los alumnos fue de 08,5, con una
desviación estándar de 4,4; dado que estas notas estaban por debajo del
promedio esperado, el profesor del curso decide bonificar con dos
puntos más a toda la sección; ¿cuál será el nuevo promedio general y
cuál su desviación estándar?
3.30. En términos generales, en promedio, un Menú Ejecutivo,
ofrecidos en restaurantes destinados a la clase media, en US cuesta $
8,00 con una desviación estándar de $ 3,00, y en Lima cuesta S/ 9,00
con una desviación estándar de S/ 3,50.
a) ¿En cuál de los lugares hay mayor uniformidad en los precios de
los Menús?
b) Un viajero estuvo en Lima y USA; en Lima pagó por un Menú
Ejecutivo S/ 10,50, en tanto que en USA pagó por el mismo tipo
de Menú, $ 9,20. ¿En cuál de los dos lugares le salió más barato?
3.31. A un grupo de 250 estudiantes cuya estatura promedio es de 1,69
m., se los divide en dos grupos cuya estatura media del primero es de
1,73 cm. y el del segundo 1,63 m; determine el número de estudiantes
por grupo. R: 150, 100
3.32. Una mega empresa cuenta con una plana de 40 profesionales
varones que ganan en promedio mensualmente S/ 3 400 y 22
profesionales mujeres que en promedio ganan 15% menos que los
varones; determine el ingreso promedio del conjunto de todos los
profesionales que trabajan en esta empresa.
71
3.33. Se introducen dos solutos A y B en dos reactivos C y D,
respectivamente; A demora en disolverse en C diez minutos, mientras
que B en D doce minutos; se intercambian los reactivos y se observa
que A demora en disolverse nueve minutos en D y B diez minutos en
C; ¿de qué manera puede entenderse la uniformidad de estos tiempos y
cuál de las soluciones presenta una disolución más homogénea.
3.34. Un grupo de ingenieros industriales y químicos postulan para
ocupar vacantes disponibles en una empresa; ambos rinden un examen
general de conocimientos que se califica en la escala de cero a cien. El
promedio de notas del grupo fue de 68; si los seis ingenieros
industriales obtuvieron un promedio 70, y los ingenieros químicos
obtuvieron una nota promedio de 64; determine la cantidad de
ingenieros químicos que se presentaron al examen.
3.35. La siguiente tabla muestra la pirámide del sistema de ahorro
bancario de nuestro país: 1 2 3 4
Personas % del total de personas
Monto, en US $ millones
% del total
5 078 518 * 88,31 831 6,3
600 249 * 10,44 3 443 26,2
71 438 **
1,24 4 980 37,8
651 ***
0,01 3 907 29,7 5 750 856 100,0 13 160 100,0
* Ahorro de personas naturales
** Cerca de 20 000 son personas naturales y el resto personas jurídicas
*** Personas jurídicas
Fuente: SBS y Asociación de Bancos (La República, 28/12/2003)
El total de personas naturales y jurídicas que ahorran en el Perú se da
en la columna 1; el total ahorrado por el conjunto de ellos se da en la
columna 3; determine: a) Promedio ahorrado por persona por cada
nivel y por el nivel general b) ¿Puede decirse que existe buena
capacidad de ahorro por parte de las personas naturales? c) ¿Por qué
es que en estos casos los promedios son engañosos? d) ¿Qué puede
afirmar del 0,01% de personas que ahorran? e) Si el Gobierno está
implementando un impuesto a las transacciones financieras por el
movimiento de estos fondos, ¿quiénes serán los más perjudicados?
3.36. Se toma una muestra aleatoria de 20 botellones conteniendo
aceite y se encuentra que la variable de sus pesos x, medidos en kilos
indicaban los siguientes valores: x = 800, x2 = 8 320; determine
72
la media aritmética y la desviación estándar de estos
botellones. R: 20, 4
3.37. En un estudio sobre jornales diarios que percibían en US$, cierto
grupos de trabajadores pertenecientes al sector textil, los datos
obtenidos fueron destinados a clasificarlos en una tabla de distribución
de frecuencias, divididas en cinco clases de igual amplitud; sin
embargo el Técnico en Estadística no completó el llenado de este
cuadro aduciendo pérdida de datos, pero que sí tenía alguna referencia
de algunos de ellos. En este sentido, manifestó que la frecuencia
absoluta de la segunda clase fue de 72, la frecuencia absoluta
acumulada de la cuarta clase era de 404; la frecuencia relativa de la
primera clase fue 0,10 y la frecuencia relativa acumulada de la tercera
clase fue de 0,5358, en tanto que la marca de clase de la tercera clase
era de 60. Sí el total de trabajadores observados fue de 200 personas, y
el jornal promedio por día era de S/ 85,54, de un máximo de S/ 120
diarios; reconstruya el cuadro de frecuencias, así como determine su
desviación cuartílica y los percentiles 20 y 70.
3.38. En una empresa el promedio mensual de sueldos de sus
empleados es de S/ 1 750 con una desviación estándar de S/ 480; el
sindicato que los agrupa solicita un aumento del 15%; sin embargo al
empresa propone una aumento del 10% más una bonificación de S/ 50
por cada trabajador; determine. a) El nuevo promedio de sueldos y su
desviación estándar solicitados por el sindicato y propuestos por la
empresa b) ¿Cuál de las nuevas propuestas le sería más beneficiosa
para la empresa?
3.39. Una empresa dedicada a la fundición de piezas fabrica y vende
bombas hidráulicas; las ventas anuales de estos productos se hacen al
por mayor y sólo por lotes de pedidos superiores a las 200 unidades,
llegando a un máximo de 1 600 unidades, según se muestra en la
tabla: Unidades
producidas
Número de veces
solicitadas
200 - 15
32
87
108
24
15
– 1 600 7
73
a) Complete la tabla y construya su curva de frecuencias
explicando la relación entre la media, la mediana y la moda b)
Interprete el resultado de µ sx, c) ¿Cuántas veces se ordenaron
menos de 900 unidades? d) Si la escala de producción y ventas
comprendida en el intervalo [900 – 1 100] se considera satisfactoria,
¿cuántos pedidos deberán ordenarse? e) Determine la mediana y
moda, así como los percentiles: 5, 25, 32, 64, y 82. R: c) 188 d) 120
3.40. A fin de mejorar la formación académica de los alumnos de
ingeniería química, la autoridad universitaria contratará por horas a
cuatro nuevos profesionales de esta carrera, para dictar los cursos de
Corrosión, Transferencia de masa, Termodinámica y Textiles. Las
tarifas que estos profesionales cobran, en Nuevos Soles, por hora
dictada son de: 40, 45, 50, 47, respectivamente. También se está
considerando que las horas asignadas a cada uno de ellos sea el
siguiente: 30 horas para Corrosión, 35 horas para Transferencia, 38
horas para Termodinámica, y 27 horas para Textiles. a) ¿Cuánto
deberá invertir la universidad en el dictado de estos cursos? b) ¿Cuál
será el promedio de pago que deberá desembolsarse por cada
profesional? c) ¿Si estos profesionales exigen se les abonen un ocho
por ciento más por hora dictada, como concepto de viáticos y gastos de
alojamiento, cuánto más le costará a la universidad, y en cuánto más se
incrementará el promedio de pagos?
3.41. En el puerto del Callao se acopian diariamente, diferentes tipos de
minerales provenientes de las concentradoras del país, listos para ser
embaladas y exportarlos. En una observación de 325 días se reportó
que la máxima cantidad acopiada fue de 280 toneladas, con el cual se
intenta configurar una tabla de frecuencias como el mostrado: Item Toneladas de
minerales Días observados
1 20
2 K
3 2k
4 120
5 50
6 0,25k
7 5
Construya una tabla de frecuencias y calcule: a) Promedio y desviación
estándar de los minerales ingresados b) ¿Qué porcentaje de días
representan ingresos de minerales superiores a 180 toneladas? R: a)
74
Determine el índice de asimetría, e Promedio 123.38 Tn. C)
indique sus características.
3.42. En una empresa el jornal promedio de los obreros es de S/ 45,00
con una desviación estándar de S/ 12,62; dado el incremento del costo
de vida, el sindicato propone a la empresa un aumento diario del 7%,
en tanto la empresa propone un aumento general del 3% más S/ 1,75.
a) Determine la media y la desviación estándar de los nuevos salarios
propuestos por el sindicato b) La media y la desviación estándar
propuesto por la empresa c) ¿Cuál de las propuestas favorece más a
los obreros? R: a) 48,15 13,50 b) 48,10 13,0
3.43. Actualmente los profesores universitarios pertenecientes al sector
público ganan en promedio S/ 1 800 mensuales con una desviación
estándar de S/ 700; la FENDUP está presentando su pliego de
reclamos ante el Ministerio de Economía y Finanzas para que se lo
homologue de acuerdo a Ley; el MEF no cuenta con la partida
presupuestaria para atender este pliego de reclamos y como una
medida de paliatoria les propone un aumento general del 20% a todos
los docentes más una remuneración adicional de S/ 120 por función
educativa a cada docente a) Si la docencia universitaria está compuesto
por 20 000 docentes, determine: a) El nuevo promedio de ingresos de
los docentes b) La varianza de los nuevos sueldos c) ¿Cuánto le
significará este nuevo aumento al MEF? d) ¿Desde el punto de vista
del docente universitario, le convendría un aumento según un
porcentaje a su remuneración, o una bonificación general para todos,
sustente su respuesta.
3.44. De dos grupos de trabajadores de una empresa que fabricaban
tubos de PVC, en un período de trabajo, se obtuvo las siguientes
cantidades producidas: Días Trab 1 2 3 4 5 6 7 Grupo A 3 000 3 100 2 879 3 219 2 989 3 010 3 208
Grupo B 3 253 2 542 2 165 3 604 4 398 3 056 2 482
a) ¿Cuál de los dos es más uniforme y eficiente en sus trabajos? b)
¿Qué implicancias tiene el cálculo de la media para estos dos grupos
de trabajadores? c) ¿Cuál de los dos grupos tiene mayor desviación
estándar? d) ¿Cómo podría mejorarse la desviación estándar de los
dos grupos? Sugerencia: Use el concepto de medidas de variabilidad
3.45. Una empresa inmobiliaria que actualmente se dedica a la
construcción de habitaciones familiares para el programa “MI
VIVIENDA” cuenta con una planilla de obreros que en promedio
75
ganan un salario semanal de S/ 500; ante la urgencia de entregar
las obras dentro del plazo de fecha de vencimiento del contrato, decide
contratar con urgencia una décima parte más de obreros respecto a su
planilla actual, pagándoles un salario semanal de S/ 400; la federación
de trabajadores de Construcción Civil, presenta un pliego de reclamos
ante el Ministerio de Trabajo y logra que a los trabajadores antiguos se
les incremente el salario en un 15% más de la actual, más una
bonificación de S/ 50 adicionales por riesgo de trabajo, en tanto que a
los recientemente incorporados se les bonifique con un 5% más sobre
su salario actual y de S/ 10 de bonificación adicional por riesgo de
trabajo; estime el promedio de sueldos actuales del conjunto de
obreros, dados estos incrementos. R: S/627,27
3.46. En el mercado informático pueden conseguirse computadoras
personales (PC) nuevas y repotenciadas de los modelos Pentium II, III,
IV, cuyos precios dependen de su configuración, variando entre los US
$ 200 y $ 1 200 por unidad; en la siguiente tabla se muestra el
comportamiento de su distribución de ventas, según se pudo
confeccionar con las datos obtenidos: Precio de PC
US $ Cantidad
PC Vendida Frecuencia
Relativa Frec. Abs.
Acumulada Frec. Rel.
Acumulada
0,0500
80 0,2500
245
0,2500
Complete la tabla de distribución de frecuencias y determine: a)
Histograma de distribución de frecuencias y su respectiva ojiva b)
Precio promedio de venta de una PC c) Precio medio de una PC d)
¿Qué porcentaje de ventas representan precios por encima de los $
450 e) ¿Qué precio de venta de una PC aparece con mayor
frecuencia? f) ¿Puede considerarse que la curva de distribución de
frecuencias de estas ventas sigue una distribución simétrica?
3.47. Un grupo de clientes de una distribuidora de materiales de
construcción, presentan quejas ante la gerencia, indicando que el
cemento que les están vendiendo no cuenta con el peso reglamentario
de los 42 kilos por bolsa; la gerencia les manifiesta que efectivamente
estos pesos no venían exactamente en los pesos indicados, dado que
podrían fluctuar más o menos de este peso y que esta no era muy
significativa dado que al final el cliente siempre saldría beneficiado;
76
con la finalidad de corroborar esta afirmación los clientes toman
al azar un determinado número de bolsas de este material y obtienen
los siguientes valores: Peso promedio 41,446 kilos, desviación
estándar 0,953 kilos y suma de los cuadrados de los pesos de cada
bolsa es de 22 342,62; ¿cuántas bolsas de cemento fueron pesados?
3.48. En una obra de construcción se contrata cuatro albañiles a quienes
se les pagará las siguientes remuneraciones por hora de trabajo: Al
primero se le pagará S/ 6,10, al segundo S/ 6,50, al tercero S/ 6,70, y al
cuarto S/ 7,20; determine: a) El promedio de remuneraciones b) Si
la jornada laboral normal es de 48 horas, pasado el cual se le abonará
un 10% por hora extra, calcule el promedio semanal del grupo si las
horas trabajadas por cada uno de ellos fue el siguiente: El primero
laboró 41 horas, el segundo solo laboró 36 horas, el tercero laboró 47
horas y el cuarto 48 horas.
3.49. En una empresa metal mecánica la experiencia laboral de sus
trabajadores, compuesta por obreros y empleados han sido tabulados
de acuerdo a la siguiente tabla: Tiempo de permanencia del personal obrero y empleado en la
empresa XXXX.
Grupos de acuerdo a tiempo
de permanencia, en años
Número de
trabajadores
0 – 4 7
4 – 8 10
8 – 12 16
12 – 16 25
16 – 20 11
20 – 24 6
24 – 28 3
a) Construya un histograma de frecuencias y encuentre una curva de
tendencia teórica que explique el comportamiento de antigüedad de
estos trabajadores b) Si se toma una muestra al azar de un grupo de
25 trabajadores, ¿qué proporción de ellos tendrán más de 20 años de
experiencia laboral en la empresa? c) Determine sus medidas de
tendencia central y sus medidas de variabilidad explicando sus
principales características d) Si se estima que menos del 40% de los
trabajadores cuentan con menos de 13 años de antigüedad en la
empresa, ¿cuántos trabajadores estarán comprendidos dentro del
grupo?
77
3.50. En una reunión social habían 50 ingenieros químicos e
informáticos quienes comentaban sobre sus ingresos mensuales; de
este modo se determinó que los primeros percibían un sueldo
promedio de S/ 4 000, mientras que los segundos percibían un sueldo
promedio de S/ 4 500. Si el promedio general de sueldos del grupo
fue de S/ 4 400, determine el número de ingenieros por grupo.
3.51. En una determinada ciudad del país eventualmente se registran las
temperaturas a fin de conocer su comportamiento, el registro se hizo en
grados Faherenheit °F y estos fueron los siguientes: 65, 54, 67, 49, 52,
54, 51, 63, 65, 44, 48, 60, 67 y 65; determine el promedio de la
temperatura en grados Celsius °C, sabiendo que °C =
5
9
32F, el
valor de la mediana y la temperatura que se registró con mayor
frecuencia.
3.52. Queriendo conocer la forma cómo se distribuyen los ingresos
mensuales de los trabajadores pertenecientes al sector privado, se
hace un muestreo en las principales ciudades del país,
encontrándose que éstos percibían entre los S/ 600 y S/ 3 750; si el
número total de trabajadores entrevistados fue de 415, construya
una tabla de frecuencias, partiendo de las informaciones
proporcionadas, como lo mostrado en el siguiente: Tabla de ingresos mensuales de los trabajadores, en S/, de acuerdo a las
informaciones proporcionadas
Número Remuneraciones
mensuales en S/
Número de
trabajadores
1 15
2 k
3 2,4k
4 80
5 1,4k
6 60
7 0,4k
a) Explique el comportamiento de su curva de frecuencias.
b) Remuneración media.
c) Mayores remuneraciones percibidas por los trabajadores.
78
d) Desviación cuartílica.
e) Percentiles 20 y 40.
f) Si el gobierno decreta un aumento general de S/ 80 a todos
los trabajadores, ¿en qué medida cambiarán todas las
medidas determinadas en los parágrafos anteriores? 3.53. La unidad de logística de una empresa está por recibir un lote de
tarjetas madres para ensamblar sus PC; se presentan dos proveedores
ofertando estas tarjetas; el Jefe de Planta antes de otorgar la buena pro,
solicita información sobre la vida útil de estas tarjetas a cada uno de
estos proveedores, quienes les adjuntan los siguientes datos: Vida útil de las
tarjetas madre en
horas
N° de tarjetas
de proveedor A
N° de tarjetas
de proveedor B
Menos de 550 1 3
550 a 650 8 8
650 a 750 18 12
750 a 850 40 16
850 a 950 26 35
950 a 1 050 132 42
1 050 a 1 150 245 167
1 150 a 1 250 343 542
1 250 a 1 350 476 256
1 350 a 1 450 564 528
Más de 1 450 78 124
El Jefe de Planta encarga evaluar estos datos a su experto en estadística
, debiendo presentar los siguientes reportes: a) Promedio y desviación
estándar para cada una de las tarjetas madre b) Desviación cuartílica de
cada una las tarjetas c) Curva de distribución de las dos tarjetas d)
Proveedor a quien deberá ordenarse la provisión de estas tarjetas,
indicando las razones de su elección d) Explicando las características
de los índices de asimetría para este grupo de observaciones e) ¿Cuál de
los proveedores presenta mayor uniformidad en las características de su
producto?