Post on 18-Mar-2020
Notas de Estadística
Mag. Liliana Ghersi
156
UNIDAD Nº6
DISTRIBUCIONES DE CARACTERÍSTICAS MUESTRALES
“La belleza de los genes:...Según Thornhill, citado por The Economist, hasta un milímetro o
dos de asimetría en las proporciones corporales tienen su importancia en el balance final.
El investigador y sus colegas sostienen que la simetría nos hace atractivos porque se
relaciona íntimamente con la habilidad de los genes de ciertos individuos de rechazar
agresiones durante el desarrollo de su embrión. Eso sería un indicador no sólo de la buena
salud de su poseedor, sino también de que es portador de genes deseables para transmitir a
nuestros hijos” Revista La Nación 28/9/97.
“Salta: Un niño fue gestado en la cavidad abdominal de su madre, en un raro caso de
embarazo extrauterino que pudo llegar hasta el parto y que algunos consideraron “casi un
milagro”...”Nadie pensó que había algo fuera de lo común hasta que el 17 de marzo llegó a
la clínica para efectuarse una ecografía; y se constató que el feto estaba en la cavidad
abdominal, entre los intestinos, el hepiplón y las vías urinarias. El embarazo continuó y el
martes 24 se realizó la cesárea, una operación de alto riesgo, ya que hubo que extraer al
niño del abdomen y de inmediato retirar la placenta que estaba en la cavidad. La
intervención demandó dos horas.....Una consulta por Internet realizada desde la clínica
reveló que sólo hay cinco casos similares en todo el mundo....Este matrimonio humilde que
deseaba ardientemente un hijo se convirtió en protagonista de un caso que seguramente
despertará interés científico. La Nación 26/3/98.
Se demostró también que el estrés es un factor de riesgo importante aún cuando se tuvo en
cuenta el vicio de fumar, la falta de ejercicio físico y la mala alimentación entre otros. En
los estudios.... sometieron a 276 voluntarios sanos de 18 a 55 años a exámenes psicológicos
antes de ponerlos en cuarentena y depositar virus del resfrío en sus fosas nasales. Durante
los cinco día siguientes los voluntarios -a cada uno se le pagó 800 dólares- fueron revisados
para establecer quién presentaba evidentes síntomas de resfrío” La Nación 19/5/98.
“Ficha Técnica: La encuesta de Gallup fue realizada entre 2426 votantes de la capital, 25
partidos del Gran Buenos Aires, y el resto de esa provincia; Córdoba y Santa Fe -que suman
32 localidades del área bajo estudio- mediante entrevista personales y domiciliarias que se
efectuaron entre el 18 y el 22 del actual. Se utilizó un método muestral probabilístico
polietápico y estratificado, tomando en cuenta sexo y edad en el hogar. Se estima en el 2,7%
el margen de error en los totales de toda la muestra” La Nación 28/3/99
DISEÑOS DE MUESTREOS PROBABILÍSTICOS:
MUESTREO ALEATORIO SIMPLE:
Notas de Estadística
Mag. Liliana Ghersi
157
Es el prototipo de muestreo, en referencia al cual se definen las fórmulas básicas para la
determinación del tamaño de muestra y del error muestral. Es de fácil realización, pero para
su implementación se debe contar con el marco muestral que ayude a contactar a las
unidades de la población que hayan sido aleatoriamente elegidas. El procedimiento
adoptado, debe garantizar: la equiprobabilidad de participación en la muestra para cada
elemento de la población.; la selección muestral debe ser totalmente aleatoria hasta alcanzar
el tamaño de muestra definido, si bien es conveniente extraer un número mayor de
elementos a los efectos de sustituir elementos en el caso de ser necesario. Generalmente la
selección de unidades es sin reemplazamiento, aunque en algunas oportunidades puede
utilizarse el reemplazamiento (un elemento puede ser seleccionado más de una vez).
Cuando el marco muestral, se halla en soporte magnético, el proceso de selección se agiliza
considerablemente a partir de algún programa diseñado para tal fin; de no ser posible esta
alternativa es común recurrir a tablas de números aleatorios. La dispersión que se alcanza
en la muestra puede redundar negativamente en los costos de la investigación cuando se
encuesta mediante entrevista personal. Hoy es posible superar este inconveniente a partir de
la existencia de la multiplicidad de medios multimediales.
Ejemplo:
Supóngase que se desea realizar una encuesta a los alumnos de Economía y Negocios de
UNSAM. El marco de muestreo puede ser la base de datos de alumnos (teniendo en cuenta
que no se presenten duplicaciones o faltantes). Luego por un proceso que genere números
aleatorios se eligen a los n alumnos que conformarán la muestra.
MUESTREO ALEATORIO SISTEMÁTICO:
Exige un marco muestral aleatoriamente ordenado y nominativo. Sólo el primer elemento
de la muestra se elige al azar y luego al número que le corresponde al elemento elegido se
le adiciona el coeficiente de elevación para elegir al siguiente y así sucesivamente y en
forma recursiva se eligen todos los elementos. El coeficiente de elevación surge de dividir
el tamaño total de la población por el tamaño de la muestra.
Ejemplo: Si se tiene una base de datos con 10000 alumnos (marco muestral) y se desea
tomar una muestra de 250 alumnos; el coeficiente de elevación será: 10000/250 o sea será
4. Si el primer elemento elegido aleatoriamente resultó ser el identificado con el número 2;
los tres consecutivos siguientes serán el 6, el 10 y el 14.
MUESTREO ALEATORIO ESTRATIFICADO:
Este método es muy utilizado siempre que se dispone de información sobre características
de la población de interés. Consiste en clasificar a la población del marco muestral en
grupos o “estratos” mutuamente excluyentes (internamente homogéneos y diferentes de los
otros grupos), con respecto a las características consignadas en el marco muestral. De lo
cual surge que en la muestra estarán presentes elementos que tienen baja probabilidad de ser
Notas de Estadística
Mag. Liliana Ghersi
158
elegidos aleatoriamente en forma simple o sistemática; asimismo se pueden aplicar
diferentes métodos para la selección de la muestra y también para la captación de la
información de interés y; las estimaciones de los parámetros poblacionales probablemente
sean más precisas al reducirse la variabilidad al interior de cada grupo (homogeneidad)
Las variables que generalmente están presentes son las de género y edad; y a las cuales se
suelen sumar variables de tipo sociales, económicas y/o demográficas. De existir diversas
secuencias de estratificación hay que elegir aquella que responda a la relevancia de cada
variable (la que más discrimina debe ser la primera elegida)
Un vez determinada la estratificación, corresponder afijar la muestra en cada estrato,
entendiéndose por afijar la acción de distribuir el tamaño muestral global entre los estratos;
puede ser proporcional o no proporcional.
A -ESTRATIFICADO PROPORCIONAL:
En este caso, la distribución se hace de acuerdo al peso relativo del estrato en el conjunto
poblacional.
B – ESTRATIFICADO NO PROPORCIONAL:
Si no es proporcional puede darse de diversas maneras: por afijación simple, asignando el
mismo tamaño muestral a cada estrato; por afijación óptima, donde no solamente se tiene
en cuenta el peso relativo del estrato sino que además se tiene en cuenta su heterogeneidad
respecto de la variable de estratificación, de manera que a mayor peso y mayor variabilidad,
mayor tamaño muestral; y por último por afijación dirigida, o sea para algún estrato se
desea una cantidad determinada de elementos y para el resto se afija proporcionalmente.
Cuando el proceso se realiza por medio de un sistema computarizado estadístico, como los
mismos están parametrizados, sólo basta con indicarle al paquete los pesos a asignar a cada
uno de los estratos y automáticamente se cumplimentará la ponderación y procederá a
posteriori a la tabulación conjunta y al análisis de la información.
Si bien, este tipo de muestreo complejiza los cálculos estadísticos, facilita el trabajo de
campo y pueden utilizarse herramientas más precisas y pertinentes para el objetivo de la
investigación.
Ejemplo:
En la Facultad de Ciencias Económicas de la UBA se quiere realizar una encuesta para
conocer el grado de satisfacción de los alumnos por la enseñanza impartida. Para garantizar
que en la muestra estén representados alumnos de los distintos niveles académicos, se
decide estratificar la población por nivel. A partir de un estudio preliminar se conoce la
Notas de Estadística
Mag. Liliana Ghersi
159
distribución de la población en estudio respecto de si estaban satisfechos o no por la
enseñanza recibida. Se presenta a continuación, la distribución:
Nivel Población
Porcentaje
Satisfechos
1° Tramo 20000 45,00%
2° Tramo 15000 60,00%
Ciclo Profesional 40000 65,00%
Posgrado 5000 80,00%
Total 80000 60,00%
Definir el tamaño de muestra, o sea la cantidad de alumnos a encuestar, para que la
investigación tenga un error máximo de 2% y el nivel de confianza sea del 95,5%; y la
distribución en los estratos de acuerdo con los tres criterios principales de afijación (simple,
proporcional y óptima)
Recordemos que el tamaño de muestra, viene dado de acuerdo a la siguiente relación:
ppzNE
Nppzn
1*1
*1*
22
2
Por lo tanto, tomando las condiciones del problema se tiene:
Error Máximo= 0,02
Nivel de Confianza= 0,955
z= 2
n= 2330,125366
Para definir la afijación simple, una vez obtenida la cantidad de elementos que contendrá la
muestra, se toma por cada estrato la misma cantidad, o sea:
Afijación Simple= n/Cantidad de Estratos
Afijación Simple= 582,5
Por lo tanto se arriba a la siguiente distribución de elementos dentro de la muestra:
Nivel Población
Afijación
Simple
1° Tramo 20000 582
2° Tramo 15000 582
Ciclo Profesional 40000 582
Posgrado 5000 582
Total 80000 2328
Notas de Estadística
Mag. Liliana Ghersi
160
Para definir la afijación proporcional, una vez obtenida la cantidad de elementos que
contendrá la muestra, se toma por cada estrato la cantidad correspondiente a la distribución
que deviene de los estratos (en nuestro caso nivel), o sea:
Nivel Población
Proporción
según Nivel
PsN (PsN)*n
Afijación
Proporcional
1° Tramo 20000 0,25 582,5313414 582
2° Tramo 15000 0,1875 436,898506 437
Ciclo Profesional 40000 0,5 1165,062683 1165
Posgrado 5000 0,0625 145,6328353 146
Total 80000 1 2330,125366 2330
Obsérvese, que ha aumentado la cantidad de alumnos del nivel ciclo profesional en la
composición de la muestra y ha disminuido la cantidad de alumnos del nivel posgrado,
también disminuye la cantidad de alumnos del nivel segundo tramo y se mantiene
constante la cantidad de alumnos del nivel primer tramo.
Para la determinación de la afijación óptima se requiere de la varianza de la variable
proporción que surge en cada estrato o bien de la variable proporción en la totalidad.
Téngase como referencia para el cálculo en cada estrato, la situación sobre la totalidad de la
población:
2400)60100(*60)( totalVar
Por lo tanto se arriba a la siguiente matriz de datos:
Nivel
Porcentaje
según Nivel
PsN Varianza (PsN)*Var. Proporción
Afijación
Óptima
1° Tramo 25,00% 2475 5767060,28 0,282857143 625
2° Tramo 18,75% 2400 5592300,877 0,274285714 455
Ciclo Profesional 50,00% 2275 5301035,207 0,26 1149
Posgrado 6,25% 1600 3728200,585 0,182857143 101
Total 1 2400 20388596,95 1 2330
Donde la afijación óptima deviene de aplicar la proporción al tamaño de muestra.
Y para hacer más evidente las diferencias que surgen de los diversos tipos de afijación se
presenta la siguiente tabla conjunta (deviene de las tablas generadas anteriormente en forma
marginal), respecto de las afijaciones solicitadas:
Notas de Estadística
Mag. Liliana Ghersi
161
Nivel Población
Afijaciön
Simple Proporcional Óptima
1° Tramo 20000 582 582 625
2° Tramo 15000 582 437 455
Ciclo Profesional 40000 582 1165 1149
Posgrado 5000 582 146 101
Total 80000 2328 2330 2330
MUESTREO ALEATORIO POR CONGLOMERADOS:
Es un método indicado para ser aplicado cuando la población está espacialmente dispersa.
Como en el muestreo estratificado, en el de conglomerados también se procede a la
selección aleatoria de conjuntos de población; pero ahora denominados conglomerados, en
lugar de estratos. Los conglomerados pueden ser demarcaciones territoriales de la población
de interés (país, provincia, departamento, otro); también pueden ser instituciones (colegios,
hospitales, unidades penitenciarias, otros) o bien conglomerados artificiales como, por
ejemplo, las urnas electorales. Se trata de extraer, mediante algún procedimiento aleatorio,
una muestra de conglomerados y, en los seleccionados, elegir también aleatoriamente, las
unidades que compondrán la muestra.
La unidad de muestreo es el conglomerado; es por ello que se extrae una muestra de
conglomerados y luego se eligen en dichos conglomerados a los individuos que
conformarán la muestra. El error de muestreo por conglomerados, disminuye a medida que
aumenta la heterogeneidad dentro del conglomerado; ahora bien, como no siempre los
conglomerados elegidos resultan ser heterogéneos internamente, suelen no representar
adecuadamente a la variedad de los componentes de la población, redundando en una
pérdida de precisión en las estimaciones muestrales.
Pero a pesar de esta debilidad, se utiliza en muchos casos, ya que permite minimizar los
costos de la encuesta, ya que se reducen los desplazamientos de los entrevistadores y por
ende el tiempo de realización de la encuesta.
Sudman (1976) recomienda tener en cuenta las siguientes apreciaciones, para la selección
de los conglomerados: han de estar bien definidos y delimitados; el número de elementos
que pertenecen al conglomerado debe ser conocido al menos aproximadamente; deben ser
pocos y deberían ser aquellos que reducen el error muestral y no tienen por qué estar
definidos idénticamente en todos los lugares.
Este tipo de muestreo puede ser monoetápico, cuando todas las unidades de población en
los conglomerados elegidos integran la muestra; bietápico, o sea cuando la selección
muestral continúa dentro de cada conglomerado, o lo que es equivalente a decir que en cada
Notas de Estadística
Mag. Liliana Ghersi
162
conglomerado elegido se procede a elegir una muestra. Ahora bien, si la elección aleatoria
de las unidades últimas de la muestra prosigue, se está ante un muestreo por conglomerados
polietápico (la cantidad de fases puede variar). En encuestas nacionales a la población en
general, la habitual es utilizar muestreo por conglomerados polifásico (se asume como
polietápico), que incluye la previa estratificación de la población de estudio. Se recomienda
acceder al sitio del INDEC, para profundizar en la metodología adoptada por el mismo.
VARIABLES ALEATORIAS MUESTRALES
Sea X una variable aleatoria, y sea n el tamaño de muestra predeterminado, si se eligen
aleatoriamente n elementos, de manera tal que cada elemento tenga la misma posibilidad de
ser elegido, se tiene entonces un valor de la variable aleatoria n-dimensional muestra.
Sea entonces la variable n-dimensional: (X1, X2, X3, ........, Xn), cualquier función aplicada a
dicha variable aleatoria también será una variable aleatoria. Dos funciones muy utilizadas
en la estadística muestral son:
1º
f x x x x
x
nxn
i
i
n
( , , ,...., )1 2 31
donde x
denota a la variable aleatoria media muestral -promedio de coordenadas
muestrales-.
2º - g x x x x
x x
nsn
i
i
n
( , , ,...., )1 2 3
2
1 2
donde s2 denota a la variable aleatoria varianza muestral - promedio de los desvíos
cuadráticos de las coordenadas muestrales respecto de la media muestral correspondiente-
1 - VARIABLE ALEATORIA MEDIA MUESTRAL:
1.1- DISTRIBUCION DE LA MEDIA MUESTRAL
1º) Sea X una variable aleatoria -no importa qué distribución tenga-; y sea n 30, con nN;
aplicando el Teorema Central del límite; podemos admitir que:
_
Notas de Estadística
Mag. Liliana Ghersi
163
Xn tiene una distribución aproximadamente normal -o normal en el caso de provenir de una
población con distribución normal-
2º) Sea X un variable aleatoria con distribución normal, n<30 y dispersión conocida;
podemos entonces afirmar que:
_
Xn tiene una distribución normal con dispersión conocida.
3º) Sea X un variable aleatoria con distribución normal, n<30 y dispersión desconocida;
podemos entonces afirmar que:
_
Xn tiene una distribución normal con dispersión desconocida; pero generalmente estaremos
ante una situación en la que se desconocen ambos parámetros poblacionales, por lo tanto es
necesario pivotearnos en otra variable aleatoria a los efectos de sortear el problema de la
falta de información sobre la totalidad; dicha variable será la llamada t de Student. De
manera tal que:
x t nx
sn n
x
1 1
4º) Sea X un variable aleatoria con distribución distinta a la distribución normal, y n<30
En este curso no intentaremos abordar la problemática concerniente a la situación muestral.
TEOREMA CENTRAL DEL LIMITE –UNA DEMOSTRACIÓN-
Se presenta la demostración del teorema del limite central para el caso en el cual
existe la función generadora de momentos para las variables aleatorias en la muestra. La
demostración depende de un resultado fundamental de la teoría de la probabilidad, que no
se va a demostrar en este trabajo, pero que se enuncia a continuación:
Sean Yn y Y variables aleatorias con funciones generadoras de momentos n(t) y (t)
respectivamente. Si
lim n(t) = (t)
n
para todo valor real de t, entonces la función de distribución de Yn converge a la función de
distribución de Y cuando n
El enunciado formal del teorema del limite central se presenta a continuación:
Notas de Estadística
Mag. Liliana Ghersi
164
Sean Y1 Y2 .......... Yn variables aleatorias independientes y distribuidas idénticamente con
E(Yi) = y Var(Yi) = 2
< . Defínase la variable aleatoria estanzarizada Un; de manera tal
que:
n
μYU n
, en donde
n
1i
i_
n
YY
entonces la función de distribución Un converge a una función de distribución normal
estándar cuando n
Defínanse las variables aleatorias
1
0
)(
)(
;
i
i
ii
zVar
zE
Yz
La función generadora de momentos de la variable aleatoria Zi , Zi(t) puede expresarse
como
....)E(z3!
t
2!
t1(t)
3
i
32
zi
Además,
n
1i
n
1i
ii
nn
z
n
σ
nμY
n
σ
μYU
Ya que las variables Yi son independientes, se deduce que las variables Zi son
independientes para i = 1, 2, ............... , n
Recuérdese que la función generadora de moment
os de la suma de variables aleatorias independientes es el producto de sus funciones
generadoras de momentos individuales. Por lo tanto
n
3
i
2
3
32n
ziu ...)E(z
n3!
t
n2!
t1)
n
t((t)
n
Notas de Estadística
Mag. Liliana Ghersi
165
Aplicando limite de )(tnu cuando n , considerando el limite de ))(ln( t
nu , en donde
...)E(z
n3!
t
n2!
t1nln)
n
t(ln(t)ln
3
i
2
3
32n
ziun
El desarrollo de ln(1+x) en una serie estándar es
.....4
x
3
x
2
xxx)ln(1
432
con
...)E(z
n3!
t
n2!
tx 3
i
2
3
32
resulta
...)E(z
n3!
t
n2!
t1n...)
4
x
3
x
2
xn(xx)nln(1(t)ln
3
i
2
3
32432
un
En donde los términos subsecuentes en el desarrollo contienen x3, x
4 y así sucesivamente.
Al multiplicar por n, el primer termino t2/2 ,no depende de n, mientras que todos los demás
términos tienen a n, con un exponente positivo, en el denominador.
2
t(t))(ln(lim
2
nn
o sea:
2
t
nn
2
e(t)lim
que es la función generatriz de momentos de una variable aleatoria normal estándar. Por el
teorema previo, concluimos que Un tiene una distribución que converge a la función de
distribución de una variable aleatoria normal estándar
1.2 - PARAMETROS DE LA DISTRIBUCION:
Si la variable aleatoria correspondiente a la característica poblacional en estudio tiene:
Notas de Estadística
Mag. Liliana Ghersi
166
E x
Var x
2
la variable aleatoria media muestral para n predeterminado (n tamaño de muestra)
tiene: E x( )
(Observe que el resultado no depende de n) , y;
Var xn
( )
2
(Observe que en este caso el resultado depende de n, que a valores
mayores para el tamaño de muestra elegido valores más cercanos a cero -aplique límite para
n creciendo ilimitadamente).
Veamos qué nos dicen estas igualdades:
1º) El valor esperado de la variable aleatoria poblacional es congruente con el valor
esperado de la variable aleatoria media muestra;
2º) La varianza de la variable aleatoria media muestral es la enésima parte de la varianza de
la variable aleatoria poblacional; por lo tanto esta variable aleatoria está más concentrada
alrededor del valor que la variable aleatoria poblacional, y en la medida que el tamaño de
muestra elegido sea mayor, la variable aleatoria media muestral que se genera tiene menor
variabilidad, o sea los valores cercanos a la media tienen una alta probabilidad de presen-
tarse cuando se practique el experimento.
Por lo tanto, se espera que los valores que arroje la misma, en general , sean valores
cercanos al valor -en la práctica este valor no es conocido y resulta interesante
determinarlo- Piense por ejemplo en el monto promedio de recaudación de un impuesto;
conocer dicho valor permite estimar con qué disponibilidades cuenta el Estado para afrontar
sus operaciones.
CONVERGENCIA ESTOCASTICA DE LA VARIABLE ALEATORIA MEDIA
MUESTRAL
La variable aleatoria media muestral proveniente de una variable aleatoria con valor
esperado μx y dispersión σx converge en probabilidad al valor μx.
Demostración: Por el teorema de Tchebichev se tiene que:
1εn
σ1límεμxPlím;
εn
σ1εμxP
n
σtε Si
;t
11
n
σtμxP
t
11xtDispxExP
2x
nxn
n
2x
xnx
2x
xn
2n
Que es lo que se quería demostrar; pues se ha arribado a la siguiente conclusión: en la
medida que el tamaño de muestra aumenta, se genera una variable aleatoria media
muestral que para una determinada distancia entre los valores que toma dicha variable y
el valor esperado de la variable poblacional el suceso que los valores de dicha variable
Notas de Estadística
Mag. Liliana Ghersi
167
disten del valor esperado en menos de la distancia elegida tiene una probabilidad mayor
en la medida que el tamaño de la muestra aumenta.
Gráficamente:
DISTRIBUCION DE LA VARIABLE ALEATORIA PROPORCION MUESTRAL:
Si en lugar de trabajar con variables cuantitativas se examinan variables cualitativas, la
característica que se suele considerar es la proporción de éxitos. Por ejemplo, a un
encuestador político, le interesaría estimar la proporción real de votos que obtendrá un
candidato particular o a un auditor le interesaría determinar la tasa real de ocurrencia de un
tipo particular de error.
La variable aleatoria proporcional muestral viene dada por la siguiente igualdad:
p
x
n
ii
n
1
siendo Xi variables de Bernoulli para todo I = 1,2,…………n.
A esta altura, no cabe duda de que el alumno está en condiciones de demostrar, a modo de
ejercicio,
Que E p p( )
(recordar que “p” es el parámetro de la distribución binomial) y que la
varianza de la variable proporción es igual a Var ppq
n( )
Además, puede afirmarse que, la variable proporción sigue una distribución
aproximadamente normal ( ¿por qué? )
EJEMPLOS DE VARIABLES ALEATORIAS MEDIAS MUESTRALES
SU DISTRIBUCIÓN Y SUS PARÁMETROS
Supóngase que se tiene la variable aleatoria cuya función de probabilidad se presenta en el
cuadro siguiente:
Notas de Estadística
Mag. Liliana Ghersi
168
X P(X) X P(x) XX P(x)
1 0,1 0,1 0,1
2 0,4 0,8 1,6
3 0,4 1,2 3,6
4 0,1 0,4 1,6
1 2,5 6,9
E(X) 2,5
Varianza(X) 0,65
Dispersión(X) 0,80622577
Es interesante observar que la misma tiene una distribución perfectamente simétrica, la
gráfica de la misma es:
Variable aleatoria
0
0,1
0,2
0,3
0,4
0,5
1 2 3 4
Serie2
Ahora bien, si se toman muestras de 2 elementos, se genera la siguiente variable aleatoria:
x )x(p
)x(px
)x(px 2
1 0,01 0,01 0,01
1,5 0,08 0,12 0,18
2 0,24 0,48 0,96
2,5 0,34 0,85 2,125
3 0,24 0,72 2,16
3,5 0,08 0,28 0,98
4 0,01 0,04 0,16
1 2,5 6,575
)x(E
2,5
)x(Var
0,325
)x(Disp
0,57008771
Notas de Estadística
Mag. Liliana Ghersi
169
Como se ve, el valor esperado coincide con el valor esperado de la variable de la población
de la cual proviene y la varianza coincide con la mitad de la varianza de aquélla.
Supóngase ahora, que se tiene la siguiente variable aleatoria, cuya distribución presenta una
asimetría a izquierda:
x )x(xp )x(xp )x(px 2
1 0,1 0,1 0,1
2 0,3 0,6 1,2
3 0,4 1,2 3,6
4 0,2 0,8 3,2
1 2,7 8,1
E(X) 2,7
Varianza(X) 0,81
Dispersión(X) 0,9
La gráfica de la misma es:
Variable Aleatoria X
0
0,1
0,2
0,3
0,4
0,5
1 2 3 4
P(X)
Como se puede apreciar presenta un sesgo hacia la izquierda.
Ahora bien, si se toman aleatoriamente muestras de 2 elementos cada una, se genera la
variable media muestral sobre muestras de dos elementos. A continuación se detalla dicha
variable y sus parámetros:
x )x(p
)x(px
)x(px 2
1 0,01 0,01 0,01
1,5 0,06 0,09 0,135
2 0,17 0,34 0,68
2,5 0,28 0,7 1,75
3 0,28 0,84 2,52
Notas de Estadística
Mag. Liliana Ghersi
170
3,5 0,16 0,56 1,96
4 0,04 0,16 0,64
1 2,7 7,695
)x(E
2,7
)x(Var
0,405
)x(Disp
0,6363961
Obsérvese que el valor esperado coincide con el valor esperado de la variable de la
población y que la varianza es la mitad de la varianza de la población.
La gráfica de la misma es:
Media Muestral n=2
0
0,1
0,2
0,3
1 1,5 2 2,5 3 3,5 4
Serie2
Es interesante observar que la distribución tiene forma semejante a la silueta de una
campana.
Ahora bien, si se toman aleatoriamente muestras de 3 elementos cada una, se genera la
variable media muestral sobre muestras de tres elementos. A continuación se detalla dicha
variable y sus parámetros
x )x(p
)x(px
)x(px 2
1 0,001 0,001 0,001
1,33333333 0,009 0,012 0,016
1,66666667 0,039 0,065 0,10833333
2 0,105 0,21 0,42
2,33333333 0,192 0,448 1,04533333
2,66666667 0,246 0,656 1,74933334
3 0,22 0,66 1,98
3,33333333 0,132 0,44 1,46666666
3,66666667 0,048 0,176 0,64533333
Notas de Estadística
Mag. Liliana Ghersi
171
4 0,008 0,032 0,128
1 2,7 7,56
)x(E
2,7
)x(Var
0,27
)x(Disp
0,51961524
Obsérvese que el valor esperado coincide con el valor esperado de la variable de la
población y que la varianza es la tercera parte de la varianza de la población.
La gráfica de la misma es:
Media Muestral n=3
00,05
0,10,15
0,20,25
0,3
1
1,33
3333
1,66
6667 2
2,33
3333
2,66
6667 3
3,33
3333
3,66
6667 4
Serie2
Ahora bien, si se toman aleatoriamente muestras de 4 elementos cada una, se genera la
variable media muestral sobre muestras de cuatro elementos. A continuación se detalla
dicha variable y sus parámetros
x )x(p
)x(px
)x(px 2
1 0,0001 0,0001 0,0001
1,25 0,0012 0,0015 0,001875
1,5 0,007 0,0105 0,01575
1,75 0,026 0,0455 0,079625
2 0,0681 0,1362 0,2724
2,25 0,132 0,297 0,66825
2,5 0,1936 0,484 1,21
2,75 0,216 0,594 1,6335
3 0,1816 0,5448 1,6344
3,25 0,112 0,364 1,183
3,5 0,048 0,168 0,588
3,75 0,0128 0,048 0,18
Notas de Estadística
Mag. Liliana Ghersi
172
4 0,0016 0,0064 0,0256
1 2,7 7,4925
)x(E
2,7
)x(Var
0,2025
)x(Disp
0,45
Nuevamente, el valor esperado coincide con el valor esperado de la variable de la
población y que la varianza es la cuarta parte de la varianza de la población; la gráfica
correspondiente es:
Media Muestral n=4
00,050,1
0,150,2
0,25
11,
5 22,
5 33,
5 4
Serie2
Sea ahora, una nueva variable aleatoria, que responde a la distribución que se presenta en
tabla conjuntamente con su valor esperado y su dispersión:
x )x(xp )x(xp )x(px 2
1 0,05 0,05 0,05
2 0,1 0,2 0,4
3 0,55 1,65 4,95
4 0,3 1,2 4,8
1 3,1 10,2
E(X) 3,1
Varianza(X) 0,59
Dispersión(X) 0,76811457
Es evidente que la distribución de esta variable es más asimétrica que la presentada
anteriormente, su gráfica es:
Notas de Estadística
Mag. Liliana Ghersi
173
Variable aleatoria
0
0,2
0,4
0,6
1 2 3 4
Serie2
Si se toman muestras aleatorias de dos elementos, se genera la siguiente variable aleatoria:
x )x(p
)x(px
)x(px 2
1 0,0025 0,0025 0,0025
1,5 0,01 0,015 0,0225
2 0,065 0,13 0,26
2,5 0,14 0,35 0,875
3 0,3625 1,0875 3,2625
3,5 0,33 1,155 4,0425
4 0,09 0,36 1,44
1 3,1 9,905
)x(E
3,1
)x(Var
0,295
)x(Disp
0,54313902
Y la gráfica de la misma es:
Media muestral n=2
0
0,1
0,2
0,3
0,4
1 1,5 2 2,5 3 3,5 4
Serie2
Notas de Estadística
Mag. Liliana Ghersi
174
La silueta que describe tiene una fuerte disparidad con respecto a una forma campanular,
situación que deviene de la asimetría que se presenta en la distribución de la variable
aleatoria de la población.
Si se toman muestras aleatorias de tres elementos, se genera la siguiente variable aleatoria:
x )x(p
)x(px
)x(px 2
1 0,000125 0,000125 0,000125
1,33333333 0,00075 0,001 0,00133333
1,66666667 0,005625 0,009375 0,015625
2 0,01975 0,0395 0,079
2,33333333 0,070875 0,165375 0,385875
2,66666667 0,14925 0,398 1,06133334
3 0,278875 0,836625 2,509875
3,33333333 0,29925 0,9975 3,32499999
3,66666667 0,1485 0,5445 1,9965
4 0,027 0,108 0,432
1 3,1 9,80666667
)x(E
3,1
)x(Var
0,19666667
)x(Disp
0,44347116
La gráfica de la distribución es:
Media muestral n=3
0
0,1
0,2
0,3
0,4
1
1,6
7
2,3
3 3
3,6
7
Serie2
Y por último, si se toman muestras de 4 elementos, se tiene la siguiente variable aleatoria:
x )x(p
)x(px
)x(px 2
Notas de Estadística
Mag. Liliana Ghersi
175
1 0,00000625 0,00000625 0,00000625
1,25 0,00005 0,0000625 7,8125E-05
1,5 0,000425 0,0006375 0,00095625
1,75 0,002 0,0035 0,006125
2 0,0088375 0,017675 0,03535
2,25 0,0271 0,060975 0,13719375
2,5 0,073775 0,1844375 0,46109375
2,75 0,1462 0,40205 1,1056375
3 0,23550625 0,70651875 2,11955625
3,25 0,26445 0,8594625 2,79325313
3,5 0,17415 0,609525 2,1333375
3,75 0,0594 0,22275 0,8353125
4 0,0081 0,0324 0,1296
1 3,1 9,7575
)x(E
3,1
)x(Var
0,1475
)x(Disp
0,38405729
La gráfica que le corresponde es:
Media muestral n=4
0
0,05
0,1
0,15
0,2
0,25
0,3
11,
5 22,
5 33,
5 4
Serie2
Conviene observar, cómo se va perfilando una simetría interesante hacia la derecha de la
distribución y una cola alargada hacia la izquierda de la misma, producto todo ello de la
distribución de la variable poblacional de la cual deviene.
Desde otra óptica:
Notas de Estadística
Mag. Liliana Ghersi
176
a) el eje de simetría para la distribución de la primera variable presentada coincide con
el valor de la esperanza matemática: 2.5, también se realiza la igualdad para todas
las distribuciones de las medias muestrales presentadas.
b) El “eje de simetría” para las distribuciones de las medias muestrales
correspondientes a la segunda y la tercera variable presentada , en la medida que el
tamaño de muestra aumenta tiende al valor esperado de cada una de las respectivas
variables. Es claro que en todas las distribuciones existe asimetría, pero también es
evidente que al aumentar el tamaño de muestra en la zona que contiene al valor
esperado se puede encontrar una forma bastante simétrica con respecto a dicho
valor.
2 - VARIABLE ALEATORIA VARIANZA MUESTRAL
2.1 - DISTRIBUCION DE LA VARIABLE ALEATORIA VARIANZA MUESTRAL
Si X tiene distribución normal, se tiene entonces que
s
x x
n
i
i
n
2
2
1
donde s2 denota a la variable aleatoria varianza muestral - promedio de los desvíos
cuadráticos de las coordenadas muestrales respecto de la media muestral correspondiente
como dijimos anteriormente-,
Y ns2
2 tiene distribución ²n-1; donde n-1 indica los grados de libertad de la misma.
En este curso no se trabajará con la varianza muestral para casos en que provenga de una
población con distribución distinta a la normal.
2.1 -PARAMETROS DE LA VARIANZA MUESTRAL
E s nn
2 1 2
(Observe que el resultado depende de n, a valores más grande de n, valores esperados más
parecidos a ²)
Var s n
n
2 2 2 42
(También aquí el resultado depende de n, y si aplica límite para n creciendo ilimitadamente
obtiene el valor cero)
Sea la variable:
Notas de Estadística
Mag. Liliana Ghersi
177
x p(x) x*p(x) x*x*p(x)
0 0,25 0 0
1 0,5 0,5 0,5
2 0,25 0,5 1
1 1 1,5
var(x)= 0,5 disp(x)= 0,70710678
Si se toman muestras de tres elementos, se obtienen las siguientes ternas aleatorias que
conforman la variable muestra correspondiente:
x1 x2 x3 m(x) s2 p(x1,x2;x3)
0 0 0 0 0 0,015625
0 0 1 0,33333333 0,22222222 0,03125
0 0 2 0,66666667 0,88888889 0,015625
0 1 0 0,33333333 0,22222222 0,03125
0 1 1 0,66666667 0,22222222 0,0625
0 1 2 1 0,66666667 0,03125
0 2 0 0,66666667 0,88888889 0,015625
0 2 1 1 0,66666667 0,03125
0 2 2 1,33333333 0,88888889 0,015625
1 0 0 0,33333333 0,22222222 0,03125
1 0 1 0,66666667 0,22222222 0,0625
1 0 2 1 0,66666667 0,03125
1 1 0 0,66666667 0,22222222 0,0625
1 1 1 1 0 0,125
1 1 2 1,33333333 0,22222222 0,0625
1 2 0 1 0,66666667 0,03125
1 2 1 1,33333333 0,22222222 0,0625
1 2 2 1,66666667 0,22222222 0,03125
2 0 0 0,66666667 0,88888889 0,015625
2 0 1 1 0,66666667 0,03125
2 0 2 1,33333333 0,88888889 0,015625
2 1 0 1 0,66666667 0,03125
2 1 1 1,33333333 0,22222222 0,0625
2 1 2 1,66666667 0,22222222 0,03125
2 2 0 1,33333333 0,88888889 0,015625
2 2 1 1,66666667 0,22222222 0,03125
2 2 2 2 0 0,015625
1
Reordenando los valores de la variable varianza muestral y generando dicha variable, se
llega a la siguiente tabla:
Notas de Estadística
Mag. Liliana Ghersi
178
s2 p(s2) (s2)2
0 0,15625 0
0,22222222 0,5625 0,04938272
0,66666667 0,1875 0,44444444
0,88888889 0,09375 0,79012346
1
E(s2)= 0,33333333 Var(s2)= 0,07407407
De la cual surge que el valor esperado de dicha variable coincide con (2/3)*0,5, o sea
coincide con el producto entre la varianza de la variable poblacional y el cociente entre
(n.1) y n (tamaño muestral). Debe tenerse en cuenta que no se ha partido de una variable
continu con distribución normal.
A continuación se presenta la gráfica de la distribución respectiva:
0
0,1
0,2
0,3
0,4
0,5
0,6
0 0,222222222 0,666666667 0,888888889
Distribución de la varianza muestral para n=3
3- MOMENTOS DE ORDEN SUPERIOR MUESTRALES
Los momentos de una variable aleatoria, sirven para describir el comportamiento de la
misma; ya hemos hablado del momento absoluto primero -que no es más que el valor
esperado de dicha variable- y del momento segundo centrado -que es la varianza de aquélla-
También nos hemos remitido a los momentos muestrales de primer y segundo orden; pero
tenemos a los momento centrados de orden superior -que también nos informan del
comportamiento de la variable aleatoria poblacional-; ya sean poblacionales como
muestrales
Notas de Estadística
Mag. Liliana Ghersi
179
Tomando los momentos de orden superior centrados poblacionales, se tiene que:
Si : 3/3
= 0 la variable aleatoria tiene distribución simétrica respecto de la media, donde
3 es el momento tercero centrado y m3 el momento muestral correspondiente .Cuando hay
más valores de variable ubicados a la izquierda de la media diremos que la serie es
simétrica a izquierda o que presenta una asimetría a derecha; y tendremos 3/3
>0 .Vale
para el caso contrario.
Si 4/4 - 3 = 0 diremos que la distribución es mesocúrtica -con 4 momento centrado
cuarto-; si la diferencia es menor a cero diremos que es platicúrtica o en promedio más baja
que la normal y leptocúrticua ó en promedio más alta que la normal.
Pasamos a detallar los momentos centrado muestrales, tanto tercero como cuarto -para datos
simples y datos agrupados-:
3
3
1
x x
n
i
i
n
3
3
1
x x f
fi
i i
i
n
i
4
4
1
x x
n
i
i
n
4
4
1
x x f
fi
i i
i
n
i
5.4 Esta tabla pertenece a valores de variable monto de próxima factura a emitirse y los
cuales han sido ajustados a una distribución normal con media 50 y dispersión 5; de
acuerdo al ejercicio 7 de la práctica 4.
A continuación se muestra una tabla con valores promedio muestrales sobre muestras de 3
elementos y un total de 40 muestras generados aleatoriamente:
Li Ls Valor
Prome-
dio
Frecuen-
cia
xi*f x´2*f(x´) x´
3*f(x´) x´
4*f(x´) Frec.
Acumula
da
44 46 45 2 90 67.28 -390.22 2263.3 2
46 48 47 7 329 101.08 -384.1 1459.6 9
48 50 49 7 343 22.68 -40.824 73.4832 16
50 52 51 12 612 0.48 0.096 0.0192 28
Notas de Estadística
Mag. Liliana Ghersi
180
52 54 53 5 265 24.2 53.24 117.128 33
54 56 55 3 165 52.92 222.264 933.509 36
56 58 57 4 228 153.76 953.312 5910.53 40
40 50.8 10.56 10.344 268.939
Con 850.´ ii xx
As= 0.30143
K= -0.5883
Observe que la media de las medias muestrales obtenidas arroja un valor de 50.8 u.m.; y la
varianza un valor de 10 o sea una dispersión de 3.16 -piense que 88723
5. -
Por ser el momento tercero centrado positivo se concluye que hay un predominio de los
valores que se encuentran más a la derecha -los más grandes- Estamos comparando con una
curva correspondiente a una distribución normal; que por fundamentación teórica sabemos
que esta variable tiene.
No se olvide que son valores muestrales o sea momentos centrados muestrales
m
m
e
o
5020 16
122 50 0 666 50 666
505
5 72 50 0833 50833
* . .
* . .
Observe que media, mediana y modo no son congruentes, por lo tanto podríamos decir que
la distribución no es simétrica; tenga en cuenta que son semejantes y todos se encuentran en
el mismo intervalo.
Si analizamos si existe exceso -en cuanto a altura máxima- se tiene:
4/s4 - 3 = -0.5883;
por lo tanto es más baja la distribución empírica que la distribución normal.
Notas de Estadística
Mag. Liliana Ghersi
181
DIST RIBUCION EMPIRICA
MEDIA MUEST RAL N=3
0
5
10
15
45 47 49 51 53 55 57
Y la distribución empírica de frecuencias acumuladas es:
DIST RIBUCION ACUMULADA
EMPRIRICA PARA MEDIA
MUEST RAL N=3
0
5
10
15
20
25
30
35
40
45 47 49 51 53 55 57
A continuación se muestra una tabla con valores varianzas muestrales sobre muestras de 3
elementos y un total de 40 muestras generados aleatoriamente:
Li Ls Valor
Prome-
dio
Frecuen-
cia
xi*f x´2*f(x´) x´
3*f(x´) x´
4*f(x´) Frecuencia
Acumulada
Notas de Estadística
Mag. Liliana Ghersi
182
0 11 5.5 21 115.5 15881.3 -436734 8578710.94 21
11 22 16.5 11 181.5 2994.75 -49413 1111800.94 32
22 33 27.5 3 82.5 90.75 -499.13 13725.9375 35
33 44 38.5 2 77 60.5 332.75 13725.9375 37
44 55 49.5 1 49.5 272.25 4492.13 74120.0625 38
55 66 60.5 1 60.5 756.25 20796.9 8578710.94 39
66 77 71.5 1 71.5 1482.25 1482.25 32955975.9 40
40 15.95 538.45 -11489 12831692.7
As= -0.9195
K= 41.2581429
Con 850.´ ii xx
Observe los valores obtenidos, y recuerde:
E(s²) = ((n-1)/n)*² = (2/3)25 = 16.6 y
Var(s²)= (2*(n-1)/n²)*4= 277.7
me = 0 + [(20-0)/21]*11 = 10,476
mo = 0+ [21/(21+10)]*11 = 7.45
m
m
e
o
020 0
2111 10 476
021
21 1011 7 45
* .
* .
Observe que media, mediana y modo son distintos por lo tanto podemos afirmar que la serie
no es simétrica; situación lógica ya que la distribución madre no es simétrica.
A partir del momento tercero, se puede comprobar que esta serie es asimétrica positiva, o
sea hay muchos valores cercanos al origen. En cuanto a la altura, se puede aceptar que está
dentro de las más altas.
Notas de Estadística
Mag. Liliana Ghersi
183
Ahora bien, si en vez de tomar muestras de 3 elementos tomamos muestras de 12
elementos, analicemos lo que sucede -los valores son los mismos reagrupados-:
PARA LA MEDIA MUESTRAL:
Notas de Estadística
Mag. Liliana Ghersi
184
Con 849.´ ii xx
Li Ls Valor
Prome-
Dio
Fre-
Cuencia
xi*f x´2*f(x´) x´
3*f(x´) x´
4*f(x´) Frec.
Acumu-
Lada
46.5 48 47.25 2 94.5 25.205 -89.478 317.646 2
48 49.5 48.75 2 97.5 8.405 -17.23 35.322 4
49.5 51 50.25 4 201 1.21 -0.6655 0.36602 8
51 52.5 51.75 1 51.75 0.9025 0.85738 0.81451 9
52.5 54 53.25 1 53.25 6.0025 14.7061 36.03 10
10 49.8 4.1725 -9.181 39.0179
AS= -3.3005
K= -0.7589
Analice usted los valores obtenidos. Compare.
DIST RIBUCION EMPIRICA
MEDIA MUEST RAL N=12
0
1
2
3
4
48.3 49.8 51.3 52.8 54.3
Compare los gráficos para n=3 y n=12.
Notas de Estadística
Mag. Liliana Ghersi
185
D IS T R IB U C IO N A C U M U L A D A
M E D IA S M U E S T R A L E S N = 1 2
0
2
4
6
8
10
47.3 48.8 50.3 51.8 53.3
VALORES VARIANZA MUESTRAL:
Con 849.´ ii xx
Notas de Estadística
Mag. Liliana Ghersi
186
Li Ls Valor
Prome-
Dio
Fre-
Cuenc
ia
xi*f x´2*f(x´) x´
3*f(x´) x´
4*f(x´) Frec.
Acumu-
Lada
7.5 15.5 11.5 4 46 5041 -178956 6352920 4
15.5 23.5 19.5 2 39 1512.5 -41594 1143828 6
23.5 31.5 27.5 1 27.5 380.25 -7414.9 144590 7
31.5 39.5 35.5 3 106.5 396.75 -4562.6 52470.2 10
10 21.9 733.05 -23253 769381
AS= -1.1716
K= 1.43177
DIST RIBUION EMPIRICA VARIANZA
MUEST RAL N=12
0
0.5
1
1.5
2
2.5
3
3.5
4
11.5 19.5 27.5 35.5
Notas de Estadística
Mag. Liliana Ghersi
187
DIST RIBUCION ACUMULADA
EMPIRICA VARIANZA
MUEST RAL N=12
0
2
4
6
8
10
11.5 19.5 27.5 35.5
7 - Sea la variable aleatoria monto de factura próxima a emitirse, como la que hemos
presentado en la práctica anterior; X: N( 50,5); si se toman aleatoriamente muestras de 3
elementos; calcule las siguientes probabilidades:
7.1 - Que la media muestral no supere los 50 pesos.
7.2 - Que la media muestral supere los 50 pesos
7.3 - P x
60
7.4 - P x
40
7.5 - P x40 60
7.6 - P x x40 60 70
/
7.7 -El monto promedio muestral de las 3 facturas próximas a emitirse no difiera de 50
pesos en más de 10 pesos.
7.8 -El monto promedio de 3 facturas próxima a emitirse difiera de su valor esperado en
más de 5 pesos.
7.9 - Cuál es el monto promedio muestral de las 3 facturas próximas a emitirse que es
superado por el 80% de los promedios muestrales (n=3) montos de factura próxima a
emitirse?
Compare todos los resultados con los ítems semejantes del ejercicio 7 práctica 4.
7.10 - Que la dispersión muestral supere los 5 pesos
7.11 - Que la dispersión muestral supere los 2 pesos
Notas de Estadística
Mag. Liliana Ghersi
188
7.12 - Que la dispersión muestral se encuentre entre 2 y 7 pesos
7.13 - Que la dispersión muestral supere los 5 pesos sabiendo que supera los 2 pesos.
7.14 - Que la dispersión muestral supere los 2 pesos, sabiendo que la media muestral supera
los 50 pesos.
_
Solución: recuerde que X N:{50, 5/3); aquí se conocen los dos parámetros poblacionales.
7.1 - 5050 .
xP ; pues 50 es el valor esperado de la variable. O sea en el 50% de los
casos que se practique el experimento de medir la confianza del monto promedio a facturar
en las próximas 3 facturas a emitir se espera que el mismo sea por un monto menor a 50
pesos
7.2 - P x
50 05. ; Interprete.
7.3 - P x Px
Px
6050
5
3
60 50
5
3
50
5
3
346 0 9997. .
Es decir que de 10000 veces que practique el experimento de medir la confianza del monto
promedio muestral a facturar en las próximas 3 facturas a emitir -elegidas aleatoriamente-
espero que 9997 sean promedio muestrales de 3 facturas que se emitan por un monto menor
a 60 pesos.
Compare los valores de probabilidad y los valores de variables estandarizadas.
7.4 - 00030999701463
3
5
50
3
5
5040
3
5
5040 ...
x
Px
PxP
Es decir que de 10000 veces que practique el experimento de medir la confianza del monto
promedio muestral a facturar en las próximas 3 facturas a emitir -elegidas aleatoriamente-
espero que 3 sean promedios muestrales que se emitan por un monto menor a 40 pesos.
Compare con los valores empíricos acumulados.
7.5-
P x Px
Px
40 6040 50
5
3
50
5
3
60 50
5
3
34650
5
3
346 0 9997 1 0 9997 0 9994
. . . ( . ) .
Interprete los resultados, actividad que le propongo haga para todos los ítems restantes
Notas de Estadística
Mag. Liliana Ghersi
189
7.6 - 99940
926
3
5
50
99940
3
5
5070
3
5
50
3
5
5060
3
5
50
3
5
5040706040 .
.
.//
xP
xxPxxP
7.7 -El monto promedio de 3 facturas próxima a emitirse no difiera de 50 pesos en más de
10 pesos.
P x P x Px
50 10 10 50 1010
5
3
50
5
3
10
5
3
0 9994. (ver 7.5)
7.8 -El monto promedio de 3 facturas próxima a emitirse difiera de su valor esperado en
más de 5 pesos.
P x P x P x Px
50 5 1 50 5 1 5 50 5 1 17350
5
3
173 1 0 91636 0 08366. . . .
7.9 - Cuál es el monto promedio muestral de las 3 facturas próximas a emitirse que es
superado por el 80% de los promedios muestrales (n=3) montos de factura próxima a
emitirse?
5747
3
5
50840
3
5
50
3
5
50
3
5
50
3
5
5080
..
.
AA
AxP
xAPxAP
O sea el monto promedio muestral de 3 facturas próximas a emitirse, que es superado por el
80% de los montos promedio muestrales de 3 facturas próximas a emitirse es 47.724.
7.10 - Que la dispersión muestral supere los 5 pesos
Como proviene de una población normal s²
3 2
2
s
tendrá una distribución χ² con 2 grados de libertad.
Notas de Estadística
Mag. Liliana Ghersi
190
P s Ps
Ps2
2
2
2
225
33 1
33 1 0 75 0 25
. .
7.11 - Que la dispersión muestral supere los 2 pesos
P s Ps
Ps2
2
2
2
24
33 016
30 48 1 015 085
* . . . .
7.12 - Que la dispersión muestral se encuentre entre 2 y 7 pesos
P s Ps
Ps
Ps
4 49 3 0163
3 196
3588
30 48 0 95 015 08
22
2
2
2
2
2
* . * .
. . . . .
7.13 - Que la dispersión muestral supere los 5 pesos sabiendo que supera los 2 pesos.
3125080
250
4803
33
16033
33
425
2
2
2
2
2
2
2
222
..
.
.
.*//
sP
sP
ssPssP
7.14 - Que la dispersión muestral supere los 2 pesos, sabiendo que la media muestral supera
los 50 pesos. _
Por el lema de Fisher, tenga presente que s² y X son variables aleatorias independientes, por
lo tanto:
P s x P s Ps
Ps2 2
2
2
2
24 50 4
33 016
30 48 1 015 085
/ * . . . .
8 - Realice el ejercicio, pero tomando muestras de 12 elementos y luego de 36 elementos; y
compare los resultados.
9- Suponga ahora que la dispersión de la variable aleatoria monto de próxima factura a
emitirse no es conocida y se sabe que la dispersión muestral es 5, pero el tamaño de
muestra es 36; calcule las probabilidades solicitadas en el ejercicio 7, en lo pertinente al
promedio muestral.
Solución: por ser el tamaño de muestra mayor a 30, se puede tomar X N:(50,5) a partir
de lo que enuncia el teorema de Linderberg:
Si X1, X2, X3, ....Xn, es una sucesión finita de variables aleatorias independientes, que tiene
la misma distribución probabilística, con media: y dispersión: comunes Xi
Notas de Estadística
Mag. Liliana Ghersi
191
Z Xn i
i
n
1
es asintóticamente normal con: media = n,y dispersión = n.
9.1 - Que la media muestral no supere los 50 pesos.
9.2 - Que la media muestral supere los 50 pesos
9.3 - P x
60
9.4 - P x
40
9.5 - P x40 60
9.6 - P x x40 60 70
/
9.7 -El monto promedio muestral de las 3 facturas próximas a emitirse no difiera de 50
pesos en más de 10 pesos.
9.8 -El monto promedio de 3 facturas próxima a emitirse difiera de su valor esperado en
más de 5 pesos.
9.9 - Cuál es el monto promedio muestral de las 3 facturas próximas a emitirse que es
superado por el 80% de los promedios muestrales (n=3) montos de factura próxima a
emitirse?
Compare todos los resultados con los ítems semejantes del ejercicio 7 práctica 4 y el
ejercicio 7 de esta práctica.
_
9.1 - P(X 50) = 0.5; pues 50 es el valor esperado de la variable. O sea en el 50% de los
casos que se practique el experimento de medir la confianza del monto promedio a facturar
en las próximas 36 facturas a emitir se espera que el mismo sea por un monto menor a 50
pesos
_
9.2 - P(X 50) = 0.5 Interprete.
9.3 - 112
6
5
50
36
5
5060
36
5
5060
x
Px
PxP
Es decir que de 10000 veces que practique el experimento de medir la confianza del monto
promedio muestral a facturar en las próximas 36 facturas a emitir -elegidas
aleatoriamente- espero que 10000 sean promedio muestrales de 36 facturas que se emitan
por un monto menor a 60 pesos.
Compare los valores de probabilidad y los valores de variables estandarizadas.
Notas de Estadística
Mag. Liliana Ghersi
192
9.4 - 01112
6
5
50
36
5
5040
36
5
5040
x
Px
PxP
Es decir que de 10000 veces que practique el experimento de medir la confianza del monto
promedio muestral a facturar en las próximas 36 facturas a emitir -elegidas aleatoriamente-
espero que ninguna sean promedios muestrales que se emitan por un monto menor a 40
pesos.
Compare con los valores empíricos acumulados.
9.5 - P x Px
Px
40 6040 50
5
36
50
5
36
60 50
5
36
1250
5
36
12 1
Interprete los resultados, actividad que le propongo haga para todos los ítems restantes
9.6 - P x x Px x
Px
40 60 7040 50
5
36
50
5
36
60 50
5
36
50
5
36
70 50
5
36
1
50
5
36
20
1
/ /
9.7 -El monto promedio de 36 facturas próxima a emitirse no difiera de 50 pesos en más de
10 pesos.
1
36
5
10
36
5
50
36
5
1010501060401050
x
PxPxPxP
(ver 7.5 y 7.7)
9.8 -El monto promedio de 36 facturas próxima a emitirse difiera de su valor esperado en
más de 5 pesos.
0116
36
5
5061550515501550
x
PxPxPxP
Notas de Estadística
Mag. Liliana Ghersi
193
9.9 - Cuál es el monto promedio muestral de las 36 facturas próximas a emitirse que es
superado por el 80% de los promedios muestrales (n=36) montos de factura próxima a
emitirse?
36
5
50
36
5
50
36
5
50
36
5
5080
AxP
xAPxAP .
0 8450
5
36
49 3. .
A
A
O sea el monto promedio muestral de 36 facturas próximas a emitirse, que es superado por
el 80% de los montos promedio muestrales de 36 facturas próximas a emitirse es 49.3.
Observe como el valor de variable aleatoria se ha acercado al valor esperado, respecto de
los otros ejercicios -para la misma proporción-
10- Suponga ahora que la dispersión de la variable aleatoria monto de próxima factura a
emitirse no es conocida y se sabe que la dispersión muestral es 5,; calcule las
probabilidades solicitadas en el ejercicio 7, en lo pertinente al promedio muestral.
Solución: como la variable poblacional tiene distribución normal, y el tamaño de la muestra
es menor a 30, se puede utilizar para medir la expectativa correspondiente la variable t de
Student; para el caso de n=3 se tiene:
5
5022
xt
10.1 - Que la media muestral no supere los 50 pesos.
10.2 - Que la media muestral supere los 50 pesos
10.3 -
60xP
10.4 -
40xP
10.5 -
6040 xP
Notas de Estadística
Mag. Liliana Ghersi
194
10.6 -
706040 xxP /
10.7 -El monto promedio muestral de las 3 facturas próximas a emitirse no difiera de 50
pesos en más de 10 pesos.
10.8 -El monto promedio de 3 facturas próximas a emitirse difiera de su valor esperado en
más de 5 pesos.
10.9 - Cuál es el monto promedio muestral de las 3 facturas próximas a emitirse que es
superado por el 80% de los promedios muestrales (n=3) montos de factura próxima a
emitirse?
Compare todos los resultados con los ítems semejantes del ejercicio 7 práctica 4 y el
ejercicio 7 y 8 de esta práctica.
10.1 - 5005
50250 .
x
PxP
pues 50 es el valor esperado de la variable. O sea en el 50% de los casos que se practique el
experimento de medir la confianza del monto promedio a facturar en las próximas 36
facturas a emitir se espera que el mismo sea por un monto menor a 50 pesos
10.2 - 5005
50250 .
x
PxP Interprete.
10.3 - 9605
102
5
502
5
50602
5
50260 .
x
Px
PxP
Es decir que de 10000 veces que practique el experimento de medir la confianza del monto
promedio muestral a facturar en las próximas 3 facturas a emitir -elegidas aleatoriamente-
espero que 9600 sean promedio muestrales de 3 facturas que se emitan por un monto menor
a 60 pesos.
Compare los valores de probabilidad y los valores de variables estandarizadas.
10.4 - P x Px
Px
40 2
50
52
40 50
52
50
52
10
50 04.
Es decir que de 10000 veces que practique el experimento de medir la confianza del monto
promedio muestral a facturar en las próximas 3 facturas a emitir -elegidas aleatoriamente-
espero que 400 sean promedios muestrales que se emitan por un monto menor a 40 pesos.
Compare con los valores empíricos acumulados.
10.5 - 9200409605
102
5
502
5
102
5
50602
5
502
5
504026040 ...
x
Px
PxP
Interprete los resultados, actividad que le propongo haga para todos los ítems restantes
Notas de Estadística
Mag. Liliana Ghersi
195
10.6 -
9201
040960
5
50702
5
502
5
102
5
502
5
102
5
50702
5
502
5
50602
5
502
5
50402706040
...
//
xP
xP
xxPxxP
10.7 -El monto promedio de 3 facturas próxima a emitirse no difiera de 50 pesos en más de
10 pesos.
9200409605
102
5
502
5
102
5
50602
5
502
5
50402
10501060401050
...
xP
xP
xPxPxP
(ver 9.5)
10.8 -El monto promedio de 36 facturas próxima a emitirse difiera de su valor esperado
en más de 5 pesos.
801090125
50212
5
52
5
502
5
52
5
50552
5
502
5
50452
5550451551550
...)()(
xP
xP
xP
xPxPxP
10.9 - Cuál es el monto promedio muestral de las 3 facturas próximas a emitirse que es
superado por el 80% de los promedios muestrales (n=36) montos de factura próxima a
emitirse?
25
502
5
502
5
5080 2
AtP
xAPxAP .
Notas de Estadística
Mag. Liliana Ghersi
196
0 8450
5
2
47 02. .
A
A
O sea el monto promedio muestral de 3 facturas próximas a emitirse, que es superado por el
80% de los montos promedio muestrales de 3 facturas próximas a emitirse es 47.02.
11- Realice el ejercicio para muestras de 12 elementos, suponiendo que no se conoce la
dispersión de la población y la de la muestra es 5. No se olvide las comparaciones.