Capitulo 2 (2)

36
Cap´ ıtulo 1 Medidas de Posici´on y Dispersi´on Los fen´omenos biol´ogicos no suelen ser constantes, por lo que ser´a necesario que junto a una medida que indique el valor alrededor del cu´al se agrupan los datos, se asocie una medida que haga referencia a la variabilidad que refleje dicha fluctuaci´on. En este sentido pueden examinarse varias caracter´ ısticas, siendo las m´as comunes: La tendencia central de los datos; La dispersi´on o variaci´ on con respecto a este centro; Los datos que ocupan ciertas posiciones. La simetr´ ıa de los datos. La forma en la que los datos se agrupan. 1

Transcript of Capitulo 2 (2)

  • Captulo 1

    Medidas de Posicion y Dispersion

    Los fenomenos biologicos no suelen ser constantes, por lo que sera necesario que junto

    a una medida que indique el valor alrededor del cual se agrupan los datos, se asocie una

    medida que haga referencia a la variabilidad que reeje dicha uctuacion. En este sentido

    pueden examinarse varias caractersticas, siendo las mas comunes:

    La tendencia central de los datos;

    La dispersion o variacion con respecto a este centro;

    Los datos que ocupan ciertas posiciones.

    La simetra de los datos.

    La forma en la que los datos se agrupan.

    1

  • A lo largo de este captulo, y siguiendo este orden, iremos estudiando los estadsticos

    que nos van a orientar sobre cada uno de estos niveles de informacion: valores alrededor de

    los cuales se agrupa la muestra, la mayor o menor uctuacion alrededor de esos valores, nos

    interesaremos en ciertos valores que marcan posiciones caractersticas de una distribucion

    de frecuencias as como su simetra y su forma.

    1.1. Estadsticos de tendencia central

    Las tres medidas mas usuales de tendencia central son:

    La media,

    La mediana,

    La moda.

    1.1.1. La media o media aritmetica X

    La media aritmetica de una variable estadstica es la suma de todos sus posibles valores,

    ponderada por las frecuencias de los mismos. Es decir, si la tabla de valores de una variable

    X es

    X fi hi

    x1 f1 h1

    ... ... ...

    xk fk hk

    la media es el valor que podemos escribir de las siguientes formas equivalentes:

    X = x1h1 + :::+ xkhk

    =1

    n(x1f1 + :::+ xkfk)

    =1

    n

    kXi=1

    xifi

    Si los datos no estan ordenados en una tabla, entonces

    X =x1 + :::+ xn

    n

    Observacion

    Hemos supuesto implcitamente en la denicion de media que tratabamos con una variable

    X discreta. Si la variable es continua tendremos que cambiar los valores de xi por las

    marcas de clase correspondientes. En general, la media aritmetica obtenida a partir de

    las marcas de clase mi, diferira de la media obtenida con los valores reales, xi. Es decir,

    2

  • habra una perdida de precision que sera tanto mayor cuanto mayor sea la diferencia entre

    los valores reales y las marcas de clase, o sea, cuanto mayores sean las longitudes ai, de

    los intervalos.

    Ejemplo 1.1. Calcular la media aritmetica de la distribucion de frecuencias de los 45

    ingresos quincenales del ejemplo 1.6

    Solucion

    Del cuadro 1.6 tenemos:

    X =1

    n

    kXi=1

    mifi =2702

    45= $60;04

    Proposicion 1.1. Dados r grupos con n1; n2; :::; nr observaciones y siendo X1, X2 ,...,Xr

    las respectivas medias de cada uno de ellos. Entonces la media de las n = n1+n2+ :::+nr

    observaciones es

    X =n1X1 + :::+ nrXr

    n1 + :::+ nr

    Observacion

    A pesar de las buenas propiedades que ofrece la media, esta posee algunos inconvenientes:

    a Uno de ellos es que es muy sensible a los valores extremos de la variable: ya que todas las

    observaciones intervienen en el calculo de la media, la aparicion de una observacion

    extrema, hara que la media se desplace en esa direccion. En consecuencia,

    b No es recomendable usar la media como medida central en las distribuciones muy

    asimetricas;

    c Depende de la division en intervalos en el caso de variables continuas.

    d Si consideramos una variable discreta, por ejemplo, el numero de hijos en las familias

    de Arequipa el valor de la media puede no pertenecer al conjunto de valores de la

    variable; Por ejemplo X = 2;5 hijos.

    1.1.2. La mediana Med

    Consideramos una variable discreta X cuyas observaciones en una tabla estadstica

    han sido ordenadas de menor a mayor. Llamaremos mediana, Med, al primer valor de la

    variable que deja por debajo de s al 50% de las observaciones.

    La mediana es la medida promedio que depende del numero de datos ordenados y no

    de los valores de estos datos.

    Ejemplo 1.2. Calcular la mediana para la siguiente serie de datos

    3

  • a 120 3 14 1 99 7 30 2000 16

    b 30 77 3 300 36 11 10000 29

    Solucion

    a La serie ordenada de los nueve datos es:

    1 3 7 14 16 30 99 120 2000

    La mediana es el quinto dato ordenado que divide a la serie en 2 grupos de 4 datos

    cada uno. Esto es Med = 16:

    b La serie ordenada de los ocho datos es:

    3 11 29 30 36 77 300 10000

    La mediana en este caso, puede ser cualquier numero situado entre 30 y 36, ya que

    este dividira a los datos en dos grupos de 4 datos cada uno. Pero, para evitar la

    innidad de valores, se elige como mediana la semisuma de los dos valores centrales.

    Esto es, Med =30+36

    2 .

    Mediana de datos tabulados

    - Si los valores de una variable se tabulan en una distribucion de frecuencias por intervalos

    el calculo de la mediana se determina aproximadamente por interpolacion a partir de la

    distribucion de frecuencias acumuladas

    Para calcular la mediana.

    Primero se determina el intervalo Ii = [Li1; Li[ que contiene a la mediana. Para esto,se determina las frecuencias acumuladas Fi y Fi1 de manera que:

    Fi1 n2< Fi

    La medianaMed 2 [Li1; Li[ intervalo de amplitud A, cuya frecuencia absoluta acumuladaes Fi y la frecuencia absoluta es fi:

    Segundo Se aplica la siguiente formula para el calculo de la mediana:

    Med = Li1 +n2 Fi1

    fiA

    4

  • Si en lugar de las frecuencias absolutas se utilizan las relativas (o porcentajes), enton-

    ces, haciendo hi =fin ; Hi =

    Fi1n en la formula de la mediana, se tiene:

    Med = Li1 +12 Hi1

    hiA

    Observacion

    Entre las propiedades de la mediana, vamos a destacar las siguientes:

    Como medida descriptiva, tiene la ventaja de no estar afectada por las observaciones

    extremas, ya que no depende de los valores que toma la variable, sino del orden de

    las mismas. Por ello es adecuado su uso en distribuciones asimetricas.

    Es de calculo rapido y de interpretacion sencilla.

    A diferencia de la media, la mediana de una variable discreta es siempre un valor de

    la variable que estudiamos (ej. La mediana de una variable numero de hijos toma

    siempre valores enteros).

    Es funcion de los intervalos escogidos.

    Ejemplo 1.3. Obtener la media aritmetica y la mediana en la distribucion adjunta. De-

    terminar gracamente cual de los dos promedios es mas signicativo.

    5

  • [Li1; Li[ fi[ 0 , 10 [ 60

    [ 10 , 20 [ 80

    [ 20 , 30 [ 30

    [ 30 , 100 [ 20

    [ 100 , 500 ] 10

    Solucion

    [Li1; Li[ fi A m mfi Fi[ 0 , 10 [ 60 10 5 300 60

    [ 10 , 20 [ 80 10 15 1200 140

    [ 20 , 30 [ 30 10 25 750 170

    [ 30 , 100 [ 20 70 65 1300 190

    [ 100 , 500 ] 10 400 300 3000 200

    Total 200 6550

    La media aritmetica es:

    X =1

    n

    kXi=1

    mifi =6550

    200= 32;75

    La primera frecuencia absoluta acumulada que supera el valor n2 = 100 es Fi = 140. Por

    ello el intervalo que contiene a la mediana es [10,20[.Asi:

    Med = Li1 +n2 Fi1

    fiA = 10 +

    2002 6080

    10 = 15

    Para ver la representatividad de ambos promedios, realizamos el histograma en la siguiente

    gura , y observamos que dada la forma de la distribucion, la mediana es mas representa-

    tiva que la media.

    6

  • 1.1.3. La moda Mo

    Llamaremos moda a cualquier maximo relativo de la distribucion de frecuencias, es

    decir, cualquier valor de la variable que mas veces se repite.

    La moda no siempre existe y si existe, no siempre es unica.

    Ejemplo 1.4. La moda de los datos:

    a 7 9 7 8 7 4 7 13 7 es igual a 7. Esta serie de datos es unimodal.

    b 5 3 4 5 7 3 5 6 3 es igual tanto a 3, como a 5. Esta serie de datos es bimodal.

    c 31 11 12 19 no existe. (Tambien vale decir que cada uno de los datos es una moda).

    Moda de datos tabulados por intervalos

    En el caso de variables continuas (o discretas por intervalos) es mas correcto hablar de

    intervalos modales. Una vez que este intervalo, [li1; Li[, se ha obtenido, se utiliza lasiguiente formula para calcular la moda:

    Mo = Li1 +

    d1d1 + d2

    A;

    donde:

    Li1: es el limite inferior del intervalo modald1 = fi fi1, esto es, d1 es igual a la frecuencia absoluta modal menos la frecuenciaabsoluta del intervalo inmediatamente anterior.

    d2 = fi fi+1, esto es, d2 es igual a la frecuencia absoluta modal menos la frecuenciaabsoluta del intervalo inmediatamente posterior.

    A: es la amplitud del intervalo modal.

    Observacion

    a Es muy facil de calcular.

    b Puede no ser unica.

    c Es funcion de los intervalos elegidos a traves de su amplitud, numero y lmites de los

    mismos.

    d Aunque el primero o el ultimo de los intervalos no posean extremos inferior o superior

    respectivamente, la moda puede ser calculada.

    Relacion entre media, mediana y moda

    En el caso de distribuciones unimodales, la mediana esta con frecuencia comprendida entre

    la media y la moda (incluso mas cerca de la media). En distribuciones que presentan cierta

    7

  • inclinacion, es mas aconsejable el uso de la mediana. Sin embargo en estudios relacionados

    con propositos estadsticos y de inferencia suele ser mas apta la media.

    Veamos un ejemplo de calculo de estas tres magnitudes.

    Ejemplo 1.5. Consideramos una tabla estadstica relativa a una variable continua, de la

    que nos dan los intervalos, las marcas de clase mi, y las frecuencias absolutas, fi.

    [Li1; Li[ mi fi[ 0 , 2 [ 1 2

    [ 2 , 4 [ 3 1

    [ 4 , 6 [ 5 4

    [ 6 , 8 [ 7 3

    [ 8 , 10 ] 9 2

    Solucion

    Para calcular la media podemos a~nadir una columna con las cantidades mifi. La suma de

    los terminos de esa columna dividida por n = 12 es la media:

    [Li1; Li[ mi fi Fi mifi[ 0 , 2 [ 1 2 2 2

    [ 2 , 4 [ 3 1 3 3

    [ 4 , 6 [ 5 4 7 20

    [ 6 , 8 [ 7 3 10 21

    [ 8 , 10 ] 9 2 12 18

    Total 12 64

    X =1

    n

    kXi=1

    mifi =64

    12= 5;33

    La mediana es el valor de la variable que deja por debajo de s a la mitad de las n obser-

    vaciones, es decir 6. Construimos la tabla de las frecuencias absolutas acumuladas, Fi, y

    vemos que eso ocurre en la modalidad tercera, es decir,

    i = 3

    [Li1; Li[= [4; 6[ Intervalo donde se encuentra la mediana

    Med = Li1 +n2Fi1fi

    A = 4 +12234 2 = 5;5

    Para el calculo de la moda, lo primero es encontrar los intervalos modales, buscando

    los maximos relativos en la columna de las frecuencias absolutas, fi. Vemos que hay dos

    modas, correspondientes a las modalidades i = 1, i = 3. En el primer intervalo modal,

    8

  • [L0; L1[= [0; 2[; la moda se calcula como

    Mo = Li1 +

    d1d1 + d2

    A = 0 +

    2 0

    (2 0) + (2 1) 2 = 1;33

    En el segundo intervalo modal, [L2; L3[= [4; 6[; la moda se calcula como

    Mo = Li1 +

    d1d1 + d2

    A = 4 +

    4 1

    (4 1) + (4 3) 2 = 5;5

    En este caso, como se ve en la siguiente gura, la moda no toma un valor unico, sino el

    conjunto Mo = f1;33; 5;5g

    1.2. Estadsticos de posicion

    Para una variable discreta, se dene el percentil de orden k, como la observacion, Pk,

    que deja por debajo de si el k% de la poblacion. Esta denicion nos recuerda a la mediana,

    pues como consecuencia de la denicion es evidente que Med = P50. En el caso de una

    variable continua, el intervalo donde se encuentra Pk 2 [Li1; Li[, se calcula buscando elque deja debajo de si al k% de las observaciones. Dentro de el, Pk se obtiene segun la

    relacion:

    Pk = Li1 +n k100 Fi1

    fiA

    Por su propia naturaleza, el percentil puede estar situado en cualquier lugar de la distri-

    bucion, por lo que no puede considerarsele como una medida de tendencia central.

    9

  • Los cuartiles, Qi; son un caso particular de los percentiles. Hay 3, y se denen como:

    Q1 = P25

    Q2 = P50 =Med

    Q3 = P75

    De forma analoga se denen los deciles como los valores de la variable que dividen a las

    observaciones en 10 grupos de igual tama~no. Mas precisamente, denimos D1; D2; :::; D9

    como:

    Di = P10; i = 1; :::; 9

    Los percentiles (que incluyen a la mediana, cuartiles y deciles) tambien son denominados

    estadsticos de posicion.

    Ejemplo 1.6. Dada la siguiente distribucion en el numero de hijos de cien familias, hallar

    sus cuartiles.

    xi fi Fi

    0 14 14

    1 10 24

    2 15 39

    3 26 65

    4 20 85

    5 15 100

    Total 100

    Solucion

    1. Primer cuartil: n4 = 25; Primer Fi >n4 = 39; luego Q1 = 2

    2. Segundo cuartil: 2n4 = 50; Primer Fi >2n4 = 65; luego Q2 = 3

    3. Tercer cuartil: 3n4 = 75; Primer Fi >3n4 = 85; luego Q3 = 4

    Ejemplo 1.7. Calcular los cuartiles en la siguiente distribucion de una variable continua:

    [Li1; Li[ fi Fi[ 0 , 1 [ 10 10

    [ 1 , 2 [ 12 22

    [ 2 , 3 [ 12 34

    [ 3 , 4 [ 10 44

    [ 4 , 5 ] 7 51

    Total 51

    10

  • Solucion

    1. Primer cuartil:n4 = 12;75; Primer Fi >

    n4 = 22; luego la linea i es la del intervalo [1,2[

    Q1 = P25 = Li1 +n4 Fi1

    fiA = 1 +

    12;75 1012

    1 = 1;23

    2. Segundo cuartil:2n4 = 25;5; Primer Fi >

    2n4 = 34; luego la linea i es la del intervalo [2,3[

    Q2 = P50 = Li1 +2n4 Fi1

    fiA = 2 +

    25;5 2212

    1 = 2;29

    3. Tercer cuartil:3n4 = 38;25; Primer Fi >

    3n4 = 44; luego la linea i es la del intervalo [3,4[

    Q3 = P75 = Li1 +3n4 Fi1

    fiA = 3 +

    38;25 3410

    1 = 3;445

    Ejemplo 1.8. Han sido ordenados los pesos de 21 personas en la siguiente tabla:

    [Li1; Li[ fi[ 38 , 45 [ 3

    [ 45 , 52 [ 2

    [ 52 , 59 [ 7

    [ 59 , 66 [ 3

    [ 66 , 73 ] 6

    Total 21

    Encontrar aquellos valores que dividen a los datos en 4 partes con el mismo numero de

    observaciones.

    Solucion

    Las cantidades que buscamos son los tres cuartiles: Q1; Q2 y Q3. Para calcularlos, le

    a~nadimos a la tabla las columnas con las frecuencias acumuladas, para localizar que in-

    tervalos son los que contienen a los cuartiles buscados:

    [Li1; Li[ fi Fi[ 38 , 45 [ 3 3

    [ 45 , 52 [ 2 5

    [ 52 , 59 [ 7 12 Q1; Q2

    [ 59 , 66 [ 3 15

    [ 66 , 73 ] 6 21 Q3

    Total 21

    11

  • Q1 y Q2 se encuentran en el intervalo [52,59[, ya que F3 = 12 es la primera frecuencia de

    distribucion acumulada que supera a n4 y2n4 .

    Q3 esta en [66,73[, pues F5 = 21 es es la primera frecuencia de distribucion acumulada

    que supera a 3n4

    As se tiene que::

    Q1 = P25 = Li1 +n4 Fi1

    fiA = 52 +

    5;25 57

    7 = 52;25

    Q2 = P50 = Li1 +2n4 Fi1

    fiA = 52 +

    10;5 57

    7 = 57;5

    Q3 = P75 = Li1 +3n4 Fi1

    fiA = 66 +

    15;75 156

    7 = 66;875

    Observese que Q2 =Med. Esto es logico, ya que la mediana divide a la distribucion en dos

    partes con el mismo numero de observaciones, y Q2, hace lo mismo, pues es deja a dos

    cuartos de los datos por arriba y otros dos cuartos por abajo.

    Ejemplo 1.9. La distribucion de una variable tiene por polgono acumulativo de frecuen-

    cias el de la siguiente gura. Si el numero total de observaciones es 50:

    a Elaborar una tabla estadstica con los siguientes elementos: intervalos, marcas de clase,

    frecuencia absoluta, frecuencia absoluta acumulada, frecuencias relativa y frecuencias

    relativa acumulada

    b Calcule la moda

    c Determine los cuartiles

    12

  • Solucion

    a En la siguiente tabla se proporciona la informacion pedida y algunos calculos auxiliares

    que nos permitiran responder a otras cuestiones

    [Li1; Li[ fi Fi hi Hi mi A[ 0 , 5 [ 10 10 0.2 0.3 2.5 5

    [ 5 , 7 [ 25 35 0.5 0.7 6 2

    [ 7 , 12 [ 5 40 0.1 0.8 9.5 5

    [ 12 , 15 ] 10 50 0.2 1 13.5 7

    Total 50

    b Calculemos la moda:

    Mo = Li1 +

    d1d1 + d2

    A = 5 +

    1

    2 + 1

    2 = 5;66

    c

    Q1 = P25 = Li1 +n4 Fi1

    fiA = 5 +

    12;5 1025

    2 = 5;2

    Q2 = P50 = Li1 +2n4 Fi1

    fiA = 5 +

    25 1025

    2 = 6;2

    Q3 = P75 = Li1 +3n4 Fi1

    fiA = 7 +

    37;5 355

    5 = 9;5

    1.3. Medidas de variabilidad o dispersion

    Los estadsticos de tendencia central o posicion nos indican donde se situa un grupo de

    puntuaciones. Los de variabilidad o dispersion nos indican si esas puntuaciones o valores

    estan proximas entre s o si por el contrario estan o muy dispersas.

    Una medida razonable de la variabilidad podra ser la amplitud o rango, que se obtiene

    restando el valor mas bajo de un conjunto de observaciones del valor mas alto. Es facil

    de calcular y sus unidades son las mismas que las de la variable, aunque posee varios

    inconvenientes:

    No utiliza todas las observaciones (solo dos de ellas);

    Se puede ver muy afectada por alguna observacion extrema;

    El rango aumenta con el numero de observaciones, o bien se queda igual. En cualquier

    caso nunca disminuye.

    13

  • En el transcurso de esta seccion, veremos medidas de dispersion mejores que la anterior.

    Estas se determinan en funcion de la distancia entre las observaciones y algun estadstico

    de tendencia central.

    Las principales medidas de dispersion son:

    El rango

    El rango intercuartil

    La varianza

    La desviacion estandar

    El coeciente de variacion

    1.3.1. El Rango R

    Denicion 1.1. El rango de variacion R, de una serie de datos, es la diferencia entre sus

    valores maximo y mnimo. Esto es:

    R = Xmax XminSiendo Xmax el valor maximo y Xmin el valor mnimo.

    El rango es una medidad de dispersion muy facilmente calculable, pero es muy ines-

    table, ya que depende unicamente de los dos valores extremos. Su valor puede cambiar

    grandemente si se a~nade o elimina un solo dato.

    Ejemplo 1.10. Dadas las dos series de datos

    a 15 20 20 25; R = 25 15 = 10

    b 195 200 200 200 200 200 200 200 205; R = 205 195 = 10Claramente puede apreciarse que en la segunda serie los datos estan menos dispersos, Pues

    en ella hay mayor cantidad de datos parecidos a su promedio.

    1.3.2. Rango Intercuartil RI

    Denicion 1.2. El rango intercuartil RI, es la diferencia entre sus cuartiles tercero y

    primero. Esto es

    RI = Q3 Q1El Rango intercuartil es una medida que excluye el 25% mas alto y el 25% mas bajo,

    dando un rango dentro del cual se encuentra el 50% central de los datos observados y a

    diferencia del rango total no se encuentra afectada por los valores extremos.

    14

  • 1.3.3. Varianza y desviacion estandar

    1. Varianza de datos no tabulados

    La varianza de n valores x1; x2; :::; xn de alguna variable cuntitativa X cuya media

    es X, es el numero:

    S2 =

    nXi=1

    (xi X)2

    n

    Es facil ver que:

    S2 =

    nXi=1

    x2i

    nX2

    2. Varianza de datos tabulados

    Variable disdreta

    La varianza de n valores de una variable estadstica X que se clasican en k valores

    distintos x1; x2; :::; xk con frecuencias absolutas respectivas f1; f2; :::; fk y cuya media

    es X se calcula con la siguiente formula:

    S2 =

    nXi=1

    fi(xi X)2

    n

    Se verica que:

    S2 =

    nXi=1

    fix2i

    nX2

    Varinaza de datos tabulados por intervalos

    La varianza de n valores de una variable estadstica X tabulados k intervalos con

    marcas de clases m1;m2; :::;mk con frecuencias absolutas respectivas f1; f2; :::; fk y

    cuya media es X se calcula con la siguiente formula:

    S2 =

    nXi=1

    fi(mi X)2

    n

    Se verica que:

    S2 =

    nXi=1

    fim2i

    nX2

    3. Desviacion estandar S

    La desviacion estandar se dene como la raz cuadrada de la varianza, esto es:

    S =pS2

    15

  • 1.3.4. Coeciente de variacion CV

    Hemos visto que las medidas de centralizacion y dispersion nos dan informacion sobre

    una muestra. Nos podemos preguntar si tiene sentido usar estas magnitudes para compa-

    rar dos poblaciones. Por ejemplo, si nos piden comparar la dispersion de los pesos de las

    poblaciones de elefantes de dos circos diferentes, nos dara informacion util.

    >Pero que ocurre si lo que comparamos es la altura de unos elefantes con respecto a su

    peso? Tanto la media como la desviacion tpica, y , se expresan en las mismas unidades

    que la variable. Por ejemplo, en la variable altura podemos usar como unidad de longitud

    el metro y en la variable peso, el kilogramo. Comparar una desviacion (con respecto a la

    media) medida en metros con otra en kilogramos no tiene ningun sentido.

    El problema no deriva solo de que una de las medidas sea de longitud y la otra sea de

    masa. El mismo problema se plantea si medimos cierta cantidad, por ejemplo la masa, de

    dos poblaciones, pero con distintas unidades. Este es el caso en que comparamos el peso

    en toneladas de una poblacion de 100 elefantes con el correspondiente en miligramos de

    una poblacion de 50 hormigas.

    El problema no se resuelve tomando las mismas escalas para ambas poblaciones. Por

    ejemplo, se nos puede ocurrir medir a las hormigas con las mismas unidades que los elefan-

    tes (toneladas). Si la ingeriera genetica no nos sorprende con alguna barbaridad, lo logico

    es que la dispersion de la variable peso de las hormigas sea practicamente nula (

  • 1.4. Valores Estandarizados o Tipicados Z

    Se conoce por Estandarizacion al proceso de restar la media y dividir por su desviacion

    tpica a una variable X. De este modo se obtiene una nueva variable:

    Z =X XS

    Donde Z = 0 y S2Z = 1 Esta nueva variable carece de unidades y permite hacer compara-

    bles dos medidas que en un principio no lo son, por aludir a conceptos diferentes. As por

    ejemplo nos podemos preguntar si un elefante es mas grueso que una hormiga determina-

    da, cada uno en relacion a su poblacion. Tambien es aplicable al caso en que se quieran

    comparar individuos semejantes de poblaciones diferentes. Por ejemplo si deseamos com-

    parar el nivel academico de dos estudiantes de diferentes Universidades para la concesion

    de una beca de estudios, en principio sera injusto concederla directamente al que posea

    una nota media mas elevada, ya que la dicultad para conseguir una buena calicacion

    puede ser mucho mayor en un centro que en el otro, lo que limita las posibilidades de

    uno de los estudiante y favorece al otro. En este caso, lo mas correcto es comparar las

    calicaciones de ambos estudiantes, pero estandarizados cada una de ellas por las medias

    y desviaciones estandar respectivas de las notas de los alumnos de cada Universidad.

    Ejemplo 1.11. Dada la distribucion de edades (medidas en a~nos) en un colectivo de 100

    personas, obtener:

    a La variable estandarizada Z.

    b Valores de la media y varianza de Z.

    c Coeciente de variacion de Z.

    Horas trabajadas Numero de Empleados

    [Li1; Li[ fi[ 0 , 4 [ 47

    [ 4 , 10 [ 32

    [ 10 , 20 [ 17

    [ 20 , 40 ] 4

    Total 100

    Solucion

    Para calcular la variable estandarizada:

    Z =X XS

    17

  • Partimos de los datos del enunciado. Sera necesario calcular en primer lugar la media y

    desviacion tpica de la variable original (X).

    [Li1; Li[ mi fi mifi m2ihi[ 0 , 4 [ 2 47 94 188

    [ 4 , 10 [ 7 32 224 1568

    [ 10 , 20 [ 15 17 255 3825

    [ 20 , 40 ] 30 4 120 3600

    Total 100 693 9181

    X =693

    100= 6;93

    S2X =9;181

    100 6;932 = 43;78

    SX =p43;78 = 6;6

    A partir de estos valores podremos calcular los valores tipicados para las marcas de clase

    de cada intervalo y construir su distribucion de frecuencias:

    z1 =2 6;93

    6;6= 0;745

    z2 =7 6;93

    6;6= 0;011

    z3 =15 6;93

    6;6= 1;22

    z4 =30 6;93

    6;6= 3;486

    zi fi zifi z2i fi

    -0.745 47 -35.015 26.086

    0.011 32 0.352 0.004

    1.220 17 20.720 25.303

    3.486 4 13.944 48.609

    Total 100 0.021 100.002

    Z =0;021

    100 0

    S2Z =100;02

    100 02 1

    SZ =p1 = 1

    A pesar de que no se debe calcular el coeciente de variacion sobre variables que presenten

    valores negativos (y Z los presenta), lo calculamos con objeto de ilustrar el porque:

    CV =SZ

    Z=

    1

    0=1

    18

  • Es decir, el coeciente de variacion no debe usarse nunca con variables estandarizadas.

    1.5. Asimetra y apuntamiento

    Sabemos como calcular valores alrededor de los cuales se distribuyen las observaciones

    de una variable sobre una muestra y sabemos como calcular la dispersion que ofrecen

    los mismos con respecto al valor de central. Nos proponemos dar un paso mas alla en

    el analisis de la variable. En primer lugar, nos vamos a plantear el saber si los datos se

    distribuyen de forma simetrica con respecto a un valor central, o si bien la graca que

    representa la distribucion de frecuencias es de una forma diferente del lado derecho que

    del lado izquierdo.

    Si la simetra ha sido determinada, podemos preguntarnos si la curva es mas o menos

    apuntada (larga y estrecha). Este apuntamiento habra que medirlo comparado a cierta

    distribucion de frecuencias que consideramos normal (no por casualidad es este el nombre

    que recibe la distribucion de referencia).

    Estas ideas son las que vamos a desarrollar en lo que resta del captulo.

    1.5.1. Estadsticos de asimetra

    Para saber si una distribucion de frecuencias es simetrica, hay que precisar con res-

    pecto a que. Un buen candidato es la mediana, ya que para variables continuas, divide

    al histograma de frecuencias en dos partes de igual area. Podemos basarnos en ella para,

    de forma natural, decir que una distribucion de frecuencias es simetrica si el lado

    derecho de la graca (a partir de la mediana) es la imagen por un espejo del lado izquierdo

    (como la siguiente gura).

    19

  • Cuando la variable es discreta, decimos que es simetrica, si lo es con respecto a la media.

    Observacion

    Se podra pensar que denir la simetra con usando la mediana para variables con-

    tinuas y usando la media para variables discretas es una eleccion arbitraria. En

    realidad esto no es as, pues si una variable es continua, coinciden los ambos criterios

    de simetra (con respecto a la media y a la mediana). Es mas, se tiene que media y

    mediana coinciden para distribuciones continuas simetricas. Por otro lado,

    en el caso de variables discretas, la distribucion es simetrica si el lado derecho del

    diagrama se obtiene por imagen especular desde la media. En este caso coincide la

    media con la mediana si el numero de observaciones es impar.

    Si la variable es continua simetrica y unimodal, coinciden la media, la mediana y la

    moda.

    Dentro de los tipos de asimetra posible, vamos a destacar los dos fundamentales

    (gura ):

    Asimetra positiva:

    Si las frecuencias mas altas se encuentran en el lado izquierdo de la media, mientras que

    en derecho hay frecuencias mas peque~nas (cola).

    Asimetra negativa:

    Cuando la cola esta en el lado izquierdo.

    Cuando realizamos un estudio descriptivo es altamente improbable que la distribucion

    de frecuencias sea totalmente simetrica. En la practica diremos que la distribucion de

    frecuencias es simetrica si lo es de un modo aproximado. Por otro lado, aun observando

    20

  • cuidadosamente la graca, podemos no ver claro de que lado estan las frecuencias mas

    altas. Conviene denir entonces unos estadsticos que ayuden a interpretar la asimetra, a

    los que llamaremos ndices de asimetra, y que denotaremos mediante As. Vamos a denir

    a continuacion algunos de los ndices de asimetra mas usuales como son el ndice basado

    en los tres cuartiles, el momento de tercer orden y la distancia entre la moda y la media

    o la media y la mediana.

    1.5.2. Indice basado en los tres cuartiles

    Si una distribucion es simetrica, es claro que deben haber tantas observaciones entre

    la que deja por debajo de s las tres cuartas partes de la distribucion y la mediana, como

    entre la mediana y la que deja por debajo de s un cuarto de todas las observaciones. De

    forma abreviada esto es,

    Q3 Q2 = Q2 Q1Una pista para saber si una distribucion de frecuencias es asimetrica positiva tendremos :

    Q3 Q2 > Q2 Q1

    Por analoga, si es asimetrica negativa, se tendra

    Q3 Q2 < Q2 Q1

    Para quitar dimensionalidad al problema, utilizamos como ndice de asimetra la cantidad:

    As =(Q3 Q2) (Q2 Q1)

    Q3 Q1El numero obtenido, As , es invariante ante cambios de origen de referencia y de escala.

    Otros indices de asimetra

    21

  • Basandonos en que si una distribucion de frecuencias es simetrica y unimodal, entonces

    la media, la mediana y la moda coinciden, podemos denir otras medidas de asimetra,

    como son:

    As =X Mo

    S

    O bien,

    As =3(X Med)

    S

    Diremos que hay asimetra positiva si As > 0 y negativa si As < 0 (vease la siguiente

    gura).

    Ejemplo 1.12. Las edades de un grupo de personas se reejan en la tabla siguiente:

    [Li1; Li[ fi[ 7 , 9 [ 4

    [ 9 , 11 [ 18

    [ 11 , 12 [ 14

    [ 12 , 13 [ 27

    [ 13 , 14 [ 42

    [ 14 , 15 [ 31

    [ 15 , 17 [ 20

    [ 17 , 19 ] 1

    Determinar la variabilidad de la edad mediante los estadsticos varianza, desviacion estandar,

    coeciente de variacion y rango intercuartlico. Estudie la simetra de la variable.

    Solucion

    En primer lugar realizamos los calculos necesarios a partir de la tabla de frecuencias:

    22

  • [Li1; Li[ fi mi Fi mfi m2i fi[ 7 , 9 [ 4 8 4 32 256

    [ 9 , 11 [ 18 10 22 180 1800

    [ 11 , 12 [ 14 11.5 36 161 1851.5

    [ 12 , 13 [ 27 12.5 63 337.5 4218.75

    [ 13 , 14 [ 42 13.5 105 567 7654.5

    [ 14 , 15 [ 31 14.5 136 449.5 6517.75

    [ 15 , 17 [ 20 16 156 320 5120

    [ 17 , 19 ] 1 18 157 18 324

    Total 157 2065 27742.25

    La media es X = 2065157 = 13;15 a~nos. La varianza la calculamos a partir de la columna de

    la x2i fi como sigue:

    S2 =27742;25

    157 13;152 = 3;78 a~nos2 ) S =

    p3;78 = 1;94 a~nos

    El coeciente de variacion no posee unidades y es:

    CV =1;94

    13;15= 0;15 = 15% de variabilidad

    En lo que concierne a la simetra podemos utilizar el coeciente de asimetra para el cual

    es preciso el calculo de los cuartiles:

    Q1 = 12 +39;2536

    27 1 = 12;12Med = Q2 = 13 +

    78;56342 1 = 13;37

    Q3 = 14 +117;75105

    31 1 = 14;41Lo que nos dice que aproximadamente en un rango de Q3 Q1 = 2;29 a~nos se encuentrael 50% central del total de observaciones Ademas:

    As =(Q3 Q2) (Q2 Q1)

    Q3 Q1 =(14;41 13;37) (13;37 12;12)

    14;41 12;12 = 0;09

    Este resultado nos indica que existe una ligera asimetra a la izquierda (negativa). Un

    resultado similar se obtiene si observamos la siguiente gura (Figura ) veremos que la

    distribucion de frecuencias es unimodal, siendo la moda

    Mo = 13 +42 27

    (42 27) + (42 31) 1 = 13;57

    En cuyo caso podemos usar como medida del sesgo:

    As =X Mo

    S=

    13;15 13;571;94

    = 0;21

    23

  • 1.6. Ejercicios Propuestos

    1. Una empresa grande de equipos deportivos esta probando el efecto de dos planes

    publicitarios sobre las ventas de los ultimos 4 meses. Dadas las ventas que se ven

    aqu, >cual programa de publicidad parece producir el crecimiento promedio mas

    alto en ventas mensuales?

    Mes Plan 1 Plan 2

    Enero 1657.0 4735.0

    Febrero 1998.0 5012.0

    Marzo 2267,0 5479.0

    Abril 3432,0 5589,0

    2. Los estadsticos del programa de Meals on Wheels (comida sobre ruedas), el cual

    lleva comidas calientes a enfermos connados en casa, desean evaluar sus servicios.

    El numero de comidas diarias que suministran aparece en la siguiente tabla de fre-

    cuencia. Calcular la media, mediana y la moda e interprete.

    Numero de comidas por da Numero de das

    [0 , 5 [ 3

    [ 5, 10 [ 6

    [ 10 , 15 [ 5

    [ 15 , 20 [ 8

    [ 20 , 25 [ 2

    [ 25 , 30 ] 3

    3. Bill Karl compro 20 acciones a $15 cada una, 50 acciones a $20 cada una, 100 acciones

    a $30 cada una y 75 acciones a $35 cada una. >Cual es el precio promedio por accion?.

    4. Las edades de 50 de los directores ejecutivos de las mejores corporaciones de la nacion

    reportadas aparecen en la siguiente tabla de frecuencias. Calcule e interprete la me-

    dia, la mediana y la moda. Ademas, calcule e interprete: Q1; Q2; D1; D6; P15; P90.

    Edades Frecuencia

    [50 , 55 [ 8

    [ 55, 60 [ 13

    [ 60 , 65 [ 15

    [ 65 , 70 [ 10

    [ 70 , 75 [ 3

    [ 75 , 80 ] 1

    24

  • 5. Dado el siguiente cuadro estadstico con ancho de clase constante igual a 20. Deter-

    mine la media de los datos.

    [Li1; Li[ mi fi Fi mfi[ , [ 880

    [ , [ 1950

    [ , [ 35 1800

    [ , [ 13

    [ , 200 [

    [ , ] 4 70

    6. Dada la siguiente distribucion de frecuencias, calcular el valor de \n"sabiendo que

    la moda es 60 y pertenece al tercer intervalo.

    [Li1; Li[ fi[ 16 , 32 [ 6

    [ 32 , 48 [ n

    [ 48 , 64 [ 8

    [ 64 , 80 [ 3n

    [ 80 , 96] 3

    7. En un examen de estadstica tomado el mismo da y hora a los tres grupos del tercer

    ciclo de Ingeniera de Sistemas: A , B y C con un total de 150 alumnos se obtuvo

    una nota promedio de 13,2 , las notas promedio de los grupos A y B fueron 12 y 14

    respectivamente; los registros del grupo C se extraviaron pero se sabe que el grupo

    A es el 36% del total y que el numero de alumnos del grupo B es la tercera parte

    de las matriculadas en el grupo C.

    a Hallar la nota promedio del grupo C.

    b Calcular la nota promedio de los grupos A y C juntos.

    8. La siguiente tabla de distribucion de frecuencias muestra la edad de un grupo de

    personas. Si ademas se sabe que la moda es 27,5.

    [Li1; Li[ [10,20[ [20,30[ [30,40[ [40,50]fi a 30 a+ 10 20

    a Hallar el valor de a.

    b >Bajo que edad se encuentra el 35% mas joven?

    c >Cuantas personas tienen como mnimo 20 a~nos? Justique.

    25

  • 9. De un grupo de peque~nas empresas se sabe que ninguna tiene mas de 5 trabajadores

    ni menos de 2, la mayora tiene 3 trabajadores, el 20% tiene 5 trabajadores, 2 de

    cada 20 empresas tiene 4 trabajadores; la proporcion de empresas que tienen dos

    trabajadores es 0,25. Calcular e interpretar la media aritmetica.

    10. Dada la siguiente distribucion de frecuencias:

    [Li1; Li[ [20,30[ [30,40[ [40,50[ [50,60[ [60,70]fi 3 1 2 6 x

    Hallar el valor de x si se sabe que la mediana es 61,6.

    11. Los siguientes datos corresponden a los sueldos de los trabajadores de una compa~na.

    Sueldos N ro de trabajadores

    [ 950 , 1000 [ 5

    [ 1000 , 1050 [ 12

    [ 1050 , 1100 [ 9

    [ 1100 , 1150 [ 8

    [1150 , 1200[ 4

    [1200 , 1250[ 10

    [1250 , 1300[ 6

    a Calcular e interpretar la media aritmetico.

    b Si a cada trabajador se le duplica el sueldo pero a la vez se le hace un descuento

    de 150 soles, >cual sera el nuevo sueldo promedio?

    c Si cada trabajador recibe un incremento del 30% de su sueldo, >cual sera el nuevo

    sueldo promedio?

    d Si cada trabajador recibe un aumento de 270 soles y al mismo tiempo se decreta

    un descuento del 3,5% del nuevo haber, >cual es el sueldo promedio?

    12. En un examen tomado a tres secciones de un curso de estadstica de 91 alumnos,

    el puntaje medio general fue de 69,3. Los puntajes medios de las secciones 1 y 2

    fueron 70,4 y 64,2 respectivamente. Se perdieron los archivos con las notas de la

    seccion 3 pero los ayudantes recuerdan que las secciones 1 y 2 tenan exactamente el

    mismo numero de alumnos, mientras que el ayudante de la seccion 3 menciona que

    su seccion tena 5 estudiantes menos que la 1. >Cual es el promedio de las notas de

    la seccion 3?

    26

  • 13. Una fabrica de aparatos electronicos ha comenzado un estudio para mejorar su e-

    ciencia. Efectuo para esto un relevamiento en las seccion de armado de visores para

    computadora durante 10 das consecutivos. La cantidad de visores armados diaria-

    mente fueron:

    30 20 50 80 40 50 60 30 70 50

    Calcule todas las medidas de tendencia central proporcionando un signicado a su

    valor de manera que sirva para los nes propuestos en el estudio.

    14. La siguiente informacion es relativa a los sueldos de un grupo de trabajadores en una

    compa~na donde, el 12% de ellos ganan S/530, el 24% ganan S/560, el 20% ganan

    S/600, el 15% ganan S/650, el 13% ganan S/680 y el resto ganan S/700. >Cual es

    el salario medio?

    15. En un grupo hay 40 estudiantes varones con una edad promedio de 20 a~nos, las

    mujeres son en promedio mas jovenes en un 10%; >cuantas mujeres hay si la edad

    promedio de la clase es de 19 a~nos?

    16. El salario promedio mensual pagado a los trabajadores de una compa~na es de $200.

    Los salarios promedios mensuales pagados a hombres y mujeres de la compa~na son

    210 y 150 respectivamente. Determinar el porcentaje de hombres y mujeres que

    trabajan en la compa~na.

    17. Una compa~na minera tiene 100 trabajadores. Para los nombrados el haber maximo

    es $450 y el mnimo $60. Hay un 5% de eventuales (en prueba) que trabajan ad-

    honorem o perciben compensaciones inferiores a $60. Quince trabajadores nombrados

    perciben haberes inferiores a $250 y el 85% ganan haberes inferiores a $400. Con

    esta informacion, calcule las medidas de tendencia central posibles.

    18. Un grupo de 200 estudiantes con estatura inedia de 60.96 pulg. Se divide en dos

    grupos, un grupo con una estatura media de 63.4 pulg. y el otro con 57.3 pulg. >

    Cuantos estudiantes hay en cada grupo?.

    19. El sueldo promedio de 200 empleados de una empresa es S/400. Se proponen dos

    alternativas de aumento: a) S/. 75 a cada uno, b) 15% de su sueldo mas 10 soles a

    cada uno. Si la empresa dispone a lo mas de S/. 94,000 para pagar sueldos, >cual

    alternativa es mas conveniente?.

    20. De una central telefonica salieron 70 llamadas de menos de 3 minutos promediando

    2.3 minutos, 40 llamadas de menos de 10 minutos pero no menos de 3 minutos,

    promediando 6.4 minutos, y 10 llamadas de al menos 10 minutos promediando 15

    minutos. Calcular la duracion promedio de todas las llamadas.

    27

  • 21. El sueldo medio de los obreros de una fabrica es de $286.

    a >Que porcentajes de hombres y mujeres trabajan en la fabrica si sus sueldos medios

    respectivos son $300 y $260?.

    b Si el 60% de los obreros tienen menos de 30 a~nos y percibe el 20% del total de

    los sueldos, >cuanto es el sueldo medio de los obreros de al menos 30 a~nos?

    22. En una empresa donde el sueldo medio es de $400 se incrementa un personal igual al

    25% del ya existente con un sueldo medio igual al 60% de los antiguos. Si 3 meses

    mas tarde se incrementan cada sueldo en 20%, mas $30, >cuanto es el nuevo salario

    medio?.

    23. Calcular todas las medidas de dispersion para la siguiente distribucion

    Xi 5 10 15 20 25

    fi 3 7 5 3 2

    24. Calcular todas las medidas de dispersion para los datos de la siguiente distribucion

    [Li1; Li[ [0,100[ [100,200[ [200,300[ [300,800]fi 90 140 150 120

    25. Se sabe que la media aritmetica de la siguiente distribucion es 11,5.

    [Li1; Li[ [4,6[ [6,10[ [10,16[ [16,20[ [20,30]fi 4 5 x 3 1

    Calcular la desviacion estandar

    26. Si X es una variable que tiene media 15 y varianza 25; hallar la media, varianza y

    desviacion tpica de Y en los siguientes casos:

    a Y = 4 + 16X

    b Y = 16 4Xc Y = 14 +

    14X

    27. La produccion de papa en Tn. fue de 4000 Tn. con variancia de 3600 para el depar-

    tamento de Cuzco, mientras que para el departamento de Puno fue de 10 000 Tn.

    con 1440000 de variancia, en que departamento se puede decir que la produccion de

    papa es mas homogenea

    28

  • 28. Un grupo de trescientos alumnos llevan el curso de Estadstica y Probabilidad dis-

    tribuidos en cuatro secciones. Si se sabe que el numero de alumnos por seccion estan

    en una progresion aritmetica cuya razon es 20 y ademas se conoce que las notas

    promedio de las secciones A , C y D son 12, 14 y 11 mientras que las varianzas de

    los grupos A y C son 16 y 4 y las desviaciones estandar de B y D son 3 y 1 respecti-

    vamente. Si la nota promedio en el curso es 12,37; hallar e interpretar la desviacion

    estandar de las cuatro secciones juntas.

    29. En una empresa donde los salarios tienen una media S/. 2500 y una desviacion

    estandar de S/. 300 el Sindicato solicita que cada salario Xi se transforme en Yi ,

    mediante la siguiente relacion:

    Yi = 3;5Xi + 10

    El directorio acoge parcialmente la peticion rebajando los salarios propuestos por el

    Sindicato en un 20%, lo que es aceptado. Se pide calcular la varianza de la nueva

    distribucion de salarios.

    30. Se tienen tres empresa con aproximadamente igual numero de trabajadores. El nume-

    ro de inasistencias registradas durante los ultimos seis meses en cada una de las tres

    empresas se da a continuacion: Empresa:

    A : 3 19 4 5 15 6

    B : 7 8 11 9 14 16

    C : 10 17 12 2 18 13

    >En cual de estas tres empresas existe mayor variabilidad con respecto al numero de

    inasistencias?

    31. Una empresa de fabricacion de productos ceramicos dispone de tres centros de pro-

    duccion. En el centro A, el mas grande y moderno, se hace un estudio de los m2 de

    azulejo producidos al mes durante el a~no pasado, obteniendose una media de pro-

    duccion mensual XA = 250000m2, con una desviacion estandar SA = 15000m

    2. Se

    sabe que el centro B, por tener maquinaria mas anticuada que A, produce cada mes

    un tercio de la produccion de A, y que el centro C, por tener un horno menos que

    B, produce cada mes 25000 m2 menos que B >Cual es la media y la varianza de la

    produccion mensual de C?

    32. Se utiliza dos maquinas diferentes para fabricar conductos de salida de papel desti-

    nados a copiadoras Kodak. Los conductos de una m uestra de la primera maquina

    medan:

    12;2; 11;9; 11;8; 12;1; 11;9; 12;4; 11;3 12;3

    29

  • pulgadas. Los conductos hechos con la segunda maquina medan:

    12;2; 11;9; 11;5; 12;1; 12;2; 11;9; 11;8

    pulgadas. Si se desea utilizar la maquina que produzca conductos de tama~nos mas

    uniformes; >que maquina debera utilizarse?

    33. Un entrenador de pista y campo debe decidir a cual de sus dos velocistas selec-

    cionara para los cien metros planos en una proxima competencia. El entrenador

    basara la decision en los resultados de cinco carreras entre los dos atletas, celebradas

    en un periodo de una hora, con descanso de 15 minutos. Los siguientes tiempos (en

    segundos) se registraron para las cinco carreras:

    Atleta Carrera

    1 2 3 4 5

    Mendoza 11,1 11.0 11.0 15.8 11.1

    Ramirez 11.3 11.4 11.4 11.5 11.4

    Con base en estos datos, >a cual de los dos velocistas debe seleccionar el entrenador?

    >por que?

    34. Las secciones A , B y C del curso de Estadstica y Probabilidad rinden el mismo

    examen parcial. Los resultados obtenidos se registran en las siguientes tablas:

    A A B B C C

    Xi Fi [Li1; Li[ mifi Hi hiX2i2.5 3 [2,6[ 16 0.1 2.5

    7.5 8 [6,10[ 144 0.2 10

    12.5 22 [10,14[ 240 0.8 86.4

    17.5 30 [14,18[ 240 1 45

    a En cual de las secciones las notas son mas homogeneas?

    b Calcular e interpretar la desviacion estandar para las tres secciones juntas.

    35. Durante un periodo de diez a~nos, los precios de un producto fueron en promedio

    de $80 con una desviacion estandar de $12. En el periodo anterior de 10 a~nos,

    el promedio fue de $50 con una varianza de $36. >En que periodo hubo mayor

    estabilidad?

    36. En la seccion nanciera de un diario aparecio la distribucion de la variable discreta

    adjunta. Se deca en el texto del artculo que la media aritmetica era 120 y la varianza

    25. Desafortunadamente la publicacion aparecio con dos manchas de tinta, lo cual

    30

  • impeda comprobar directamente la armacion. >Son admisibles dichos valores de la

    media y la varianza, teniendo en cuenta lo que puede verse del cuadro? Justicar.

    Xi 105 110 115 120 125 130 135 140

    fi 37 90 95 85 60

    37. Los alumnos de un grupo obtuvieron en matematica II una nota media de 68.7

    puntos con una desviacion estandar de 15.4 y los de otro grupo obtuvieron en la

    misma asignatura un promedio de 50.9 puntos con una desviacion estandar de 19.6.

    >Cual de los dos grupos tiene un rendimiento mas heterogeneo?

    38. Si la nota media de unos estudiantes varones es 3 y la desviacion estandar de sus

    notas es 0.25 en tanto que las correspondientes cifras para las estudiantes mujeres

    son 3.2 y 0.25 >muestran menor variabilidad las notas de los estudiantes varones?

    >por que?

    39. En el siguiente conjunto de numeros, se proporcionan los pesos (redondeados a la

    libra mas proxima) de los bebes nacidos durante un cierto intervalo de tiempo en un

    hospital:

    4, 8, 4, 6, 8, 6, 7, 7, 7, 8, 10, 9, 7, 6, 10, 8, 5, 9, 6, 3, 7, 6, 4, 7, 6, 9, 7, 4, 7, 6, 8, 8,

    9, 11, 8, 7, 10, 8, 5, 7, 7, 6, 5, 10, 8, 9, 7, 5, 6, 5.

    a Calcular las medidas de tendencia central.

    b Calcular las medidas de dispersion.

    c >Es esta una distribucion sesgada? De ser as, >en que direccion?

    d Encontrar el percentil 24.

    40. Con el n de observar la relacion entre la inteligencia y el nivel socioeconomico

    (medido por el salario mensual familiar) se tomaron dos grupos, uno formado con

    sujetos de cociente intelectual inferior a 95 y otro formado por los demas; De cada

    sujeto se anoto el salario mensual familiar. Teniendo en cuenta los resultados que se

    indican en la tabla:

    Nivel Socioeconomico Sujetos con CI< 95 Sujetos con CI 95[Li1; Li[ fi fi[ 4 , 10 [ 75 19

    [ 10 , 16 [ 35 26

    [ 16 , 22 [ 20 25

    [ 22 , 28 [ 30 30

    [ 28 , 34 [ 25 54

    [ 34, 40 ] 15 96

    31

  • a Dibuje un graco que permita comparar ambos grupos.

    b Calcule las medidas de tendencia central para aquellos sujetos con CI a partir

    de que rendimiento corresponde pagar impuesto?

    c) >Es la mediana, el punto medio entre los cuartiles 1 y 3? Justique.

    43. Las ganancias diarias de los establecimientos de un centro comercial se presentan en

    una tabla de frecuencias con 6 intervalos de clase constante y se sabe que: la mnima

    ganancia es de $6, el rango es 36, el 50% de los establecimientos ganan mas de 25.58

    dolares diarios, H2 = 0;15; F2 = 120; h3 = 0;25; H5 = 0;93; f4 = 304; f2 = 2f1:

    a) Reconstruir la distribucion de todas las frecuencias.

    32

  • b) Hallar la ganancia mas frecuente y la ganancia promedio

    c) Hallar la desviacion estandar

    44. En un examen 20 alumnos del curso A obtienen una media de 60 puntos. y desvia-

    cion estandar de 20 puntos En el curso B los alumnos obtienen una media de 80

    y desviacion estandar de 16. Ante un reclamo se decide subir en 5% mas 5 puntos

    adicionales a todos los alumnos del curso A, en cambio como hubo muchas copias

    en el curso B se decidio disminuir la quinta parte de la calicacion. Despues de los

    mencionados ajustes >Cual es el puntaje medio de los 50 alumnos?

    45. Al calcular la media y la desviacion estandar de 80 datos, resultaron 30 y 4 respec-

    tivamente. Un chequeo mostro que en lugar del valor 1.7 se introdujo 17. Corrija la

    media y la desviacion estandar.

    46. Un conjunto habitacional esta formado por 3 edicios de departamentos. Se tiene

    los siguientes datos respecto al consumo mensual de electricidad de cada uno de los

    edicios.

    Edicio 1: Tiene 8 departamentos, la media y la desviacion estandar de los consumos

    es S/. 85 y S/. 12, respectivamente.

    Edicio 2: Tiene 9 departamentos cuyos consumos en soles son 88, 92, 106, 110,

    93, 102, 91, 94, 80.

    Edicio 3: Los consumos se dan en la siguiente tabla.

    Consumo en soles Departamentos

    [50; 60[ 1

    [60; 70[ 2

    [70; 80[ 4

    [80; 90] 3

    a) >Cual de los edicios tiene el menor consumo de electricidad?

    b) >En cual de los edicios los valores que representa los consumos estan mas dis-

    persos?

    c) >Cual es el consumo promedio en todo el conjunto habitacional?

    47. El salario promedio en una ciudad es de 11000u.m. con una variancia de 2000u.m.

    >Cuales seran la nueva media y la nueva variancia si se efectuan los siguientes cam-

    bios:

    a) Se aumenta 810u.m a todos

    b) Se aumenta el 15% de su salario a cada trabajador

    33

  • c) Si se duplican los sueldos

    48. En el mes de enero el promedio de los salarios de una empresa era de 40 unidades

    monetarias (u.m.). En el mes de febrero la empresa considero un incremento del

    25% en el numero de empleados, con un salario igual al 80% del promedio de los

    antiguos empleados. En el mes de marzo la empresa hizo efectivo un aumento del

    25% en el salario de cada uno de los empleados, mas una bonicacion de 20 u.m.

    por escolaridad.

    a) Halle el sueldo promedio de los salarios de los empleados en el mes de marzo

    b) Calcule la tasa promedio de crecimiento de las medias de los sueldos entre enero

    y marzo

    49. Ochocientos alumnos de la especialidad de Educacion Fsica fueron sometidos a una

    prueba de resistencia en la cual se observo el numero de kilometros que podan correr

    sin detenerse. Los datos recogidos se organizan en la siguiente tabla.

    N ro de klometros mi fi hi Fi Hi

    [ ; [ 0.5475

    [ ; [ 6

    [ ; [ 0.15625

    [ ; 16 [

    [ ; [ 9

    Total

    a) Si se sabe que solo el 3.875% de los alumnos corrieron al menos 12 kilometros

    sin detenerse, complete la tabla usando 5 decimales y determine la resistencia

    promedio de los alumnos

    b) Los 60 alumnos con mayor resistencia fueron seleccionados. Estime la resistencia

    media de ese grupo.

    50. Se toman las medidas de 80 personas las que tienen estatura media de 1.70m y

    desviacion estandar de 3.4cm. Posteriormente se verico que la media usada tenia 4

    cm de menos. Rectique los estadsticos mencionados.

    51. Multiplicando cada numero 3, 6, 2, 1, 7 y 5 por 2 y sumando entonces 5, obtenemos

    el conjunto 11, 17, 9 7, 19 15. >Cual es la relacion entre la desviacion estandar de

    ambos conjuntos? >Y entre las medias?

    52. La distribucion de edades del Censo de Residentes a 1 de enero de 2007 para las

    comunidades autonomas de Aragon y Canarias, en miles de personas, es la siguiente:

    34

  • Edades Aragon Canarias

    [0; 20[ 3.54 4.35

    [20; 40[ 21.56 29.99

    [40; 60[ 31.63 35.21

    [60; 80[ 28.14 21.97

    [80; 100] 15.12 8.48

    a) Representa sobre los mismos ejes de coordenadas los polgonos de frecuencias de

    la distribucion de la edad para las dos CC.AA. (emplea distinto trazo o distintos

    colores). >Que conclusiones obtienes a la vista de los histogramas?

    b) Calcula la edad mediana para las dos comunidades. Comparalas. >Que indican

    estos resultados?

    c) Que comunidad tiene mayor variabilidad en la distribucion de su edad? Demues-

    tralo con la media, mediana, desviacion y varianza.

    53. El costo inicial de produccion, X, de una muestra de 50 objetos de cierto tipo, tiene

    una desviacion estandar de $3. La media de costos de produccion es de 25 para 30

    objetos de la muestra y de $20 para el resto. El costo nal de produccion Y es dado

    por la relacion:

    Y = 1;15X + 2

    Suponga que el precio de venta de cada objeto de la muestra es proporcional al

    cuadrado del costo nal de produccion, >cuanto se recaudara por la venta total de

    los 50 objetos?

    54. Los siguientes datos corresponden a los sueldos mensuales de los obreros que trabajan

    en una compa~na.

    Sueldos No de Obreros

    [390; 420[ 12

    [420; 450[ 35

    [450; 580[ 26

    [580; 610[ 8

    [610; 740[ 20

    [740; 770[ 10

    [770; 850] 6

    a) Hallar el sueldo que es excedido por el 50% de los obreros.

    b) Calcular el sueldo que gana la mayora de los obreros.

    35

  • c) Se desea agrupar a los obreros en tres categoras: A, B y C teniendo en cuenta

    sus sueldos. El 20% inferior estaran en la categora C, el 25% superior en la

    categora A. Hallar los lmites entre estas categoras.

    36