ANÁLISIS E INTERPRETACIÓN DE DATOS.ppt

58
1.- MEDIDAS DE RESUMEN

Transcript of ANÁLISIS E INTERPRETACIÓN DE DATOS.ppt

  • 1.- MEDIDAS DE RESUMEN

  • 3.1. ESTADIGRAFOS DE TENDENCIA CENTRAL

    MEDIA ARITMETICA O PROMEDIO ARITMETICO ( )a.1) Media aritmetica para datos no agrupadosa.1.1) Promedio aritmetico simpleEj.-Se tiene una muestra de 5 personas, cuyo peso es el siguiente: 74 Kg, 87 Kg, 90 Kg, 76 Kg y 89 Kg. El promedio ser: 415/5 = 83

  • 3.2 Promedio aritmtico ponderado

    Es aquel promedio que se utiliza cuando prevalece cierto peso, importancia o repeticin de los datos en el estudio.Ej.-En una oficina, 25 personas tienen un peso de 70 Kg, 15 personas tienen un peso de 87 Kg y 11 personas tienen el peso de 91 Kg. Hallar el peso promedio de las personas. 4056/51INTERPRETACIN: El peso promedio de las personas es de 79.5 Kg

  • 3.3 Media aritmtica para datos agrupados

    Se obtiene sumando el producto de las marcas de clase por las frecuencias correspondientes y dividiendo la suma entre la frecuencia absoluta total.Ej.- El consumo semanal de carne vacuna en una muestra de 80 familias en el poblado de San Antonio, es como sigue:Consumo (Kg/semana) Numero de familias0 1.9152 3.9264 5.9206 7.9138 9.96Se hallan las marcas de clase ( Xi ) se multiplican con su frecuencia respectiva ( Xi . f i ) y se suman los productos.

  • INT. CL Ii FR. fi M. DE CL Xi Fr. AB*M.CL Xi . fi

  • Los INTERVALOS DE CLASE ( Ii )

    los obtenemos del Consumo en Kg/semanaLas FRECUENCIAS ABSOLUTAS ( fi ) las obtenemos del Numero de familias

  • Las frecueencias absolutasINTERVALOS FRECUENCIA MARCAS FRECUENCIA DE CLASE Ii ABSOLUTA fi DE CLASE Xi ABSOLUTA * MC0 1.9 152 3.9 264 5.9 206 7.9 138 9.9 6

  • Las MARCAS DE CLASE ( Xi ) se calculan de la siguiente manera:

    Xi = (LMITE INFERIOR + LMITE SUPERIOR )/2X1= 0 + 1.9 = 0.95 2 X2= 2 + 3.9 = 2.95 2 X3= 4 + 5.9 = 4.95 2 X4= 6 + 7.9 = 6.95 2 X5= 8 + 9.9 = 8.95 2

  • marcas de clase.

    INTERVALOS FRECUENCIA MARCAS FREC. ABS. PORDE CLASE Ii ABSOLUTA fi DE CLASE Xi M. C Xi * fi0 1.9150.952 3.9262.954 5.9204.956 7.9136.958 9.968.95

  • FREC. ABSOLUTA por MAR. DE CLA

    intervalos frecuencia marcas frec. abs. porde clase Ii absoluta fi de clase Xi M. C Xi * fi0 1.9150.9515*0.95=14.252 3.9262.9526*2.95=76.704 5.9204.9520*4.95=99.006 7.9136.9513*6.95=90.358 9.968.956*8.95= 53.70

  • T O T A L E Sintervalos frecuencia marcas frec. abs. porde clase Ii absoluta fi de clase Xi M. C Xi * fi0 1.9150.9515*0.95=14.252 3.9262.9526*2.95=76.704 5.9204.9520*4.95=99.006 7.9136.9513*6.95=90.358 9.9 68.956*8.95= 53.70TOTAL: fi = 80 Xi * fi =334.00

  • X =

    Xi * fi 334---------------- = -------- = 4.2 fi 80

    INTERPRETACIN: La muestra de familias de San Antonio, consume en promedio 4.2 Kg de carne vacuna a la semana.

  • MEDIANA ( Me )

    Es el estadgrafo que representa el punto medio de los datos, en el cual cae el 50% de las puntuaciones.b.1) Mediana para datos no agrupadosla mediana es el valor medio (cuando la serie es impar) o la media aritmtica de los dos valores medios (cuando la serie es par), del conjunto de datos previamente ordenados en forma creciente o decreciente.

  • EJEMPLO

    El peso de 5 personas es el siguiente: 74 Kg, 87 Kg, 90 Kg, 76 Kg y 89 Kg. Hallar la mediana de los pesos.SOLUCINOrdenamos los datos de menor a mayor y la mediana es el dato que ocupa el valor central, ya que la serie es impar tendremos:74, 76, 87, 89, 90Luego : Me = 87 Kg.

  • EJEMPLO

    Hallar la mediana de las edades de 6 personas: 48, 52, 52, 50, 53, 55 aos.SOLUCINOrdenamos los datos de menor a mayor.5, 48, 50, 52, 53, 55observamos que 50 y 52 ocupan el centro del conjunto de datos ordenados, entonces la mediana es el promedio aritmtico simple de esos dos valores.As:Me = 50 + 52 = 102 = 51 aos 2 2

  • EJEMPLO en variables ordinales

    Se tiene la siguiente informacin sobre el numero de alumnos repitentes por aos de estudios secundarios el 2006 en el Colegio Simn Bolivar.Ao d estud Primero Segundo Tercero Cuarto QuintoNum d alum 25 14 6 9 2 Fi 25 39 45 54 56Se halla la frecuencia acumulada FiSe divide la frecuencia total entre 2 : 56/2= 28Se busca dentro de la frecuencia acumulada el primer valor que contiene a 28, en este caso 39, por tanto la clase mediana se ubica en la segunda clase y la mediana corresponde a la categora segundo

  • Luego: Me= segundo de secundariaINTERPRETACIN.- La mitad de los estudiantes repitentes ( 50% ) lo hacen como mximo hasta segundo de secundaria.

  • Mediana para datos agrupados

    De la tabla de distribucin de frecuencias, la mediana se halla utilizando la sigte formula:Me= Li +(( fi /2 ( fi ) -1 )/ fMe)WMe = medianaLi = Limite infer. del inter. de la clase mediana fi /2 Semisuma de las frec absolutas simples ( fi ) -1 Suma d todas las frec abs anter a clase medianfMe Frecuencia de la clase medianaW = amplitud del intervalo

  • EJEMPLO

    Trabajando con los datos del ejemplo sobre el consumo semanal de carne de vacuno en una muestra de 80 familias. La mediana se calculara de la siguiente manera:

  • Se halla la frecuenc absoluta acum

    INT D CLASE Ii FREC ABS fi FREC ABSOLU ACUM Fi0 1.9 15152 3.9 26414 5.9 20616 7.9 13748 9.9 680TOTALES fi = 80

  • fi /2 = 40La clase mediana ser aquella en donde la primera frecuencia acumulada contenga el valor de 40. Por lo que viendo el cuadro se concluye que es 41 donde esta contenido este valor, por lo tanto esta es la clase mediana.Para determinar el limite inferior del intervalo de la clase mediana, vemos el cuadro anterior donde el intervalo es: 2 - 3.9

  • Por lo tanto: Li = 2( fi ) -1 = 15fMe = 26W = 2Me= Li +(( fi /2 ( fi ) -1 )/ fMe)WMe= 2 +((40 15 )/ 26)2 = 2 + 1.9 = 3.9INTERPRETACIN: En la muestra en estudio, el 50% de las familias consume como mximo 3.9 Kg/sema de carne de vacuno. El restante 50% de las familias consume ms de 3.9 Kg/semana.

  • MODA ( Mo )

    c.1) Moda para datos no agrupadosEjemploSi se observa cual es el dato que ms se repite en las evaluaciones, se tiene: 3, 5, 6, 6, 7, 7, 8, 8, 8, 9, 9, 10Que es el 8. Este valor representa la moda de esta coleccin, por lo tanto, la moda se refiere al dato que tiene mayor frecuencia. Nota: Si ninguna observacin se repite, se dice que esos datos no tienen moda. Si todos los datos se repiten el mismo nmero de veces, los datos sern multimodales.

  • EjemplosEj.Encuentra la moda de los siguientes datos4 9567Como los datos slo existen una vez, este conjunto de datos no tienen moda.Ej.Encuentra la moda del siguiente conjunto de datos:9 3 6 7 9 8 5 9 7 3El 3 se repite dos veces, el 7 se repite tambin dos veces, pero como el 9 se repite tres veces, este ltimo nmero es la moda para este conjunto de datos.Ejemplo Calcula la moda para los datos que se presentan a continuacin6 7 8 6 9 7 8 5 6 8El mximo nmero de veces que se repiten los datos son tres, y hay dos datos que se repiten tres veces, el 6 y el 8. El conjunto de datos es bimodal y sus modas son el 6 y el 8.

  • Ej. Calcula la moda para estos datos65 5 9 6 8 6 5 9 8 9En este conjunto, todos se repiten 3 veces. El 5, 6, 8 y el 9 son moda. No hay ninguno que no lo sea, es un caso multimodalEjemploBuscar la moda de: 5 12 9 5 8 7 1 Como la moda es el nmero que ms se repite, la moda es 5.EjemploBuscar la moda de: 14 16 18 16 15 12 14 14 16 18 20 16 16 El 14 se repite 3 veces. El 18 se repite 2 veces. El 16 se repite 5 veces. Por lo tanto, la moda es 16. EjemploBuscar la moda de : 23 35 45 33 47 31 29 22 Como ningn nmero se repite, no tiene moda.

  • Ej.Buscar la moda de : 23 35 45 33 47 31 29 22 Ej. Buscar la moda de: 5 12 9 5 8 7 1 Como la moda es el nmero que ms se repite, la moda es 5.Ej. Buscar la moda de: 14 16 18 16 15 12 14 14 16 18 20 16 16 , El 14 se repite 3 veces, El 18 se repite 2 veces, El 16 se repite 5 veces.Por lo tanto, la moda es 16. EjemploBuscar la moda de : 23 35 45 33 47 31 29 22 Como ningn nmero se repite, no tiene moda.

  • c.2) Moda para datos agrupadosSe determina a travs de la siguiente formula:Mo = Li + d*W/(d+d)Donde:Li Limite inferior de la clase modal.d = diferencia de la frecuencia de la clase modal y la frecuencia de la clase anterior a ella.d=diferencia de la frecuencia de la clase modal y la frecuencia de la clase siguiente a ella.W=amplitud del intervalo.

  • EJEMPLOAl igual que anteriormente, trabajaremos con los datos del ejemplo sobre el consumo semanal de carne de vacuno en una muestra de 80 familias. SOLUCINLo primero que haremos ser ubicar la clase modal, que es aquella que tiene la mayor frecuencia. En nuestro caso la mayor frecuencia es 26, por consiguiente la segunda clase constituye la clase modal.

  • INT D CLASE Ii FREC ABS fi FREC ABSOLU ACUM Fi0 1.9 15152 3.9 26414 5.9 20616 7.9 13748 9.9 680TOTALES fi = 80

  • Frecuencia de la clase modal = 26

    Frec de la clase anterior a la clase modal = 15Por lo tanto d = 26 15 = 11 d es la diferencia de la frecuencia de la clase modal y la frecuencia de la clase siguiente a ella. Frecuencia de la clase modal = 26Frecuencia de la clase siguiente a la clase modal = 20.Por lo tanto d = 26 20 = 6 Li representa el limite inferior de la clase modal, los limites de la clase modal que son: 2 y 3.9, el menor valor es 2, por lo tanto:Li = 2, W = 2

  • Remplazando datos:

    Mo = Li + d*W/(d+d)Mo = 2+ 11*2/(11+6) Mo = 3.29 kgINTERPRETACIN: Las familias en estudio consumen con mayor frecuencia 3.29 Kg/semana de carne de vacuno.

  • MEDIDAS DE POSICIN O CUANTILES

    Son estadgrafos que dividen a una distribucin de frecuencias en cuatro, diez o cien partes iguales.a) CUARTILES.-Son estadgrafos que dividen la informacin en cuatro (04) partes iguales, donde cada uno de ellos incluye el 25% de las observacionSi se estudia el 25% de la observaciones, se dice que se esta analizando el cuartil 1 (Q1)Si se estudia el 50% de las observaciones, se dice que se esta analizando el cuartil 2 (Q2)Si se estudia el 75% de las observaciones, se dice que se esta analizando el cuartil 3 (Q3)

  • Q1 se interpreta como limite mximo del 25% de las observaciones inferiores, o como el limite mnimo del 75% de las observaciones superiores.Q2 se interpreta como el limite que divide a la distribucin en dos partes iguales ( 50% ) en este caso: Q3 = MeQ3 se interpreta como el limite mximo del 75% de las observaciones inferiores; o como el limite mnimo del 25% de las observaciones superiores.

  • Esquemticamente tendremos:

    Primer Cuartil

    Segundo Cuartil

    Tercer Cuartil

    25 %25%25%25 %

  • Los cuartiles se calculan de la siguiente manera:

    Qi = Li + ((i* fi /4 ( fi ) -1 )/ fQi)*WDonde:i =1,2,3 ; segn se trate de hallar el primer, segundo o tercer cuartilLi = Limite inferior de la clase cuartilica fi = suma de todas las frecuencias absolutas simples( fi ) -1 = suma de las frecuencias absolutas simples de todas las clases anteriores a la clase cuartlica.fQi = frecuencia absoluta simple que corresponde a la clase cuartlica.W = clase cuartlica

  • EJEMPLO

    Teniendo el ejemplo del consumo de carne de vacuno en una muestra de 80 familias en el poblado de San Antonio.Consum (Kg/sem) 0 1.9 2 3.9 4 5.9 6 7.9 8 9.9Numero de Familias 15 26 20 13 6Hallar el cuartil 1.SOLUCINSe siguen los siguientes pasos:Se trabajar con la siguiente tabla:

  • NUMERO DE INTERVALOS FRECUENCIA ABS FRECUENCIA ABS CLASES Ki DE CLASE Ii SIMPLE fi ACUMULADA Fi

  • El numero de clases ya esta definido en este caso es 5,

    NUMERO DE INTERVALOS FRECUENCIA ABS FRECUENCIA ABS CLASES Ki DE CLASE Ii SIMPLE fi ACUMULADA Fi 12345

  • Los intervalos de clase igualmente estan ya definidos, y por lo tanto

    NUMERO DE INTERVALOS FRECUENCIA ABS FRECUENCIA ABS CLASES Ki DE CLASE Ii SIMPLE fi ACUMULADA Fi 1 0 1.92 2 3.93 4 5.94 6 7.95 8 9.9

  • las FRECUENCIAS ABSOLUTAS SIMPLES son el numero de veces qNUMERO DE INTERVALOS FRECUENCIA ABS FRECUENCIA ABS CLASES Ki DE CLASE Ii SIMPLE fi ACUMULADA Fi 1 0 1.9152 2 3.9263 4 5.9204 6 7.9135 8 9.9 6

  • las frecuencias Absolutas AcumuladasNUMERO DE INTERVALOS FRECUENCIA ABS FRECUENCIA ABS CLASES Ki DE CLASE Ii SIMPLE fi ACUMULADA Fi 1 0 1.915152 2 3.926413 4 5.920614 6 7.913745 8 9.9 680

  • Se ubica la clase cuartlica:

    en nuestro ejemplo queremos hallar el cuartil 1, usaremos parte de la formula i* fi i= 1, por tratarse del primer cuartil fi = 15+26+20+13+6 = 80i* fi /4 = 1*80/4 = 20Con esto hallamos la clase cuartilica que ser aquella donde la primera frecuencia acumulada contenga el valor de 20.Si vemos el cuadro se puede comprobar que en la columna de frecuencias absolutas acumuladas el primer valor de 15 obviamente no contiene a 20, el segundo valor de 41 si contiene a 20, por lo que la 2 clase ser la clase cuartilica, es decir:

  • NUMERO DE INTERVALOS FRECUENCIA ABS FRECUENCIA ABS CLASES Ki DE CLASE Ii SIMPLE fi ACUMULADA Fi 1 0 1.915152 2 3.926413 4 5.920614 6 7.913745 8 9.9 680

  • Por lo tanto tendremos:Li = Limite inferior de la clase cuartilica, podemos ver que los limites son 2-3.9, por lo tanto el limite inferior es 2.( fi ) -1 = suma de las frecuencias absolutas simples de todas las clases anteriores a la clase cuartilica, de donde es claro que el unico valor que es anterior a la clase cuartilica es 15. fQi = frecuencia que corresponde a la clase cuartilica, que es 26.W = clase cuartilica =2

  • Remplazando datos:

    Qi = Li + ((i* fi /4 ( fi ) -1 )/ fQi)*WQi = 2 + ((1*80/4 15)/26)*2= 2.4INTERPRETACIN: El 25% de las familias en estudio consumen como mximo 2.4 Kg/semana de carne de vacuno y el 75% de las familias consumen ms de 2.4 Kg/semana.

  • 3.3. MEDIDAS DE DISPERSIN

    a) DESVIACIN ESTNDAR O DESVIACIN TPICA MUESTRAL ( S )s = (xi - )/(n-1); i=1 hasta i=nx i dato u observacin media aritmticaN : nmero de datos

  • EJEMPLO

    El tiempo que utiliza una muestra de 6 nios de igual edad para desarrollar la misma tarea es: 16, 12, 15, 18, 13 y 14 minutos.Calcular la desviacin estndar e interpretar el resultado.SOLUCINHallamos la media aritmtica: = 14.7Cada dato se resta de la media aritmtica, elevando al cuadrado dicha diferencia, tal como se ve en el cuadro.

  • DATOS (Xi) (xi - )16(16-14.7)2 = 1.6912(12-14.7)2 = 7.2915(15-14.7)2 = 0.0918(18-14.7)2 = 10.8913(13-14.7)2 = 2.8914(14-14.7)2 = 0.49

  • Hallamos la suma de los resultados

    (xi - ) = 23.34Aplicando la formula:s = (xi - )/(n-1) = 23.4/5S = 2.16

  • Interpretacin y aplicacin

    La desviacin estndar es una medida del grado de dispersin de los datos del valor promedio. Dicho de otra manera, la desviacin estndar es simplemente el "promedio" o variacin esperada con respecto de la media aritmtica.Una desviacin estndar grande indica que los puntos estn lejos de la media, y una desviacin pequea indica que los datos estn agrupados cerca de la media.

  • Por ejemplo

    las tres muestras (0, 0, 14, 14), (0, 6, 8, 14) y (6, 6, 8, 8) cada una tiene una media de 7. Sus desviaciones estndar son 7, 5 y 1, respectivamente. La tercera muestra tiene una desviacin mucho menor que las otras dos porque sus valores estn ms cerca de 7.La desviacin estndar puede ser interpretada como una medida de incertidumbre. La desviacin estndar de un grupo repetido de medidas nos da la precisin de stas. Cuando se va a determinar si un grupo de medidas est de acuerdo con el modelo terico, la desviacin estndar de esas medidas es de vital importancia: si la media de las medidas est demasiado alejada de la prediccin (con la distancia medida en desviaciones estndar), entonces consideramos que las medidas contradicen la teora.

  • EJEMPLO

    "Considere la compra de una deliciosa pizza, la cual Ud. ordena en la pizzera que est de camino a su casa. Se dispone de dos pizzeras de las cuales se tiene la siguiente informacin en cuanto a tiempos de preparacin (en minutos), para 10 pizzas:Pizzera ABC: 6,5 - 6,6 - 6,7 - 6,8 - 7,1 - 7,3 - 7,4 - 7,7 - 7,7 - 7,7Pizzera XYZ: 4,2 - 5,4 - 5,8 - 6,2 - 6,7 - 7,7 - 7,7 - 8,5 - 9,3 - 10,0Utilizando herramientas estadsticas comunes, tales como la media, mediana y moda, se obtienen los siguientes resultados:Pizzera ABC: Media = 7,15 - Mediana = 7,20 - Moda = 7,7Pizzera XYZ: Media = 7,15 - Mediana = 7,20 - Moda = 7,7

  • Porqu es importante la d estnd? Porque es una de las formas ms sencillas de controlar la variabilidad, llmese presupuestos, ventas, productos, tiempos de atencin y para todo el nuevo conjunto de indicadores que estn de moda.La desviacin estndar de un conjunto de datos es una medida de cunto se desvan los datos de su media. Esta medida es ms estable que el recorrido y toma en consideracin el valor de cada dato.

  • 4. PARMETROS

    a.MEDIA ARITMETICA O PROMEDIO ARITMETICO ( )Media Poblacional = = ( Xi )/NN es el Nmero de datos de la poblacin Xi Es la suma de todos los datos,

  • b) DESVIACIN ESTNDAR POBLACIONAL ( )

    La desviacin estndar () es la raz cuadrada del promedio de la suma de las desviaciones de cada observacin o dato con respecto a su media aritmetica. As: ____________ = ( (Xi - ))/N Xi Observacin o datoN : nmero de datos: media aritmtica

  • Medidas de Distribucin - Asimetra y Curtosis

    1. ASIMETRA.-Estamedidanos permite identificar si los datos se distribuyen de formauniforme alrededor del puntocentral(Media aritmtica). La asimetra presenta tres estados diferentes, cada uno de los cuales define de forma concisa como estn distribuidos los datos respecto al eje de asimetra. Se dice que laasimetra es positivacuando la mayora de los datosse encuentranpor encima delvalorde la media aritmtica, la curva esSimtricacuando se distribuyenaproximadamentela misma cantidad devaloresenamboslados de la media y se conoce como asimetra negativacuando la mayor cantidad de datos se aglomeran en losvalores menores que la media.

  • Grfica de asimetras

  • 2. CURTOSIS

    Estamedidadetermina elgradode concentracin que presentan losvaloresen la regincentralde la distribucin. Por medio delCoeficiente de Curtosis, podemos identificar si existe una gran concentracin devalores(Leptocrtica), una concentracin normal (Mesocrtica) una baja concentracin (Platicrtica).

    ********************************************************