Post on 30-Jan-2016
DISTRIBUCIONDE FRECUENCIAS
DESPUES DE LA RECOPILACION DE LOS DATOS,ES NECESARIO,CLASIFICARLOS, RESUMIRLOS YPRESENTARLOS EN FORMA TAL, QUE FACILITENSU COMPRENSION Y SU POSTERIOR ANALISIS YUTILIZACION. PARA ELLO SE ORDENAN EN UNATABLA DE DISTRIBUCION DE FRECUENCIAS Y LUEGO SE PRESENTARAN EN GRAFICOS.
TABLA DE DISTRIBUCION DE FRECUENCIAS
*PRESENTAN LA DISTRIBUCION DE UN CONJUNTO DE DATOS DE ACUERDO AL TIPO DE VARIABLE QUE SE TENGA. EN ELLA SE OBSERVA LA FRECUENCIA (NUMERO DE DATOS OBSERVADOS EN CADA CLASE O INTERVALO)DESPUES DE REALIZAR EL PROCESO DE CONTEO O TABULACION.
*UNO DE LOS USOS DE LAS TABLAS DE FRECUENCIAS ES PARA CALCULAR ALGUNOS INDICADORES DE RESUMEN, COMO LOS ESTADISTICOS.
EN EL PROCEDIMIENTO PARA CONSTRUIR TABLAS DE FRECUENCIAS NOS REFERIREMOS SIEMPRE A MUESTRAS.
TABLA DE FRECUENCIAS
PARA VARIABLES CUALITATIVAS
Ejemplo: DE UN ESTUDIO DE INVESTIGACIONREALIZADA EN FORMA ALEATORIA A 80 PERSONASDE 12 A 20 AÑOS SE REGISTRARON LOS PROGRAMASMAS VISTOS EN LA TV.LOS RESULTADOS FUERON:
PROGRAMAS Nº DE TELEVIDENTES
NOTICIEROS 17
SERIES 15
18
DIBUJOS 16
CULTURALES 14
TOTAL 80
frecuencias
variable
NOVELAS
PROGRAMAS Frecuencia Absoluta (fi)
(número de televidentes)
Frecuencia Relativa (hi)
NOTICIEROS 17 0.2125
SERIES 15 0.1875
NOVELAS 18 0.2250
DIBUJOS 16 0.2000
CULTURALES 14 0.1750
TOTAL n=80 1.0000
TABLA DE FRECUENCIAS PARA LA PREFERENCIA DE PROGRAMAS DE TV.
(1)La frecuencia absoluta fi, es el número de datos observados en cada categoria o modalidad. La suma de todas las frecuencias absolutas es igual al total de datos observados (n=80).(2)La frecuencia relativa hi se define por hi = fi /n La suma de todas las frecuencias relativas es igual a uno.(3)La frecuencia relativa se convierte en % multiplicandola por 100(4)Las frecuencias relativas son conocidas como proporciones.
CON LA INFORMACION DE LA TABLA PODEMOSREALIZAR ALGUNAS PREGUNTAS:
1.-¿CUANTAS PERSONAS PREFIEREN VER LOS NOTICIEROS? RPTA. 17
2.-¿CUÁNTAS PERSONAS NO PREFIEREN VER EL LOS NOTICIEROS? RPTA. 63
3.-¿QUÉ PORCENTAJE DE PERSONAS PREFIEREN VER LAS SERIES? RPTA. 18.75%
4.-¿CUÁL ES EL PORCENTAJE DE PERSONAS QUE NO PREFIEREN VER LAS SERIES? RPTA. 81.25%
GRAFICOS PARA VARIABLES CUALITATIVAS
LA INFORMACION OBTENIDA EN LA TABLA DEFRECUENCIAS PUEDE SER MOSTRADA EN GRAFICOS ADECUADOS.
DIAGRAMAS DE BARRAS
0
5
10
15
20
NOTICIEROS SERIES NOVELAS DIBUJ OS CULTURALES
PROGRAMAS
FREC
UEN
CIA
AB
SO
LU
TA
DIAGRAMA CIRCULAR O TIPO PASTEL
LOS SECTORES CIRCULARESQUE COMPRENDEN LA GRAFICA CIRCULAR TIENEN ANGULO CENTRAL DADO POR:
hi x 360º
SERIES19%
NOVELAS 22%
DIBUJOS20%
NOTICIEROS21%
CULTURAL18%
TABLA DE FRECUENCIAS SIMPLES
PARA VARIABLES CUANTITATIVAS DISCRETAS
•SE EMPLEAN PARA DATOS CUANTITATIVOS DISCRETOS(VALORES ENTEROS).
• CUANDO SOLAMENTE SE PRESENTAN POCOS DATOS DISTINTOS.
Ejemplo: SE HA REALIZADO UNA ENCUESTA A 20FAMILIAS PARA SABER EL NUMERO DE HIJOS QUETIENEN , Y SE HA OBTENIDO EL SIGUIENTERESULTADO:
3 7 7 6 7 4 5 1 4 5
5 9 4 2 4 6 7 4 7 6
CONSTRUYA UNA TABLA DE DISTRIBUCIONDE FRECUENCIAS.
NºDE HIJOS
TARJAS O CONTEO fi
(NUMERO DE FAMILIAS)
hi
1 / 1 0.052 / 1 0.053 / 1 0.054 //// 5 0.255 /// 3 0.156 /// 3 0.157 //// 5 0.258 0 0.009 / 1 0.05
TOTAL n = 20 1.00
TABLA DE FRECUENCIAS PARA EL NUMERO DE HIJOS POR FAMILIA
Frecuencia absoluta
0
1
2
3
4
5
6
1 2 3 4 5 6 7 8 9
No de hijos
No d
e fam
ilias
GRAFICO DE LINEAS O BASTONES PARAVARIABLES CUANTITATIVAS DISCRETAS
Frecuencias relativas
0
5
10
15
20
25
30
1 2 3 4 5 6 7 8 9
No de hijos
% d
e fa
mili
as
TABLA DE FRECUENCIAS POR INTERVALOS
VARIABLES CUANTITATIVAS CONTINUAS Y TAMBIEN DISCRETAS
LA DISTRIBUCION DE FRECUENCIAS POR CLASEO INTERVALOS SE USA CUANDO LA VARIABLE ESTADISTICA ES CUANTITATIVA CONTINUA O CUANDO EL NUMERO DE VALORES DISTINTOS DE UNA VARIABLE DISCRETA ES MUY GRANDE(GENERALMENTE MAS DE 20).
ESTRUCTURA DE UNA TABLA DE FRECUENCIAS POR INTERVALOS
[Li , Ls > Xi fi hi Fi Hi
Total
Donde: [Li , Ls> : Intervalos o Clases Xi : Marca de clase fi : frecuencia absoluta hi : frecuencia relativa Fi : Frecuencia absoluta acumulada Hi : Frecuencia relativa acumulada
k
1ii
fn
Li : Limite InferiorLs : Limite Supeior
“VARIABLE”
CARACTERISTICAS
1.- LA FRECUENCIA ABSOLUTA (fi) INDICA LA CANTIDAD DE OBSERVACIONES QUE HAY EN EL i-ESIMO INTERVALO.
2.- LA FRECUENCIA RELATIVA (hi) INDICA LA FRACCION DE LAS OBSERVACIONES QUE ESTAN EN EL i-ESIMO INTERVALO: hi= fi /n
3.- F1= f1 H1= h1
F2= f1+ f2 H2= h1+ h2
Fk= f1+ f2+...+ fk Hk= h1+ h2+...+ hk
4.- EN TODA TABLA DE DISTRIBUCION DE FRECUENCIAS POR INTERVALOS:
nfk
ii
1
11
k
iih nFk
5.- LA MARCA DE CLASE ES LA SEMISUMA DE LOS LIMITES DE CLASE
2si
i
LLX
6.- EL ANCHO DE CLASE “C” REPRESENTA LA LONGITUD DEL INTERVALO: C = Ls – Li
GENERALMENTE ES CONSTANTE.
7.- CUANDO EL ANCHO DE CLASE ES CONSTANTE ENTONCES LA DISTANCIA ENTRE LAS MARCAS DE CLASE ES CONSTANTE E IGUAL A “C”.
PROCEDIMIENTO PARA LA CONSTRUCION DE TABLAS DE FRECUENCIAS POR INTERVALOS
1) CALCULAR EL RANGO: R = Xmáx – Xmin
2) HALLAR EL NUMERO DE INTERVALOS “K”,MEDIANTE LA FORMULA DE “STURGES”: K = 1+3.3 Log(n) DONDE “n” ES EL NUMERO DE DATOS, Y “K” SE REDONDEA A UN VALOR ENTERO (REDONDEO SIMPLE) EJMS: si K=6.28 SE REDONDEA A 6 si K=6.5 SE REDONDEA A 7
3) DETERMINAR EL ANCHO DE CLASE: C = R /K DONDE C SE REDONDEA POR EXCESO, DE ACUERDO AL NUMERO DE DECIMALES QUE TIENEN LOS DATOS.
Ejemplo de dato original
Ejemplo de
valor de C
calculado
Se redondea
a:
15 (dato entero) 5.75 6
3.2 (dato con 1 decimal) 2.33782129 2.4
11.13 (dato con 2 decimales) 3.24920976 3.25
5.391 (dato con 3 decimales) 1.42135709 1.422
99.3489 (con 4 decimales) 9.2876405 9.2877
El valor de C dependerá de la cantidad de lugares decimales de los datos originales, que serán agrupados en la tabla de frecuencias:
EJEMPLO 1. SI LA VARIABLE CUANTITATIVA ES DISCRETA Se ha aplicado una encuesta a 40 centros educativos con el fin de observar el número de niños que estudian en ellos, obteniendose:
42 58 79 86 98 120 134 120 59 62
85 89 76 110 104 78 84 96 90 75
120 130 122 95 82 94 108 79 105 115
102 80 56 78 84 66 69 78 84 98
construya una tabla de frecuencias adecuada.
Rango: R= 134 - 42 = 92
Número de intervalos: K = 1 + 3.3 log 40 = 6,29 (fórmula de Sturges) redondeo simple a 6
Ancho de clase: C =92 / 6 = 15,33 redondeamos por exceso de decimales a 16
PROCEDIMIENTO:
Intervalos Tarjas
o conteo
Xi fi hi Fi Hi
[42-58> 50 2 0.050 2 0.050
[58-74> 66 5 0.125 7 0.175
[74-90> 82 15 0.375 22 0.550
[90-106> 98 9 0.225 31 0.775
[106-122> 114 6 0.150 37 0.925
[122-138> 130 3 0.075 40 1.000
TOTAL n=40 1.000
Centros educativosNúmero de niños (variable)
EJEMPLO 2: SI LA VARIABLE CUANTITATIVA ES CONTINUA.
En un comercio, se dispone de los datos de la venta semanal(en miles de soles) para las últimas 30 semanas.Construya una tabla de distribución de frecuencias.
14,6 12,8 13,9 15,3 14,2 15,6 14,2 13,4 13,8 14,5
15,2 14,4 12,9 12,4 13 15,5 15,6 15,8 15,7 15,8
13,9 14,2 14,9 13,1 12,2 14,1 15,1 15,7 13,4 13,2
PROCEDIMIENTO:
1. R= Xmax – X min = 15,8 – 12,2 = 3,6
2. Hallar K mediante Sturges:
K= 1 + 3,3 log (30) = 5,8745 aprox. 6 (redondeo simple)
3. Determinar el ancho de clase C:
C= 3,6 / 6 =0,6 (no se redondea, porque ya tiene un decimal como los datos)
Intervalos Tarjas
o conteo
Xi fi hi
Fi Hi
[12,2-12,8> // 12,5 2 0,0667 2 0,0667
[12,8-13,4> ///// 13,1 5 0,1667 7 0,2334
[13,4-14,0> ///// 13,7 5 0,1667 12 0,4000
[14,0-14,6> ////// 14,3 6 0,2000 18 0,6000
[14,6-15,2> /// 14,9 3 0,1000 21 0,7000
[15,2-15,8> ////// /// 15,5 9 0,3000 30 1,0000
TOTAL n=30 1.0000
Número de semanasVenta miles de soles (variable)
INTERPRETACIONES UTILIZANDO LA TABLA DE FRECUENCIAS
1.- ¿Cuántas semanas tienen ventas entre 14,0 y 14,6 miles de soles? Rpta. f4 = 6 semanas.
2.- ¿Cuál es la proporción o el porcentaje del número de semanas cuyas ventas se encuentran entre 12,8 y 13,4 miles de soles? Rpta. h2 = 0,1667 ó h2 = 16,67%
3.- ¿Cuántas semanas tienen ventas menores a 14,6 miles de soles? Rpta. F4 = 18 semanas
4.- ¿Cuál es la proporción o el porcentaje del número de semanas cuyas ventas son menores a 15,2 miles de soles? Rpta. H5 = 0,70 ó H5 = 70%
LAS GRAFICAS EN UNA TABLA DE FRECUENCIAS
Ventas
Frequencia A
bso
luta
15.815.214.614.013.412.812.2
9
8
7
6
5
4
3
2
1
0
Histograma de Frecuencias Absolutas
Ventas
Frequenci
a R
ela
tiva %
15.815.214.614.013.412.812.2
30
25
20
15
10
5
0
Histograma de Frecuencias Relativas (% )
Ventas
num
ero
de s
em
anas
15.514.914.313.713.112.5
9
8
7
6
5
4
3
2
1
0
Poligono de Frecuencias Absolutas
Polígono de frecuencias absolutas
0
2
4
6
8
10
12.5 13.1 13.7 14.3 14.9 15.5
ventas
Num
. de
sem
anas
Observación
•Los polígonos de frecuencia son especialmente útiles para comparar las distribuciones de dos grupos de datos diferentes, para ello es conveniente trabajar en un mismo gráfico y empleando los mismos intervalos.•Importante: Si la cantidad de datos es muy diferente en ambos grupos es preferible trabajar con polígonos de frecuencia relativa.
OJIVA
UNA OJIVA ES LA REPRESENTACION GRAFICA DEUNA DISTRIBUCION DE FRECUENCIAS ABSOLUTASACUMULADAS O LAS FRECUENCIAS RELATIVASACUMULADAS.
OJIVA “MENOR QUE” O ASCENDENTE
ES LA REPRESENTACION GRAFICA DE UNA DISTRIBUCION DE FRECUENCIAS ABSOLUTASACUMULADAS “MENOR QUE” O LAS FRECUENCIASRELATIVAS ACUMULADAS “MENOR QUE”.
DEL EJEMPLO1:
0 42 58 74 90 106 122 138
2
7
22
31
37
40
*
*
*
*
*
*
*
Fi
MENOR
QUEFi Hi
42
58
74
90
106
122
138
0
2
7
22
31
37
40
0
0.05
0.174
0.550
0.775
0.925
1.000
OJIVA MENOR QUE
DIAGRAMAS DE TALLOS Y HOJAS
ES UNA TECNICA QUE SE USA PARA ORGANIZARLOS DATOS COMO PRIMER PASO EN UN ANALISISEXPLORATORIO DE DATOS.
OBJETIVOS:
REPRESENTACION VISUAL DE LA INFORMACION.
DESCRIBIR UN PATRON DE COMPORTAMIENTO DE LOS DATOS, ES DECIR QUE DISTRIBUCION PUEDEN SEGUIR LOS DATOS.
IDENTIFICAR SI HAY VALORES EXTREMOS O DATOS ANORMALES O VALORES ATIPICOS.
PROCEDIMIENTO:
ORDENAR LOS DATOS DE LA VARIABLE EN FORMA CRECIENTE.
TOMAR COMO TALLO LA PRIMERA O LAS DOS PRIMERAS CIFRAS DEL DATO Y COMO HOJA LA ULTIMA CIFRA. A CONTINUACION SEPARADOS POR UNA LINEA VERTICAL SE COLOCAN LOS TALLOS A LA IZQUIERDA Y LAS HOJAS A LA DERECHA DEL TALLO CORRESPONDIENTE. DE ESTA FORMA CADA TALLO SE REPRESENTA UNA SOLA VEZ Y DEFINE UNA CLASE Y EL NUMERO DE HOJAS REPRESENTA LA FRECUENCIA DE LA CADA CLASE.
EJEMPLOS: . PARA DATOS CON DOS CIFRAS, ESCRIBIR A LA IZQUIERDA DE LA LINEA LA CIFRA DE LAS DECENAS, QUE FORMAN EL TALLO, Y A LA DERECHA LAS UNIDADES QUE SERAN LAS HOJAS. POR EJEMPLO ESCRIBIR 85:
TALLO HOJA
8 5
ESCRIBIR 329 COMO TALLO Y HOJA
TALLO HOJA
32 9
Para los siguientes datos, construya un diagrama tallos y hojas:12, 15,18, 22,24, 26, 27, 31, 33, 33,35, 36, 42, 42, 45, 46, 50, 51, 53
3 1 2 5 8
7 2 2 4 6 7
( 5 ) 3 1 3 3 5 6
7 4 2 2 5 6
3 5 0 1 3
HOJASTALLO
CENTRO DE LA DISTRIBUCION
¡OBSERVE QUE SE PARECE A UNHISTOGRAMA VOLTEADO!
LEAF UNIT = 1.0 ES LA UNIDAD DE HOJA,DICE DONDEPONER EL PUNTO DECIMAL, EN ELEJEMPLO LEAF UNIT=1.0 ASI LA PRIMERA OBSERVACION ES 12 ,SI LEAFUNIT FUERA 0.10 SERIA 1.2, SI LEAF UNITFUERA 10 ENTONCES EL VALOR SERIA120.