Estadıstica Descriptiva
Estadıstica Descriptiva
Julio Deride Silva
Area de Matematica
Facultad de Ciencias Quımicas y Farmceuticas
Universidad de Chile
27 de agosto de 2010
Estadıstica Descriptiva
Tabla de Contenidos
Estadıstica Descriptiva
Julio Deride Silva
Area de Matematica
Facultad de Ciencias Quımicas y Farmceuticas
Universidad de Chile
27 de agosto de 2010
Estadıstica Descriptiva
Tabla de Contenidos
Tabla de Contenidos
1 Representaciones Graficas
2 Histogramas y Diagramas de Barra.
3 Diagrama de sectores y tortas.
4 Pictograma.
5 Boxplot o grafico de cajas.
6 Diagramas de Tallo-Hoja.
Estadıstica Descriptiva
Representaciones Graficas
Outline
1 Representaciones Graficas
2 Histogramas y Diagramas de Barra.
3 Diagrama de sectores y tortas.
4 Pictograma.
5 Boxplot o grafico de cajas.
6 Diagramas de Tallo-Hoja.
Estadıstica Descriptiva
Representaciones Graficas
Introduccion
Con las medidas estudiadas anteriormente, una muestra ha sido
analizada desde un punto de vista descriptivo, exclusivamente a
traves del estudio cualitativo de estadısticos representativos. Es
ası, como se ha estudiado la forma en que una variable aleatoria
toma valores para una muestra y se ha descrito con medidas de
tendencia central, dispersion, simetrıa y apuntamiento.
Para finalizar el estudio descriptivo, es necesario hacer una
revision de las distintas representaciones graficas, que entreguen
una intuicion visual, precisa y concisa del comportamiento de una
variable aleatoria.
Estadıstica Descriptiva
Histogramas y Diagramas de Barra.
Outline
1 Representaciones Graficas
2 Histogramas y Diagramas de Barra.
3 Diagrama de sectores y tortas.
4 Pictograma.
5 Boxplot o grafico de cajas.
6 Diagramas de Tallo-Hoja.
Estadıstica Descriptiva
Histogramas y Diagramas de Barra.
Histogramas y Diagramas de Barra.
Estos graficos consisten en representar las clases en el eje de las
ordenadas y la frecuencias (absolutas o relativas, simple o
acumulada) en el eje de las abscisas. Si se utiliza la frecuencia
simple, entonces el histograma se dira diagrama direfencial. Para
frecuencias acumuladas, se dira diagrama integral. Se dice
diagrama de barra cuando la variable en estudio sea del tipo
cualitativa o discreta. Finalmente, hablaremos de histogramas
cuando la variable en estudio sea cuantitativa continua. En este
ultimo caso, se complementa el grafico con el polıgono de
frecuencias, correspondiente a la union de los segmentos de
rectas que unen la frecuencia de cada clase, desde su respectiva
marca de clase, como se ilustra en la figura 1.
Estadıstica Descriptiva
Histogramas y Diagramas de Barra.
Histograma
Figura: Histograma y polıgono de frecuencia.
Estadıstica Descriptiva
Histogramas y Diagramas de Barra.
Construccion
Para la construccion de histogramas, se considera el siguiente
criterio: el area que ocupa cada una de las barras debe ser
proporcional a la frecuencia (absoluta o relativa, simple o
acumulada). Es ası como, en los histogramas, si cada intervalo de
clase tiene igual ancho, solo se debe satisfacer que la altura sea
proporcional a la frecuencia, considerando que lo tıpico es usar
directamente la frecuencia como altura.
Para graficar mas de una muestra, se utilizan barras adyacentes, y
frecuencias relativas, para aislar el efecto del tamano de cada una.
Estadıstica Descriptiva
Diagrama de sectores y tortas.
Outline
1 Representaciones Graficas
2 Histogramas y Diagramas de Barra.
3 Diagrama de sectores y tortas.
4 Pictograma.
5 Boxplot o grafico de cajas.
6 Diagramas de Tallo-Hoja.
Estadıstica Descriptiva
Diagrama de sectores y tortas.
Diagrama de sectores y tortas.
Este tipo de diagrama consiste en dividir un cırculo en la cantidad
total de clases, de manera tal que cada sector circular contenga
un area proporcional a la frecuencia relativa. Esto es, el angulo
central de la clase i, αi, debe cumplir la siguiente relacion
αi
2π=
ni
n,
donde ni corresponde a la cantidad de observaciones en la clase iy n el tamano de la muestra (ver figura 2).
Estadıstica Descriptiva
Diagrama de sectores y tortas.
Ejemplo
Figura: Diagrama de tortas.
Estadıstica Descriptiva
Diagrama de sectores y tortas.
Observaciones
Si se desea comparar dos poblaciones, se utilizan semi-cırculos,
donde los radios deben capturar las diferencias en los tamanos de
la muestra. Para obtener una relacion entre los radios, se
establece que el area de cada semi-cırculo sea proporcional al
tamano de la muestra respectiva. Esto es, sean dos muestras, de
tamano n1 y n2 respectivamente. La relacion que deben cumplir
sus radios es
π2 r2
1π2 r2
2=
n1
n2⇒ r1 = r2
√n1
n2
Estadıstica Descriptiva
Diagrama de sectores y tortas.
Ejemplo
Figura: Diagrama de tortas para dos poblaciones.
Estadıstica Descriptiva
Pictograma.
Outline
1 Representaciones Graficas
2 Histogramas y Diagramas de Barra.
3 Diagrama de sectores y tortas.
4 Pictograma.
5 Boxplot o grafico de cajas.
6 Diagramas de Tallo-Hoja.
Estadıstica Descriptiva
Pictograma.
Pictograma
Este diagrama corresponde a dibujos alusivos a la variable en
estudio, donde su construccion es tal que el area de cada dibujo
sea proporcional a la frecuencia. Por ejemplo, si analizamos el
ingreso, un pictograma se nota en la figura 4
Estadıstica Descriptiva
Pictograma.
Pictograma
Figura: Pictograma.
Estadıstica Descriptiva
Boxplot o grafico de cajas.
Outline
1 Representaciones Graficas
2 Histogramas y Diagramas de Barra.
3 Diagrama de sectores y tortas.
4 Pictograma.
5 Boxplot o grafico de cajas.
6 Diagramas de Tallo-Hoja.
Estadıstica Descriptiva
Boxplot o grafico de cajas.
Boxplot
Es un tipo de representacion usada para resumir informacion
muestral. Para cada muestra se construye el diagrama de la
siguiente forma:
1 Se ubica una caja, ya sea vertical u horizontal, entre los
cuartiles Q1 y Q3.
2 Con una lınea se unen a la caja los percentiles P2,5 y P97,5,
respectivamente.
3 Se marca la mediana Q2 dentro de la caja.
4 Se denota con un punto las observaciones xmin y xmax.
Finalmente, el dibujo se realiza como en la figura 5
Estadıstica Descriptiva
Boxplot o grafico de cajas.
Ejemplo Boxplot
Figura: Boxplot.
Estadıstica Descriptiva
Diagramas de Tallo-Hoja.
Outline
1 Representaciones Graficas
2 Histogramas y Diagramas de Barra.
3 Diagrama de sectores y tortas.
4 Pictograma.
5 Boxplot o grafico de cajas.
6 Diagramas de Tallo-Hoja.
Estadıstica Descriptiva
Diagramas de Tallo-Hoja.
Tallo-Hoja
Una forma de representacion alternativa para un conjunto de
observaciones es el Diagrama de Tallo-Hoja del cual se muestra
un ejemplo en el cuadro
PROF Numero de Hojas Tallo Hojas
11 11 5 : 11233345669
5 6 : 34799
14 8 7 : 00123488
6 5 8 : 23467
1 1 9 : 5
Estadıstica Descriptiva
Diagramas de Tallo-Hoja.
Elementos
Este diagrama contiene la siguiente informacion:
Tamano de la muestra: Es la suma de la cantidad de hojas.
En el ejemplo n = 11 + 5 + 8 + 5 + 1 = 30.
Rango: Es la diferencia entre el ultimo valor y el primero. En
el ejemplo, R = 9,5− 5,1 = 4,3.
Mediana: Se encuentra en el tallo (lınea) donde no se senala
profundidad. En el ejemplo, corresponde a la observacion
numero 15, y por lo tanto, x = 6,9.
La profundidad indica la cantidad de hojas por bajo y por
sobre el tallo de la mediana correspondiente a cada tallo. En
el ejemplo, Prof(5) = 11, Prof(7) = 8 + 5 + 1 = 14,
Prof(8) = 5 + 1 = 6, Prof(9) = 1.
Estadıstica Descriptiva
Diagramas de Tallo-Hoja.
Construccion
1 Ordenar los datos de menor a mayor.
2 Calcular la cantidad de lıneas que tendra el diagrama
mediante
L = [10 · log10 n],
representando n el tamano de la muestra y [x] la parte entera
de x.
3 Estimamos el intervalo de valores para cada lınea segun
r =RL,
redondeando a la potencia de 10 mas proxima, siendo R el
rango de la muestra.
Estadıstica Descriptiva
Diagramas de Tallo-Hoja.
Diagrama
Prof: Para cada fila, excepto en la lınea central que contiene
la mediana, muestra la maxima profundidad correspondiente
a los datos de la fila.
Numero de Hojas: Indica la cantidad de hojas de cada tallo
(fila).
Tallo: Los tallos estan ordenados, en columna, desde la
menor observacion xmin y la mayor xmax; y en lıneas
separadas, aparecen todos los valores posibles de tallos
dentro del rango observado, con la precision dada por los
intervalos calculados anteriormente.
Hoja: Se representa el dıgito de cada observacion
correspondiente a cada tallo. Ası, por ejemplo, la primera
observacion de la muestra aparece en la primera lınea, y
ası sucesivamente.