Post on 01-Feb-2016
description
“Estadística”Prof. Juan Narro Lavi
Diplomatura de Estudio en
Gestión de Operaciones
Sesiones 1 y 2:Descripción de Datos
“Antes del inicio de la guerra se prevé que se podrá conquistar la victoria, eso se debe a los repetidos y minuciosos cálculos, a las apreciaciones y planificaciones que se hacen en el templo…”
Sun Tzu
“Nosotros confiamos en Dios. Todos los demás deben usar datos”
W.E.Deming
RECOLECTAR
Es una ciencia queabarca técnicas que nos permiten:
ORGANIZAR
PRESENTAR
INTERPRETAR
Estadística – Definición
TOMA DE
DECISIONES
ANALIZAR
DEFINIR
Toma de Decisiones
1. Datos: Observaciones específicas a través de mediciones o conteos.
2. Información: Datos procesados y resumidos para producir hechos y generar ideas.
3. Conocimiento: Información seleccionada y organizada que proporciona entendimiento, recomendaciones y el sustento para las decisiones.
Estadística
Estadística
Descriptiva
Inferencial
Resumir
Presentar
Numéricas
Gráficas
HistogramasPolígonosCurvasBarrasPastel
Distribuc. FrecuenciasMed. Tend. CentralDispersión
8
Diagrama Circular
Resumir Datos: Media Aritmética Simple
Edad N°Trabajadores
30 - 3435 - 3940 - 4445 - 49
612
82
Tabla de Distribución
Estadística Descriptiva
Presentar Datos: Tablas y Gráficas
ii
N
ii
n
X x
Nx
n1 1;
Estadística
Estadística
Descriptiva
Inferencial
Resumir
Presentar
Numéricas
Gráficas
Plantear
Probar
Supuestos
HistogramasPolígonosCurvasBarrasPastel
ProbabilidadDist. NormalDist. Normal Std.T StudentPoissonChi Cuadrado
Distribuc. FrecuenciasMed. Tend. CentralDispersión
• Estimación– Ej. Estimar el peso
promedio de la población usando el peso promedio de la muestra.
• Prueba de Hipótesis– Ej. Probar que el peso
promedio de la población es 65 kg.
Extraer conclusiones y/o tomar decisiones concernientes a una población basándose en
los resultados de una muestra.
Estadística Inferencial
MARCO POBLACIONAL(1200 Trabajadores de una Empresa)
Característica
Edad PesoExper.laboral (años)
Estado Civil
Registrode la
Caract.Población
P1
(1200 datos)...
PoblaciónP2
(1200 datos)
PoblaciónP3
(1200 datos)
PoblaciónPn
(1200 datos)
Característica
Registrode la
Caract.
Marco Poblacional
1200 trabajadores de la empresa
Técnicas
de muestreo
Marco Muestral
75 trabajadores de la empresa
POBLACIÓN
P1 P2 P3 Pn
Edad Peso Exper.Lab. Estado civil
...
POBLACIÓN POBLACIÓNPOBLACIÓN
Edad Peso Exper.Lab. Estado civil
MUESTRA
m1
75 datos
m2 m3 mn
Característica
Registrode la
Caract.
Marco Poblacional
1200 trabajadores de la empresa
Técnicas
de muestreo
Marco Muestral
75 trabajadores de la empresa
P1 P2
POBLACIÓN
P3 Pn
Edad Peso Exper.Lab. Estado civil
...
POBLACIÓN POBLACIÓNPOBLACIÓN
MUESTRA MUESTRA MUESTRA
Parámetro y Estimador
Parámetro:
Valor representativo de una población. Se simboliza por letras griegas.
Sólo hay un parámetro en cada población.
m Media poblacional
2 Varianza poblacional
Desviación estándar poblacional p Proporción poblacional
Estimador
Valor representativo de una muestra. Se simboliza por letras latinas.
Existen tantos estimadores como muestras se
extraigan de una población.
Media muestral.
Varianza muestra.
Desviación estándar muestral.
Proporción muestral.
x2ssp
Parámetro y Estimador
POBLACIÓN
MUESTRATécnicas de
Muestreo
Estadística Inferencial
Estimador : x
Parámetro : µ - = Error de muestreo
Parámetro y Estimador
Dato
Atributo Numérico
Discreto Continuo
Ejemplos:
Estado Civil Especialidad Color de Ojos (Define categorias o
grupos)
Ejemplos:
Número de Niños Defectos por hora (Items Contados)
Ejemplos:
Peso Voltaje (Características Medidas)
Estadística – Tipos de Datos
¿Qué podemos hacer con los datos?
Identificar característicasde interés para la gestión.
Recolección de datos
Organizarlos en tablas, gráficos y figuras
Calcular promedios ( media, mediana, moda y percentiles ) .
Calcular su dispersión (varianza, desviación estándar ).
Determinar una ecuación que represente larelación entre ellos (regresión)
Determinar el grado de asociación entreellos (correlación).
Analizarlos dentro de un horizontetemporal (series cronológicas)
Mejorar laCalidad Decisional
Fases del análisis estadístico
Definición ProblemaVariable / Atributo
Definición Población o Muestra
Recolección DatosPlan Censal / Muestral
Organización y Presentación de Datos
Medidas Estadísticas Parámetros/Estimador
Inferencia EstadísticaEstimación/P. Hipótesis
Conclusiones / Recomendaciones
Obtención de la Información
• Encuestas son el último recurso.• Principales fuentes:
– Publicaciones periódicas del gobierno– Firmas Financieras– Instituciones de Investigación– Grupos económicos– Periódicos y Revistas especializadas– Base de Datos Computarizadas, Redes.
Estadística descriptiva - Análisis de datos
• Distribución de Frecuencias– Agrupamiento de datos en categorías que
muestran el número de observaciones en cada categoría.
• Medidas de Tendencia Central (Posición)– Aquellas que indican el valor de un punto
medio o típico de un grupo de datos.• Medidas de Dispersión
– Aquellas que indican como se encuentran esparcidas las observaciones de un grupo de datos.
• Técnicas:
VariablesCualitativas
VariablesCuantitativas
• Distribución de Frecuencias• Tabla Cruzada • Barras• Circular• Pareto
• Lineal• Distribución de Frecuencias• Histograma y Ojiva• Tallo y Hoja • Dispersión
Tablas y los gráficos
Variable
Cualitativa
Gráfica de Datos
Circular ParetoBarrasDistribución de
Frecuencias
Tabulación de Datos
Tablas y los gráficos
(Variables son categoricas - atributos)
Ejemplo: Pacientes de Hospital por Unidad
Resumen de datos por categoria
Unidad Número de Pacientes PorcentajeCuidado Cardiaco 1,052.00 11.93%Emergencia 2,245.00 25.46%UCI 340.00 3.86%Maternidad 552.00 6.26%Cirugía 4,630.00 52.50%Total 8,819.00 100.00%
Distribución de Frecuencias
• Gráfico de Barras de pacientes por Unidad
Distribución de Frecuencias
Cuidado Cardiaco
Emergencia UCI Maternidad Cirugía Total -
1,000.00
2,000.00
3,000.00
4,000.00
5,000.00
6,000.00
7,000.00
8,000.00
9,000.00
10,000.00
1,052.00
2,245.00
340.00 552.00
4,630.00
8,819.00
Número de Pacientes
Tabla Cruzada
• Tabla Cruzada (o de Contingencia), es el listado del númewro de observaciones para cada combinación de valores de dos variables (cuantitativa o cualitativa).
• Si hay r categorias para la primera variables (filas) y c categorias para la segunda variable (columnas), la tabla es llamada “Tabla cruzada de r x c.
• Tabla Cruzada 3 x 3 para las Alternativas de Inversión de un Inversionista (en $1000’s)
Tabla Cruzada
InversiónInversionista
AInversionista
BInversionista
CTotal
Acciones 46 55 27 128
Bonos 32 44 19 95
Efectivo 15 20 33 68
Total 93 119 79 291
• Barras Horizontales lado a lado
Tabla Cruzada - Gráficos
• Barra Acumulada
Tabla Cruzada - Gráficos
• Ventas Trimestrales por Región:
Tabla Cruzada - Gráficos
1er Trim 2do Trim 3er Trim 4to TrimNorte 20.4 27.4 59 20.4Centro 30.6 38.6 34.6 31.6Sur 45.9 46.9 45 43.9
• Los gráficos de Barras y Circulares son frecuentemente usados para presentar datos cualitativos.
• La altura de la Barra o el tamaño del Sector Circular muestran la frecuencia o porcentaje de cada categoría.
Gráficos de Barras y Circular
Unidad Número de PacientesCuidado Cardiaco 1,052.00 Emergencia 2,245.00 UCI 340.00 Maternidad 552.00 Cirugía 4,630.00 Total 8,819.00
Gráficos de Barras y Circular
(Porcentajes son
redondeados )
Gráficos de Barras y Circular
UnidadNúmero de Pacientes
Porcentaje
Cuidado Cardiaco 1,052.00 11.93%Emergencia 2,245.00 25.46%UCI 340.00 3.86%Maternidad 552.00 6.26%Cirugía 4,630.00 52.50%Total 8,819.00 100.00%
Diagrama de Pareto
1. Decidir que elementos se estudiarán y colectar datos.
2. Tabular datos y calcular los #s acumulados.
3. Dibujar los ejes X e Y.4. Muestre los datos como
barras.5. Dibuje una curva
acumulativa.6. Crear una escala % en eje
vertical adicional.7. Rotular el diagrama.8. Analizar el diagrama.
1. Enfocar el aspecto principal de un problema.
2. Decidir el objetivo y elementos de mejoras.
3. Predecir la efectividad de la mejora.
4. Confeccionar diagramas ordenados por causas.
5. Comprender la efectividad de la mejora.
6. Emplear pérdidas unitarias en lugar de casos o unid. físicas.
Pasos Empleo
• En la planta de una empresa metal-mecánica se levantó la siguiente información referida a las lesiones sufridas por el personal entre el 1ro. de Enero y 31 de Mayo. Analizar y Concluir
Lesiones Enero Febrero Marzo Abril MayoEsguince de espalda 6 10 10 7 5Quemadura con acido 1 1Cortadura de mano 1 4 1 3 2Esguince de tobillo 1 2 1Cuerpo extraño en el ojo 2 1 1Cortadura de pierna 1 1 2 1 1
Diagrama de Pareto
Esguince de espalda
Cortadura de mano
Cortadura de pierna
Esguince de tobillo
Cuerpo ex-traño en el
ojo
Quemadura con acido
Esguince de espalda
Cortadura de mano
Cortadura de pierna
Esguince de tobillo
Cuerpo ex-traño en el
ojo
Quemadura con acido
TOTAL
38 11 6 4 4 2
F.R. ACM.
0.584615384615385
0.753846153846154
0.846153846153847
0.907692307692308
0.969230769230769
1
5
15
25
35
45
55
65
0.050.150.250.350.450.550.650.750.850.95
Lesiones Enero – Mayo
Cant
. de L
esion
es
Diagrama de Pareto
Datos Numéricos
Gráfico Tallo y Hoja
Histograma Ogiva
Distribucion de Frecuencias yDistribuciones Acumulativas
Tablas y los gráficos
¿Qué es una Distribución de Frecuencias?
• Una distribución de frecuencias es una lista o una tabla …
• Conteniendo agrupaciones de clases (categorias o rangos dentro de los cuales se encuetran los datos) ...
• Y la correspondiente frecuencia con la cual los datos se encuentran en cada clase o categoria.
Distribución de frecuencias
Distribución de frecuencias - Definiciones• Intervalo de clase
– Número reducido de datos.• Frontera/Límite de clase
– Punto medio entre dos extremos de clase consecutivas.
• Amplitud de clase– Diferencia entre la frontera superior e
inferior de una clase.• Marca de clase
– Punto medio entre los extremos/fronteras de una clase.
• Frecuencia de clase– Número de variables incluidas en un
intervalo de clase.
Distribución de Frecuencias
• Pasos
1.Determinar el tipo y número de clases (intervalos).
Regla general : 5 - 20
Sturges : # clases = 1 + 3.3 log N
2.Determinar la amplitud de la clase (i)
i = (Val. Máx. - Val. Min.) / # clases
3.Establecer el extremo inferior.
4.Determinar las fronteras (limites)
5.Calcular la marca de clase (m)
6.Contar el número de observaciones en cada clase (f).
PETROLOBITOSProduccion de Petroleo
(en Miles de Barriles)
38 31 41 52 5933 34 92 74 6877 68 84 41 4054 49 60 62 5978 63 46 74 6960 37 43 51 6192 95 81 38 6070 42 88 94 8573 66 75 64 5676 95 69 50 5569 83 78 74 7783 49 34 78 4838 76 99 38 9468 51 87 53 6939 60 35 79 8071 58 83 94 6667 50 86 70 8051 57 54 46 4634 48 64 71 6561 65 64 98 55
Ejercicio
Distribución de Frecuencias
• Pasos
1.Determinar el tipo y número de clases (intervalos).
Sturges : # clases = 1 + 3.3 log N
# de clases= 1 + 3.3 log (100) = 1 + 3.3 * 2 = 7.6
# de clases= 7
2.Determinar la amplitud de la clase (i)
i = (Val. Máx. - Val. Min.) / # clases
i = (99-31) / 7 = 9.7
i = 10
3. Establecer el extremo inferior.
Puede ser 31 o menos.
Por facilidad 30
Distribución de Frecuencias
• Pasos
4. Determinar las fronteras (limites)
Fronteras se expresan con un decimal adicional
Frontera inferior de primera clase pto. Medio entre 29 y 30, es decir 29.5
Frontera superior = 29.5 + 10 = 39.5
Extremo superior de la primera clase sería 39.
5. Calcular la marca de clase (m)
Pto.medio entre extremos o fronteras
(30 + 39) / 2 = 34.5 ó (29.5 + 39.5) / 2 = 34.5
6.Contar el número de observaciones en cada clase (f).
Distribución de Frecuencias
Intervalo Clase
Amplitud (i)
Frontera Inferior
(li)
Frontera Superior
(ls)
Marca Clase(m)
Frecuencia Absoluta
(f)
30 -39 10 29.5 39.5 34.5 12
40 – 49 10 39.5 49.5 44.5 12
50 – 59 10 49.5 59.5 54.5 16
60 – 69 10 59.5 69.5 64.5 23
70 – 79 10 69.5 79.5 74.5 17
80 – 89 10 79.5 89.5 84.5 11
90 – 99 10 89.5 99.5 94.5 9
Distribución de Frecuencias
Intervalo Clase
Marca Clase
Frecuencia Absoluta
Frecuencia Acumulada
Frecuencia Relativa
Frecuencia Relativa Acumulada
30 -39 34.5 12 12 0.12 0.12
40 – 49 44.5 12 24 0.12 0.24
50 – 59 54.5 16 40 0.16 0.40
60 – 69 64.5 23 63 0.23 0.63
70 – 79 74.5 17 80 0.17 0.80
80 – 89 84.5 11 91 0.11 0.91
90 – 99 94.5 10 100 0.09 1.00
Tabla de Frecuencias de la distribución deCuentas por Cobrar Tienda BETA
Fuente: Dpto. Contabilidad Tienda BETA
• Un gráfico de los datos arreglados en una distribución de frecuencias es llamado histograma.
• Los criterios de valoración de intervalo se muestran en el eje horizontal
• en el eje vertical se presentan: frecuencia, frecuencia relativa, o porcentaje
• Barra de altrura apropiada son empleadas para representar el número de observaciones que hay dentro de cada clase.
Histograma
EjemploGráfico 4: Peso de 100 Personas (en Kg.)
Número de Personas
0
5
10
15
20
25
29.5 39.5 49.5 59.5 69.5 79.5 89.5 99.5Peso(Kgs)
Fuente: Encuesta, enero 1998
Histograma
Ejemplo Gráfico 5: Marca de bebida gaseosa preferida por
universitarios (en %)
0
5
10
15
20
CocaCola
PepsiCola
InkaCola
Fanta Otros
%
Fuente: Encuesta a Universitarios, enero 1998
Histograma
Empleo de histogramas
• Normales– Proceso estable, distrib.
simétrica.• Doble pico
– Mezcla de datos con diferentes medias.
• Islas– Mezcla accidental con
otra distribución.• “Cliff”
– Final abrupto en una columna alta (eliminar)
• Rueda dentada– Amplitudes múltiplos
enteros (escala)
• ¿Está el centro de la distribución exactamente en el medio de las especificaciones?
• ¿Es la dispersión demasiado grande o pequeña?
• ¿Aparece algún dato más allá de las especificaciones?
• ¿Hay un espacio amplio para la distribución dentro de las especificaciones?
Análisis Gráfico
• Histograma– Gráfica de barras de una distribución de frecuencias.
• Polígono de frecuencias– Gráfica lineal de una distribución de frecuencias (marca).
• Curvas– Polígono de frecuencias suavizado (asimetría, curtosis)
• Ojiva– Gráfica de una distribución de frecuencias acumulada.
• Barras– Gráfica de frecuencias para diferentes categorias de datos.
• Pastel– Para ilustrar divisiones de una cantidad total (%).
Intervalo Clase
Marca Clase
Frecuencia Absoluta
Frecuencia Acumulada
Frecuencia Relativa
Frecuencia Relativa Acumulada
30 -39 34.5 12 12 0.12 0.12
40 – 49 44.5 12 24 0.12 0.24
50 – 59 54.5 16 40 0.16 0.40
60 – 69 64.5 23 63 0.23 0.63
70 – 79 74.5 17 80 0.17 080
80 – 89 84.5 11 91 0.11 0.91
90 – 99 94.5 9 100 0.09 1.00
Tabla de Frecuencias de la distribución deCuentas por Cobrar Tienda BETA
Fuente: Dpto. Contabilidad Tienda BETA
Análisis Gráfico
0
5
10
15
20
25
30-39 40-49 50-59 60-69 70-79 80-89 90-99
Frecuencia
Clases
Tienda "BETA"Histograma
Frecuencia
Fuente: Dpto. Contabilidad Tienda BETA
0
5
10
15
20
25
34.5 44.5 54.5 64.5 74.5 84.5 94.5
Frecuencia
Clases
Tienda "BETAPoligono de frecuencias
Frecuencia
Frecuencia
Fuente: Dpto. Contabilidad Tienda BETA
0
20
40
60
80
100
120
30-39 40-49 50-59 60-69 70-79 80-89 90-99
Frecuencia
Clases
Tienda "BETA"Frecuencia Acumulada
Frec. Acum.
Fuente: Dpto. Contabilidad Tienda BETA
30-3912%
40-4912%
50-5916%
60-6923%
70-7917%
80-8911%
90-999%
Tienda "BETA"Frecuencia Relativa
Fuente: Dpto. Contabilidad Tienda BETA
“Estadística”Prof. Juan Narro Lavi
Diplomatura de Estudio en
Gestión de Operaciones