Post on 05-Jul-2018
8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.
1/39
Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.
Análisis de Datos para la Gerencia 1
Sesión 1
Introducción a la Estadística:
Descripción de Datos
8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.
2/39
Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.
Análisis de Datos para la Gerencia 2
¿Qué es la estadística?
“La Es tadística es un campo de la ciencia quecomprende procedimientos destinados a servir en el
proc eso de decis ión cuando hay incertidumbre”.
Esta definición puntualiza dos aspectos que el gerenteenfrenta continuamente: toma de decisiones eincertidumbre. En lo que se refiere al tratamiento de laincertidumbre, la teoría de probabilidades nos da la
oportunidad de una cuantificación del riesgo lo quepermite ganar en eficiencia en la toma de decisiones.Este proceso se torna cada día más “científico” y lastécnicas de soporte son por lo tanto una necesidad.
8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.
3/39
Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.
Análisis de Datos para la Gerencia 3
Datos
Los datos son los hechos y los números que sereúnen, analizan y resumen para su presentacióne interpretación.
8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.
4/39
Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.
Análisis de Datos para la Gerencia 4
Elementos, Variables,
Observaciones
Al conjunto de medidas recogidas de un elemento enparticular se le llama observación .
Una variable es una característica de interés de cadaelemento.
Los elementos son las entidades de las cualesrecogemos los datos.
El número total de datos es igual al número deelementos multiplicado por el de variables.
8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.
5/39
Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.
Análisis de Datos para la Gerencia 5
Escalas de Medición
La escala indica además qué tipos de resúmenes dedatos y de análisis estadísticos son los más apropiados.
La escala determina la cantidad de información quedebe contener el dato.
Las escalas de medición son:
Nominal
Ordinal
De intervalo
De razón
8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.
6/39
Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.
Análisis de Datos para la Gerencia 6
• Nominal
Se usan etiquetas no
numéricas o códigos numéricos.
Los Datos son etiquetas o nombres usados paraIdentificar un atributo de un elemento.
Escalas de Medición
8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.
7/39
8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.
8/39Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.
Análisis de Datos para la Gerencia 8
• De Intervalo
Datos de Intervalo son siempre numéricos.
Los datos tienen las prop iedades de los ord inales y las distancias que hay entre las observaciones semiden en térm inos de una un id ad de med ida fi ja .
Esta escala tiene el cero relativo que indica quepara esta variable el pun to cero depende de quien evalúa. En el cero, no s iempre no hay nada.
Escalas de Medición
8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.
9/39Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.
Análisis de Datos para la Gerencia 9
• De razón
Los datos tienen todas las propiedades de los de intervalo y en este caso el coc iente de dos
valores tiene un sign if icado.
Variables como son distancia, altura, peso, y
tiempo usan la escala de razón.
Esta escala tiene el cero absolu to que indica quepara esta variable no existe nada en el punto cero.
Escalas de Medición
8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.
10/39Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.
Análisis de Datos para la Gerencia 10
Cada escala provee diferente información
Nominal
Ordinal
Intervalo
Razón
Tercero Segundo Ganador Tercero Segundo Ganador
Tercero Segundo Ganador
20 segundos 1 segundo
1 minuto 59 2/5 segundos para 11/4 millas
8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.
11/39Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.
Análisis de Datos para la Gerencia 11
La mayoría de la información estadística en losperiódicos, revistas, informes de la compañía, y
otras publicaciones consiste en datos que seresumen y presentan en una forma que es fácilde entender.
A dichos resúmenes de datos, que pueden ser
tabulares, gráficos, o numéricos, se les conocecomo estadísti ca descrip tiva .
Estadística Descriptiva
8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.
12/39Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.
Análisis de Datos para la Gerencia 12
Inferencia Estadística
Población
Muestra
InferenciaEstadística
Censo
Encuesta
es el proceso por el que se obtieneinformación acerca de la poblaciónpartiendo de información contenida
en una muestra.es el conjunto total de elementos deun estudio.
es un subconjunto de la población.
es recolectar datos de la población.
es recolectar datos de una muestra.
8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.
13/39Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.
Análisis de Datos para la Gerencia 13
Proceso de Inferencia Estadística
Poblacióncon m
parámetrodesconocido
1
Extraemos una
muestra de“n” elementos2
Calculamos X estadísticomuestral
3
Usamos el promediomuestral para estimar
el parámetro poblacional.
4
8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.
14/39Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.
Análisis de Datos para la Gerencia 14
Computadoras y análisis estadístico
Los estadísticos a menudo utilizan programasinformáticos para realizar los cálculos estadísticosnecesarios con grandes cantidades de datos.
Para facilitar el uso del ordenador, muchos de losconjuntos de datos en este libro están disponiblesen el sitio web que acompaña al texto
Los archivos de datos se encuentran en formatosde Minitab o Excel.
Anexos al final de cada capítulo con losprocedimientos paso a paso para el uso deMinitab, Excel y StatTools.
8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.
15/39Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.
Análisis de Datos para la Gerencia 15
Estadística Descriptiva
Datos resumidos y presentados
convenientemente. Dichos resúmenespueden ser:
tabulares
gráficos o
numéricos
8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.
16/39Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.
Análisis de Datos para la Gerencia 16
Una distr ibución de frecuencias es una tablaque resume los datos mostrando la frecuencia onúmero de elementos que hay dentro de cada una
de sus clases, que deben ser mutuamenteexcluyentes y colectivamente exhaustivas.
El objetivo es pro veer info rmación acerca del
conjunto de datos que no podría obtenerserápidamente por simple observación de los datosoriginales.
Distribución de frecuencias
8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.
17/39Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.
Análisis de Datos para la Gerencia 17
La frecuencia relativa de una clase es la fraccióno proporción del total de datos que pertenecen auna determinada clase.
Una dis tr ibuc ión de frecuencias relativas es una
tabla que nos resume un conjunto de datosmostrando la frecuencia relativa para cada clase.
Distribución de frecuencias relativas
8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.
18/39Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.
Análisis de Datos para la Gerencia 18
Un gráfic o de barras es una herramienta gráficapara trabajar con datos cualitativos.
En un eje (normalmente el horizontal), colocamoslas etiquetas con los nombres de las categorías.
En el otro eje (normalmente el vertical), se puedeusar la frecuencia, la frecuencia relativ a.
Usamos una barra de ancho fi jo que dibujamosarriba de cada etiqueta, con una altura de acuerdocon su correspondiente frecuencia.
Las barras están separadas para enfatizar quecada clase es una categoría diferente.
Gráfico de Barras
8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.
19/39
8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.
20/39Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.
Análisis de Datos para la Gerencia 20
Guías para seleccionar el número de clases
Use entre 5 y 20 clases.
Conjuntos de datos con un número grande deelementos, generalmente requieren un número
grande de clases.
Conjuntos de datos pequeños usualmenterequieren pocas clases
Distribución de Frecuencias
Para Datos Numéricos
8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.
21/39Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.
Análisis de Datos para la Gerencia 21
Guía para seleccionar el Ancho de Clase
Use clases de igual ancho
Ancho aproximado de clase =
Número de ClasesDato más grande - Dato más pequeño
Distribución de Frecuencias
Para Datos Numéricos
8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.
22/39
Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.
Análisis de Datos para la Gerencia 22
Distribución Acumulada de Frecuenciasmuestra el número de observaciones con valoresiguales o menores que el límite superior de cada
clase.Distribución Acumulada de FrecuenciasRelativas muestra la proporción de ítems convalores menores o iguales al el límite superior de
cada clase.Distribución Acumulada de FrecuenciasPorcentuales muestra el porcentaje de ítems convalores menores o iguales al el límite superior de
cada clase.
Distribución Acumulativa
8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.
23/39
Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.
Análisis de Datos para la Gerencia 23
La función FRECUENCIA no es una función
“simple” de Excel.FRECUENCIA nos proporciona valores múltiples.
En Excel, la formula que dan como respuestamúltiples valores se llaman fórmula matricial.
Una fórmula matricial tiene una forma especial deingresar.
Usando la función FRECUENCIA de
Excel para Construir una Distribuciónde Frecuencias
8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.
24/39
Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.
Análisis de Datos para la Gerencia 24
Pasos para ejecutar esta función:
Paso 1 Seleccionar la matriz donde debenaparecer las frecuencias
Paso 2 Escribir la siguiente fórmula:
{= FRECUENCIA (Datos,Grupos)}
Paso 3 Presionar CTRL + SHIFT + ENTER
(La fórmula aparecerá en toda la matrizseleccionada)
Usando la función FRECUENCIA de
Excel para Construir una Distribuciónde Frecuencias
8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.
25/39
Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.
Análisis de Datos para la Gerencia 25
Histograma
El histograma es una manera muy común depresentar gráficamente datos cuantitativos.
La variable de interés se coloca en el eje horizontal.
Se dibuja un rectángulo arriba de cada intervalo declase con una altura correspondiente a sufrecuencia, frecuencia relativa, o frecuencia
porcentual.
A diferencia del gráfico de barras, un histogramano tiene separaciones entre rectángulos de clases
adyacentes
8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.
26/39
Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.
Análisis de Datos para la Gerencia 26
Usando herramientas de Excel
Herramientas
Análisisde Datos
Histograma
Usando Excel para Construir un
Histograma
8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.
27/39
Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.
Análisis de Datos para la Gerencia 27
Análisis Exploratorio de
Datos
El Análisis Exploratorio de Datos es un conjunto de
técnicas que usan aritmética simple y gráficosfáciles de dibujar para resumir datos rápidamente.
Una de estas técnicas es el diagrama de hoja ytallo.
8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.
28/39
Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.
Análisis de Datos para la Gerencia 28
Diagrama de Hoja y Tallo
Cada dígito en el tallo es una hoja.
Cada línea en el diagrama se conoce como tallo.
A la derecha de la línea, registramos el último dígitode cada dato en orden.
El primer dígito de cada dato se coloca a laizquierda de una línea vertical.
Es muy parecido a un histograma, con la ventaja deque este diagrama conserva los valores originales.
Un Diagrama de Hoja y Tallo nos muestra ambos elorden y la forma de la distribución de los datos.
8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.
29/39
Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.
Análisis de Datos para la Gerencia 29
Dado que tenemos el primer dígito repetido, elprimer valor corresponde a valores de la hoja de0 - 4, y el segundo a valores de la hoja de 5 - 9.
Si se cree que un diagrama de hoja y tallo estámuy concentrado, podemos abrir el diagramausando dos tallos para cada dígito inicial.
Diagrama de Hoja y Tallo
8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.
30/39
Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.
Análisis de Datos para la Gerencia 30
Unidades de la Hoja
Cuando no se muestran las unidades de la hoja,se asume que es 1.
Las unidades pueden ser 100, 10, 1, 0.1, y así.
En el ejemplo anterior, la unidad de la hoja fue 1.
Cada hoja se define por un sólo dígito.
Diagrama de Hoja y Tallo
A áli i d D l G i 31
8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.
31/39
Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.
Análisis de Datos para la Gerencia 31
Tablas de Contingencia y
Diagramas de Dispersión
Tablas de Contingencia y Diagramas de Dispersiónson dos métodos que permiten resumir los datospara dos (o más) variables simultáneamente.
Los gerentes necesitan métodos que les permitangraficar y tabular datos de manera que se entiendanlas relaciones entre dos variables.
Hasta el momento hemos visto métodos queresumen datos pero una variable a la vez.
A áli i d D t l G i 32
8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.
32/39
Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.
Análisis de Datos para la Gerencia 32
Tablas de Contingencia
Tabla de contingencia es una forma de resumir enuna tabla datos de dos variables simultáneamente.
Se puede usar si: ambas variables son cualitativas, o
Si alguna es cuantitativa, para hacer la tabladebe ser transformada en otra cualitativa.
Las filas y las columnas definen las clases paracada una de las dos variables.
A áli i d D t l G i 33
8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.
33/39
Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.
Análisis de Datos para la Gerencia 33
El patrón general que muestran los puntossugieren la relación entre las variables.
Una de las variables se muestra en el eje verticaly la otra en el horizontal.
Un diagrama de dispersión es una representacióngráfica de la relación entre dos variables
cuantitativas.
Una línea de tendencia es una aproximación de larelación.
Diagramas de Dispersión y
Líneas de Tendencia
A áli i d D t l G i 34
8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.
34/39
Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.
Análisis de Datos para la Gerencia 34
Procedimientos Gráficos y Tabulares
Cualitativo Cuantitativo
MétodosTabulares
MétodosTabulares
MétodosGráficos
MétodosGráficos
• Dist.Frec.• Dist.Frec.Relat.• Dist.Frec.Porc.• Tab.deConting.
• Gráfico deBarras
• Gráfico dePie
• Dist. Frec.• Dist.Frec.Relat.• Dist.Frec.Acum.• Dist.Frec.Relat.A
cumuladas• Diagrama de
Hoja y Tallo• Tab.deConting.
• Histograma• Ojiva• Diagrama de
Dispersión
Dato
A áli i d D t l G i 35
8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.
35/39
Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.
Análisis de Datos para la Gerencia 35
Errores en Presentación de Datos
1. Uso de ‘Gráficosengañosos’.
2. Bases Relativas deComparacióndiferentes.
3. Comprimiendo el ejevertical.
4. No punto CERO enel eje Vertical.
A áli i d D t l G i 36
8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.
36/39
Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.
Análisis de Datos para la Gerencia 36
‘Gráfico engañoso’
Incorrecta Correcta
1960: $1.00
1970: $1.60
1980: $3.10
1990: $3.80 0
2
4
1960 1970 1980 1990
$
Análisis de Datos para la Gerencia 37
8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.
37/39
Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.
Análisis de Datos para la Gerencia 37
Base Relativa Diferente
CorrectaIncorrecta
0
100
200
300
FR SO JR SR
Freq.
0%
10%
20%
30%
FR SO JR SR
%
Análisis de Datos para la Gerencia 38
8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.
38/39
Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.
Análisis de Datos para la Gerencia 38
Compresión de eje Vertical
CorrectaIncorrecta
0
25
50
Q1 Q2 Q3 Q4
$
0
100
200
Q1 Q2 Q3 Q4
$
Análisis de Datos para la Gerencia 39
8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.
39/39
Análisis de Datos para la Gerencia 39
No Cero en Eje Vertical
CorrectaIncorrecta
0
20
40
60
J M M J S N
$
36
39
42
45
J M M J S N
$