Sesión01-Analisis de Datos Para La Gerencia.

download Sesión01-Analisis de Datos Para La Gerencia.

of 39

Transcript of Sesión01-Analisis de Datos Para La Gerencia.

  • 8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.

    1/39

    Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

    Análisis de Datos para la Gerencia 1

    Sesión 1

    Introducción a la Estadística:

    Descripción de Datos

  • 8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.

    2/39

    Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

    Análisis de Datos para la Gerencia 2

    ¿Qué es la estadística?

    “La Es tadística  es un campo de la ciencia quecomprende procedimientos destinados a servir en el

    proc eso de decis ión cuando hay incertidumbre”.

    Esta definición puntualiza dos aspectos que el gerenteenfrenta continuamente: toma de decisiones eincertidumbre. En lo que se refiere al tratamiento de laincertidumbre, la teoría de probabilidades nos da la

    oportunidad de una cuantificación del riesgo lo quepermite ganar en eficiencia en la toma de decisiones.Este proceso se torna cada día más “científico” y lastécnicas de soporte son por lo tanto una necesidad.

  • 8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.

    3/39

    Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

    Análisis de Datos para la Gerencia 3

    Datos

    Los datos son los hechos y los números que sereúnen, analizan y resumen para su presentacióne interpretación.

  • 8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.

    4/39

    Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

    Análisis de Datos para la Gerencia 4

    Elementos, Variables,

    Observaciones

     Al conjunto de medidas recogidas de un elemento enparticular se le llama observación .

    Una variable es una característica de interés de cadaelemento.

    Los   elementos  son las entidades de las cualesrecogemos los datos.

    El  número total de datos  es igual al número deelementos multiplicado por el de variables.

  • 8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.

    5/39

    Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

    Análisis de Datos para la Gerencia 5

    Escalas de Medición

    La escala indica además qué tipos de resúmenes dedatos y de análisis estadísticos son los más apropiados.

    La escala determina la cantidad de información quedebe contener el dato.

    Las escalas de medición son:

    Nominal 

    Ordinal 

    De intervalo 

    De razón 

  • 8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.

    6/39

    Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

    Análisis de Datos para la Gerencia 6

    • Nominal

    Se usan etiquetas no 

     numéricas  o códigos numéricos.

    Los Datos son etiquetas o nombres usados paraIdentificar un atributo de un elemento.

    Escalas de Medición

  • 8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.

    7/39

  • 8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.

    8/39Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

    Análisis de Datos para la Gerencia 8

    • De Intervalo

    Datos de Intervalo son siempre numéricos.

    Los datos tienen las prop iedades de los ord inales y las distancias que hay entre las observaciones semiden en térm inos de una un id ad de med ida fi ja .

    Esta escala tiene el cero relativo que indica quepara esta variable el pun to cero depende de quien evalúa. En el cero, no  s iempre no hay nada.

    Escalas de Medición

  • 8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.

    9/39Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

    Análisis de Datos para la Gerencia 9

    • De razón

    Los datos tienen todas las propiedades de los de intervalo  y en este caso el coc iente de dos 

    valores tiene un sign if icado.

    Variables como son distancia, altura, peso, y

    tiempo usan la escala de razón.

    Esta escala tiene el cero absolu to que indica quepara esta variable no existe nada en el punto cero.

    Escalas de Medición

  • 8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.

    10/39Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

    Análisis de Datos para la Gerencia 10

    Cada escala provee diferente información

    Nominal

    Ordinal

    Intervalo

    Razón

    Tercero Segundo Ganador Tercero Segundo Ganador 

    Tercero Segundo Ganador 

    20 segundos 1 segundo

    1 minuto 59 2/5 segundos para 11/4 millas

  • 8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.

    11/39Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

    Análisis de Datos para la Gerencia 11

    La mayoría de la información estadística en losperiódicos, revistas, informes de la compañía, y

    otras publicaciones consiste en datos que seresumen y presentan en una forma que es fácilde entender.

     A dichos resúmenes de datos, que pueden ser 

    tabulares, gráficos, o numéricos, se les conocecomo estadísti ca descrip tiva .

    Estadística Descriptiva

  • 8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.

    12/39Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

    Análisis de Datos para la Gerencia 12

    Inferencia Estadística

    Población

    Muestra

    InferenciaEstadística

    Censo

    Encuesta

    es el proceso por el que se obtieneinformación acerca de la poblaciónpartiendo de información contenida

    en una muestra.es el conjunto total de elementos deun estudio.

    es un subconjunto de la población.

    es recolectar datos de la población.

    es recolectar datos de una muestra.

  • 8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.

    13/39Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

    Análisis de Datos para la Gerencia 13

    Proceso de Inferencia Estadística

    Poblacióncon m

    parámetrodesconocido

    1

    Extraemos una

    muestra de“n” elementos2

    Calculamos X estadísticomuestral

    3

    Usamos el promediomuestral para estimar

    el parámetro poblacional.

    4

  • 8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.

    14/39Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

    Análisis de Datos para la Gerencia 14

    Computadoras y análisis estadístico

    Los estadísticos a menudo utilizan programasinformáticos para realizar los cálculos estadísticosnecesarios con grandes cantidades de datos.

    Para facilitar el uso del ordenador, muchos de losconjuntos de datos en este libro están disponiblesen el sitio web que acompaña al texto

    Los archivos de datos se encuentran en formatosde Minitab o Excel.

     Anexos al final de cada capítulo con losprocedimientos paso a paso para el uso deMinitab, Excel y StatTools.

  • 8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.

    15/39Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

    Análisis de Datos para la Gerencia 15

    Estadística Descriptiva

    Datos resumidos y presentados

    convenientemente. Dichos resúmenespueden ser:

    tabulares

    gráficos o

    numéricos

  • 8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.

    16/39Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

    Análisis de Datos para la Gerencia 16

    Una distr ibución de frecuencias es una tablaque resume los datos mostrando la frecuencia onúmero de elementos que hay dentro de cada una

    de sus clases, que deben ser mutuamenteexcluyentes y colectivamente exhaustivas.

    El objetivo es pro veer info rmación acerca del

    conjunto de datos que no podría obtenerserápidamente por simple observación de los datosoriginales.

    Distribución de frecuencias

  • 8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.

    17/39Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

    Análisis de Datos para la Gerencia 17

    La frecuencia relativa de una clase es la fraccióno proporción del total de datos que pertenecen auna determinada clase.

    Una dis tr ibuc ión de frecuencias relativas es una

    tabla que nos resume un conjunto de datosmostrando la frecuencia relativa para cada clase.

    Distribución de frecuencias relativas

  • 8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.

    18/39Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

    Análisis de Datos para la Gerencia 18

    Un gráfic o de barras es una herramienta gráficapara trabajar con datos cualitativos.

    En un eje (normalmente el horizontal), colocamoslas etiquetas con los nombres de las categorías.

    En el otro eje (normalmente el vertical), se puedeusar la frecuencia, la frecuencia relativ a.

    Usamos una barra de ancho  fi jo que dibujamosarriba de cada etiqueta, con una altura de acuerdocon su correspondiente frecuencia.

    Las barras están separadas para enfatizar quecada clase es una categoría diferente.

    Gráfico de Barras

  • 8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.

    19/39

  • 8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.

    20/39Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

    Análisis de Datos para la Gerencia 20

    Guías para seleccionar el número de clases

    Use entre 5 y 20 clases.

    Conjuntos de datos con un número grande deelementos, generalmente requieren un número

    grande de clases.

    Conjuntos de datos pequeños usualmenterequieren pocas clases

    Distribución de Frecuencias

    Para Datos Numéricos

  • 8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.

    21/39Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

    Análisis de Datos para la Gerencia 21

    Guía para seleccionar el Ancho de Clase

    Use clases de igual ancho

     Ancho aproximado de clase =

    Número de ClasesDato más grande - Dato más pequeño

    Distribución de Frecuencias

    Para Datos Numéricos

  • 8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.

    22/39

    Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

    Análisis de Datos para la Gerencia 22

    Distribución Acumulada de Frecuenciasmuestra el número de observaciones con valoresiguales o menores que el límite superior de cada

    clase.Distribución Acumulada de FrecuenciasRelativas muestra la proporción de ítems convalores menores o iguales al el límite superior de

    cada clase.Distribución Acumulada de FrecuenciasPorcentuales muestra el porcentaje de ítems convalores menores o iguales al el límite superior de

    cada clase.

    Distribución Acumulativa

  • 8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.

    23/39

    Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

    Análisis de Datos para la Gerencia 23

    La función FRECUENCIA no es una función

    “simple” de Excel.FRECUENCIA nos proporciona valores múltiples.

    En Excel, la formula que dan como respuestamúltiples valores se llaman fórmula matricial.

    Una fórmula matricial tiene una forma especial deingresar.

    Usando la función FRECUENCIA de

    Excel para Construir una Distribuciónde Frecuencias

  • 8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.

    24/39

    Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

    Análisis de Datos para la Gerencia 24

    Pasos para ejecutar esta función:

    Paso 1 Seleccionar la matriz donde debenaparecer las frecuencias

    Paso 2 Escribir la siguiente fórmula:

    {= FRECUENCIA (Datos,Grupos)}

    Paso 3 Presionar CTRL + SHIFT + ENTER

    (La fórmula aparecerá en toda la matrizseleccionada)

    Usando la función FRECUENCIA de

    Excel para Construir una Distribuciónde Frecuencias

  • 8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.

    25/39

    Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

    Análisis de Datos para la Gerencia 25

    Histograma

    El histograma es una manera muy común depresentar gráficamente datos cuantitativos.

    La variable de interés se coloca en el eje horizontal.

    Se dibuja un rectángulo arriba de cada intervalo declase con una altura correspondiente a sufrecuencia, frecuencia relativa, o frecuencia

    porcentual.

     A diferencia del gráfico de barras, un histogramano tiene separaciones entre rectángulos de clases

    adyacentes

  • 8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.

    26/39

    Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

    Análisis de Datos para la Gerencia 26

    Usando herramientas de Excel

    Herramientas

     Análisisde Datos

    Histograma

    Usando Excel para Construir un

    Histograma

  • 8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.

    27/39

    Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

    Análisis de Datos para la Gerencia 27

    Análisis Exploratorio de

    Datos

    El Análisis Exploratorio de Datos es un conjunto de

    técnicas que usan aritmética simple y gráficosfáciles de dibujar para resumir datos rápidamente.

    Una de estas técnicas es el diagrama de hoja ytallo.

  • 8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.

    28/39

    Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

    Análisis de Datos para la Gerencia 28

    Diagrama de Hoja y Tallo

    Cada dígito en el tallo es una hoja.

    Cada línea en el diagrama se conoce como tallo.

     A la derecha de la línea, registramos el último dígitode cada dato en orden.

    El primer dígito de cada dato se coloca a laizquierda de una línea vertical.

    Es muy parecido a un histograma, con la ventaja deque este diagrama conserva los valores originales.

    Un Diagrama de Hoja y Tallo nos muestra ambos elorden y la forma de la distribución de los datos.

  • 8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.

    29/39

    Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

    Análisis de Datos para la Gerencia 29

    Dado que tenemos el primer dígito repetido, elprimer valor corresponde a valores de la hoja de0 - 4, y el segundo a valores de la hoja de 5 - 9.

    Si se cree que un diagrama de hoja y tallo estámuy concentrado, podemos abrir el diagramausando dos tallos para cada dígito inicial.

    Diagrama de Hoja y Tallo

  • 8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.

    30/39

    Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

    Análisis de Datos para la Gerencia 30

    Unidades de la Hoja

    Cuando no se muestran las unidades de la hoja,se asume que es 1.

    Las unidades pueden ser 100, 10, 1, 0.1, y así.

    En el ejemplo anterior, la unidad de la hoja fue 1.

    Cada hoja se define por un sólo dígito.

    Diagrama de Hoja y Tallo

    A áli i d D l G i 31

  • 8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.

    31/39

    Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

    Análisis de Datos para la Gerencia 31

    Tablas de Contingencia y

    Diagramas de Dispersión

    Tablas de Contingencia y Diagramas de Dispersiónson dos métodos que permiten resumir los datospara dos (o más) variables simultáneamente.

    Los gerentes necesitan métodos que les permitangraficar y tabular datos de manera que se entiendanlas relaciones entre dos variables.

    Hasta el momento hemos visto métodos queresumen datos pero una variable a la vez.

    A áli i d D t l G i 32

  • 8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.

    32/39

    Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

    Análisis de Datos para la Gerencia 32

    Tablas de Contingencia

    Tabla de contingencia es una forma de resumir enuna tabla datos de dos variables simultáneamente.

    Se puede usar si: ambas variables son cualitativas, o

    Si alguna es cuantitativa, para hacer la tabladebe ser transformada en otra cualitativa.

    Las filas y las columnas definen las clases paracada una de las dos variables.

    A áli i d D t l G i 33

  • 8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.

    33/39

    Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

    Análisis de Datos para la Gerencia 33

    El patrón general que muestran los puntossugieren la relación entre las variables.

    Una de las variables se muestra en el eje verticaly la otra en el horizontal.

    Un diagrama de dispersión es una representacióngráfica de la relación entre dos variables

    cuantitativas.

    Una línea de tendencia es una aproximación de larelación.

    Diagramas de Dispersión y

    Líneas de Tendencia

    A áli i d D t l G i 34

  • 8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.

    34/39

    Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

    Análisis de Datos para la Gerencia 34

    Procedimientos Gráficos y Tabulares

    Cualitativo Cuantitativo

    MétodosTabulares

    MétodosTabulares

    MétodosGráficos

    MétodosGráficos

    • Dist.Frec.• Dist.Frec.Relat.• Dist.Frec.Porc.• Tab.deConting.

    • Gráfico deBarras

    • Gráfico dePie

    • Dist. Frec.• Dist.Frec.Relat.• Dist.Frec.Acum.• Dist.Frec.Relat.A

    cumuladas• Diagrama de

    Hoja y Tallo• Tab.deConting.

    • Histograma• Ojiva• Diagrama de

    Dispersión

    Dato

    A áli i d D t l G i 35

  • 8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.

    35/39

    Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

    Análisis de Datos para la Gerencia 35

    Errores en Presentación de Datos

    1.  Uso de ‘Gráficosengañosos’.

    2. Bases Relativas deComparacióndiferentes.

    3. Comprimiendo el ejevertical.

    4. No punto CERO enel eje Vertical.

    A áli i d D t l G i 36

  • 8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.

    36/39

    Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

    Análisis de Datos para la Gerencia 36

    ‘Gráfico engañoso’

    Incorrecta Correcta

    1960: $1.00

    1970: $1.60

    1980: $3.10

    1990: $3.80 0

    2

    4

    1960 1970 1980 1990

    $

    Análisis de Datos para la Gerencia 37

  • 8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.

    37/39

    Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

    Análisis de Datos para la Gerencia 37

    Base Relativa Diferente

    CorrectaIncorrecta

    0

    100

    200

    300

    FR SO JR SR

    Freq.

    0%

    10%

    20%

    30%

    FR SO JR SR

    %

    Análisis de Datos para la Gerencia 38

  • 8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.

    38/39

    Notas de clase elaboradas por el Prof. Tomás Minauro L. Lima, esan, ® 2016.

    Análisis de Datos para la Gerencia 38

    Compresión de eje Vertical

    CorrectaIncorrecta

    0

    25

    50

    Q1 Q2 Q3 Q4

    $

    0

    100

    200

    Q1 Q2 Q3 Q4

    $

    Análisis de Datos para la Gerencia 39

  • 8/16/2019 Sesión01-Analisis de Datos Para La Gerencia.

    39/39

    Análisis de Datos para la Gerencia 39

    No Cero en Eje Vertical

    CorrectaIncorrecta

    0

    20

    40

    60

    J M M J S N

    $

    36

    39

    42

    45

    J M M J S N

    $