Trabajo de Investigacion de Bioestadistica(2)

download Trabajo de Investigacion de Bioestadistica(2)

of 12

Transcript of Trabajo de Investigacion de Bioestadistica(2)

  • 8/17/2019 Trabajo de Investigacion de Bioestadistica(2)

    1/12

      ANÁLISIS DESCRIPTIVO DE LOS DATOS TOMADOS EN EL PATIODE COMIDAS DEL TERMINAL TERRESTRE DE LA CIUDAD DE RIOBAMBA 

     

    INTRODUCCIÓN:

    INTRODUCCION:

    Después del análisis cuantitativo y cualitativo del patio de comida de la ciudad de

    Riobamba, en el presente proyecto procedimos a describirlos y analizarlos mediante las

     principales medidas de centralización y dispersión, tanto para datos agrupados como para

    datos no agrupados y para esto es necesario conocer cuáles son las medidas de

    centralización y dispersión y su utilización.

      Medidas de Centralización o de Tendencia Central

    Al desear describir grupos de observaciones, con frecuencia es conveniente resumir la

    información con un solo número. Este número que, para tal fin, suele situarse hacia el centrode la distribución de datos se denomina medida o parámetro de tendencia central o de

    centralización. Cuando se hace referencia únicamente a la posición de estos parámetros

    dentro de la distribución, independientemente de que ésta esté más o menos centrada, se

    habla de estas medidas como medidas de posición como los cuantiles.

    Existen tres medidas comunes para identificar el centro de un conjunto de datos: la media,mediana y moda. En cada caso, se ubican alrededor del punto en donde se aglomeran losdatos.

    Media: Medida de tendencia central usualmente llamada promedio, se define como ladivisión de la suma de todos los valores entre el número de datos.Esta medida también se llama media aritmética o media muestral.

    Mediana: La mediana representa el valor de la variable de posición central en un conjuntode datos ordenados.En un conjunto de datos ordenados de manera creciente es el valor para el cual, la mitad deéstos es menor que éste valor y la otra mitad mayor. De modo que el 50% de datos sonmayores y 50% son menores que la mediana

    Moda: Es el valor con una mayor frecuencia en una distribución de datos. Puede existir enuna muestra más de una moda. Por ejemplo, consideremos las siguientes observaciones se

    dice que la muestra es bimodal ya que encontremos dos modas, es decir que estos dos datosque tengan la misma frecuencia absoluta máxima.

    Si todas las variables tienen la misma frecuencia diremos que no hay moda.

    Media ponderada: es una media aritmética, en la cual se considera a cada uno de losvalores de acuerdo con su importancia en el grupo.

  • 8/17/2019 Trabajo de Investigacion de Bioestadistica(2)

    2/12

      RELACION DE MEDIA, MEDIANA Y MODA EN TÉRMINOS DE LAFORMA DE LA DISTRIBUCION. 

      Si la media y la mediana coinciden en valor la distribución es asimétrica.

      Si, además, los datos tienen una sola moda esto es, son unimodales, entonces lamoda, la mediana y la media coinciden.

     

    Si la moda < mediana < media con una larga entonces si la distribución está sesgadaa la derecha es decir es una Distribución Asimétrica negativa.

      Si la media< mediana < moda la distribución está sesgada hacia la izquierda es decires una distribución asimétrica positiva.

     Cuartiles: Los cuartiles son los valores de la variable que dividen los datos en cuatro partes,una vez ordenados de menor a mayor.Los cuartiles son:

    Primer cuartil el 25% de los datos son menores, segundo cuartil o cuartil intermedio, el50% de los datos son menores que él. Coincide con la mediana, D5 y P50 y tercer cuartil ocuartil superior, deja el 75% de los datos de debajo. Coincide con P75.

    Deciles: Los deciles son los nueve valores que dividen la serie de datos en diez partesiguales. Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de losdatos. D5 coincide con la mediana. 

    Percentiles: Los percentiles son los 99 valores que dividen la serie de datos en 100 partesiguales. Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de losdatos. 

    P50 coincide con la mediana

    Medidas de dispersión.

    Las medidas de dispersión nos informan sobre cuánto se alejan del centro los valores de ladistribución.

    Una de las medidas de dispersión más elemental es el rango de una muestra.

  • 8/17/2019 Trabajo de Investigacion de Bioestadistica(2)

    3/12

    El rango :Es la diferencia entre el valor máximo y el valor mínimo de las observaciones.

    Varianza: La varianza es el promedio del cuadrado de las distancias s respecto a la mediade una distribución estadística. 

    La desviación estándar de un conjunto de observaciones es la raíz cuadrada positiva de la

    varianza.Coeficiente de variación: CV es una medida de dispersión relativa expresada en porcentajede un conjunto de datos, que se obtiene dividiendo la desviación estándar entre la media.

      OBJETIVO:

    Objetivo General:  Analizar las principales medidas de centralización y dispersión para datos

    agrupados de valores anotados que fueron de interés del patio de comidas del

    terminal de Riobamba

    Objetivos Específicos:

     

    Calcular e interpretar las medidas de centralización y dispersión para los precios delmenú que se encuentran en el patio de comidas de la ciudad de Riobamba.

      Estudiar e interpretar las medidas de centralización y dispersión que se encuentran

    en los valores cuantitativos de las horas pico de clientes.

      Analizar e interpretar las medidas de centralización y dispersión en las edades tanto

    de dueños como personal de los locales del patio de comidas.

      Determinar e interpretar valores de las variables cualitativas que se puedan

    encontrar en lo que corresponde a la atención del cliente.

      Calcular e interpretar valores de las variables que se puedan determinar en el lugar

    de procedencia de las personas que atienden el patio de comidas del terminal.

      METODOLOGIA:

    Para llevar a cabo nuestro trabajo de investigación realizamos lo siguiente:

    1)  En vista de que este trabajo es la continuación del anterior, y ya que nuestras

    variables fueron bien seleccionadas se nos facilitara bastante.

    2)  Lo primero que hicimos fue realizar un análisis en conjunto de nuestro trabajo

    anterior y corregimos los mínimos errores que teníamos.

    3)  Igual en conjunto elaboramos la respectiva introducción y objetivos.

    4)  Luego seleccionamos las medidas de centralización y dispersión, para nuestras

    variables cualitativas.

    5)  De la misma forma seleccionas las medidas de centralización y dispersión para las

    variables cuantitativas.

    6)  Luego realizamos el análisis e interpretación de cada una de las medidas.

    7)  Por ultimo realizamos las conclusiones de nuestro trabajo.

  • 8/17/2019 Trabajo de Investigacion de Bioestadistica(2)

    4/12

     

    RESULTADOS Y DISCUSION:

    APLICACIÓN DE MEDIDAS DE CENTRALIZACIÓN Y DISPERSIÓN PARA ELANALISIS DE DATOS:

      PRECIOS DEL MENU

    LOCAL A LOCAL B LOCAL C LOCAL D LOCAL E

    Desayunos:  1.00 1.25 1.00 1.00 1.25

    Batidos, Jugos: 0.75 0.75 0.50 1.00 0.75

    Secos: 1.75 1.50 1.75 1.50 1.50

    Almuerzos:  3.00 3.00 3.00 2.50 2.50

    Encebollados:  2.00 1.75 2.50 2.00 2.50

    TABLA DE FRECUENCIAS:

    1.00 0.75 1.75 3.00 2.00 1.25 0.75 1.50 3.00 1.75 1.00 0.50 1.75 3.00 2.50 1.00 1.00 1.50

    2.50 2.00 1.25 0.75 1.50 2.50 2.50

    # de locales: 25

    n=√25 = 5  I= 3.00- 0.5/5 = 0.5

    PRECIOS DEL MENU F Fr

    0.50 - 1.0 8 0.32

    1.01- 

    1.51 5 0.2

    1.52- 2.02 5 0.2

    2.03- 2.53 4 0.16

    2.54- 3.05 3 0.12

    Los precios del menú del pato de comidas de mayor frecuencia se encuentran entre 50

    centavos y un dólar y en menor frecuencia entre 2.53 y 3.04.

  • 8/17/2019 Trabajo de Investigacion de Bioestadistica(2)

    5/12

    MEDIA:

    X= ∑F.XC/n

    X=8(0.75) + 5(1.26) + 5(1.77) + 4(2.28) + 3(2.78)/25

    X=1.5444

    MEDIANA

    Me= Li+ (n/2-Fa)xW/F 

    Me= 1.01+(12.5-8/5)0.6

    Me= 1.26

    MODA:

    Mo= Li+ (d1/d1+d2).w

    Mo= 0.5+ (8/8+3)x0.6

    Mo= 0.93

    VARIANZA Y DESVIACIÓN ESTÁNDAR

    S2= ∑F(XC-X)/n-1

    S2=8(0.75-1.544)2+ 5(1.26-1.544)2+5(1.77-1.544)2+ 4(2.28-1.544)2+ 3(2.78-1.544)2/24

    S2= 0.5188

    S= 0.7203 

    COEFICIENTE DE VARIACIÓN

    C.V= (S/X) x 100%

    C.V= (0.7203/1.5444) x 100%

    C.V= 46.63% 

    INTERPRETACIÓN

      El Promedio de los precios que se encuentran en el patio de comidas del terminal de

    Riobamba es de 1.54$, esto nos quiere decir que es un valor muy accesible para la

    gente que desea comer bien y no con mucho dinero, es por esto una de las razones

    que es muy frecuentado este lugar en la ciudad.

  • 8/17/2019 Trabajo de Investigacion de Bioestadistica(2)

    6/12

      Los valores de los precios son menores a 1.26 y los mayores a este valor.

      La dispersión es del 46.63% por lo que tiene una distribución algo uniforme y por lo

    tanto es considerablemente confiable, es decir que los valores en la distribución son

    en promedio casi homogéneos por lo cual nuestros datos nos pueden brindar mucha

    información en lo que quieren expresar nuestro análisis, los precios son muyaccesibles en cuanto a comida se refiere y casi no varian mucho por lo cual el patio

    de comidas es un lugar en el que se pueden comprar platos con valores aproximados

    al dólar y medio.

      HORA DE INGRESO DE CLIENTES:

    Para el análisis de la variable cuantitativa ´´hora de ingreso de clientes´´ vamos a basarnos

    en que el horario donde más se vende es de las 20:00 pm hasta 05:00am, y que el ingreso de

    los clientes varia cada hora, a lo largo de la noche y madrugada. De la siguiente manera:

    20:00; 21:00; 22:05; 23:05; 23:59; 00:55; 02:15; 03:29; 04:25; 20:45; 22:49; 02:15; 04:45;

    20:30; 00:20; 02:35; 03:10; 00:45; 22:05; 02:35; 23:25; 20:30; 04: 35; 03:40; 02:35; 01:15;

    00:14; 23:19; 22:18; 21:15; 20:10; 20:30; 21: 25; 22:29; 23:25; 00:20; 01:35; 02:52; 03:50;

    04:45; 21:50; 01:35; 03:10; 22:38; 01:15; 03:18; 20:45; 21:40; 22:38; 23:33; 00:32; 01:43;

    03:10; 04:05; 05:00; 22:05; 01:43; 03:40; 23:05; 01:35; 03:50; 04:15; 01:50; 23:25; 04:05;

    01:50; 22:29; 04:15; 03:18; 01:50; 00:45; 23:42; 22:49; 21:50; 20:55

    Ingreso de

    clientes(hora) F Fr F% Fa Xc Fra20:00 – 21:00 10 0.13 13 10 20.5 0.13

    21:01 – 22:00 4 0.05 5 14 21.5 0.18

    22:01 – 23:00 10 0.13 13 24 22.5 0.31

    23:01 – 00:00 9 0.12 12 33 23.5 0.43

    00:01 – 01:00 7 0.09 9 40 00.5 0.52

    01:01 – 02:00 10 0.13 13 50 01.5 0.65

    02:01 – 03:00 6 0.08 8 56 02.5 0.73

    03:01 – 04:00 10 0.13 13 60 03.5 0.86

    04:01 – 05:00 9 0.12 12 75 04.5 0.98

    75 0.98 98%

    MEDIA (X):

         

  • 8/17/2019 Trabajo de Investigacion de Bioestadistica(2)

    7/12

       1020.5 + 421.5 + 1022.5 + 923.5  + 7 0.5 +10 1.5 + 62.5 + 10 3.5 + 9 4.575  X= 11.15 = 23:15pm

    Con este resultado de la media podemos decir que la clase que la contiene se encuentra

    entre las 23:01 pm –  00:00am

    MEDIANA (Me):

    +  2      

    0.01 + 75 2   337   2 

    1.3 → 1:30  Según el resultado de la mediana podemos interpretar que el 50% de los clientes ingresaron

    en horas inferiores a la 1:30 am y el otro 50% ingresaron en horas superiores a 1:30 pm.

    CUARTIL 1

    1 +  4      

    1 22.01 +  18.75 4   1424   2 C1= 22:40pm

    Según el cuartil 1 el 25% de los clientes ingresan a horas inferiores a 22:40pm.

    RANGO

    >

  • 8/17/2019 Trabajo de Investigacion de Bioestadistica(2)

    8/12

     

    EDADES DE LOS EMPLEADOS Y DUEÑOS DE LOS LOCALES DECOMIDA.

    Para el análisis de la variable cuantitativa las “Edades de los empleados y dueños queforman de los puestos de comida del terminal terrestre de Riobamba” vamos a basarnos en

    las siguientes edades:

    Análisis de 35, 36, 42 39, 48, 52, 31, 37, 40, 41, 48, 46, 29, 33, 37, 45, 58, 60, 52, 54, 55,

    28, 29, 48, 42, 43, 50, 39, 45, 47, 46, 39, 34, 58, 54, 52, 51, 56, 57, 44, 33, 58, 29, 26, 45,

    27, 38, 49, 47, 35, 36, 41, 31, 38, 45, 52, 49, 44, 36, 37, 28, 40, 30.

    EdadesF Fr F% Fa Xc Fra

    26-30 8 0.127 12.7 8 28 0.127

    31-34 7 0.111 11.1 15 33 0.238

    36-40 13 0.206 20.6 28 38 0.44441-45 11 0.175 17.5 39 43 0.619

    46-50 10 0.159 15.9 49 48 0.778

    51-55 8 0.127 12.7 57 53 0.905

    56-60 6 0.095 9.50 63 58 1

    63 1.000 100

    En esta variable podemos observar que la edad de los dueños y empleados que forman

     parte del patio de comida del terminal terrestre de Riobamba se encuentra con mayorfrecuencia entre personas que están entre los 36 y 40 años mientras que con menor

    frecuencia se encuentran personas mayores que están entre los 56-60 años.

    Media

        ∗

    ̅  8 ∗ 28 + 7 ∗ 33 + 13 ∗ 38 + 11 ∗ 43 + 10 ∗ 48 + 8 ∗ 53 + 6 ∗ 58

    63 

    ̅ 42.44 Que las edades de los empleados y dueños que conforman los puestos de comida del

    terminal terrestre de Riobamba se encuentran en una edad media de 42.44 años

    mostrándonos que la mayoría de las personas son adultas.

  • 8/17/2019 Trabajo de Investigacion de Bioestadistica(2)

    9/12

    Mediana

    + ⁄   −   ∗   ≥   ≥   ≥ 31.5 

    + ⁄   −

      ∗  

    .  Que la mitad de las edades de los dueños y empleados que conforman los puestos de

    comida del terminal terrestre de Riobamba se encuentran en edades menores a 47.79 y la

    otra mitad en edades mayores a 47.79 años

    Moda

    + ( 

    + ) ∗  

    36 + (   66 + 2) ∗ 5  39.75 

    Encontramos con mayor frecuencia que los dueños y empleados están en edad de 39.75

    años es decir que en la muestra hay un mayor número de individuos con esta edad.

    Cuartil

    +       ∗  

    3 36 + 3 ∗ 6 3 10   1513   ∗ 5 

    3 37.5 

    El 75% de los dueños y empleados se encuentran en edades mayores a 37.5 años de edad.

    Es decir que una cuarta parte de los dueños y empleados tienen edad superior a los 37.5

    años y el resto una edad inferior.

    Desviación media

  • 8/17/2019 Trabajo de Investigacion de Bioestadistica(2)

    10/12

       |  |

      |.| + |.| + |.| + |.| + |.| + |.| + |.|  

      . Que las edades de los dueños y empleados que conforman los puestos de comida del

    terminal terrestre de Riobamba de de 42.44 años se desvía en un promedio de 7.61 años.

    Varianza y desviación estándar

      ∑   − −

    =    √ ∑   − −

    =  

       . +. + . + . + . +. + .  

      .   . Nos muestra que las edades de los dueños y empleados se encuentran dispersas en un 9.16

    es decir que las edades varían significativamente. En los dueños y empleados que

    conforman los puestos de comida del terminal terrestre de Riobamba.

    Coeficiente de variación

    .    ∗  

    .   9.1642.44   ∗ 100 

    . 21.58%

    Se puede decir que las edades de los empleados y dueños de los puestos de comida en el

    terminal terrestre de Riobamba son homogéneos, debido a que hay menor variabilidad en

    las edades.

  • 8/17/2019 Trabajo de Investigacion de Bioestadistica(2)

    11/12

    APLICACIÓN DE VARIABLES CUALITATIVAS PARA EL ANALISIS DEDATOS: 

     

    ATENCIÓN AL CLIENTE:

    Atención Frecuencia Frecuencia

    R.

    Excelente 10 0.4

    Bueno 7 0.28

    Regular 3 0.12

    Malo 5 0.2

    Moda

     

    La moda correspondiente a la calidad de servicio dada en el patio de comidas del

    terminal terrestre es excelente ya que en esta se obtuvo una mayor frecuencia con un

    dato igual a 10.

      LUGAR DE PROCEDENCIA DE LAS PERSONAS QUE TRABAJAN EN ELPATIO DE COMIDAS DEL TERMINAL TERRESTRE DE RIOBAMBA:

    Moda

    La moda en la variable lugar de procedencia de las personas que trabajan en el terminal

    terrestre del patio de comidas del Terminal terrestre de la ciudad, es Riobamba debido a

    que es el lugar que tiene la mayor frecuencia (33)

    CONCLUSIONES:

     

    Al calcular las medidas de centralización y dispersión de los precios del patio de comida se

    obtiene que 1.54 es el valor promedio de los precios, el 50% de los precios son menores a

    1.26 por lo tanto el restante 50% es mayor a este valor. La dispersión es del 46.63% por lo

    Cantones F Fr

    Riobamba33 0,52

    Colta 7 0,11

    Guano 11 0.17

    Chambo 9 0.14

    Esmeraldas 3 0,05

    63 0.99

  • 8/17/2019 Trabajo de Investigacion de Bioestadistica(2)

    12/12

    que tiene una distribución algo uniforme y por lo tanto es considerablemente confiable, por

    lo que los datos casi homogéneos.

      Al calcular las medidas de centralización y dispersión de los valores cuantitativos de las

    horas pico de los clientes se obtiene que el promedio de mayor visita de las personas al

     patio de comidas se da entre 23:01 pm –  00:00am; el 50% de los clientes ingresaron a

    horas mayores a la 1:30 am por lo tanto el 50% restante de clientes ingresaron ahoras menores de la indicada anteriormente, el 25% de los clientes ingresan a horas

    inferiores a 22:40pm. El valor que se obtuvo del rango es 1:50 am lo que indica que

    la dispersión es menor y los datos son confiables.

      Al calcular las medidas de centralización y dispersión de las edades de dueños de locales y

    de su respectivo personal se obtiene que el promedio de las edades es de 42.44 años; el

    50% de las personas que se encuentran trabajando en el patio de comidas se

    encuentran en edades menores a 47.79 por lo que el restante 50% tienen edades

    mayores a la ya dicha anteriormente; la edad más frecuente es 39.75. Se encontró

    que el 75% de los dueños y empleados se encuentran en edades mayores a 37.5 años

    de edad. La media se desvía en un promedio de 7.61 años; la varianza se obtiene un

    valor de edades de 9.16, es decir que las edades varían significativamente. El

    coeficiente de variación es igual a 21.58%, es decir que los datos son homogéneos.

      La moda correspondiente a la calidad de servicio dada en el patio de comidas del

    terminal terrestre es excelente ya que en esta se obtuvo una mayor frecuencia con un

    dato igual a 10.

      Al estudiar la moda correspondiente al lugar de procedencia de los trabajadores se

    obtuvo que la mayoría proviene de la ciudad de Riobamba ya que esta posee la

    mayor frecuencia con un dato igual a 33

    BIBLIOGRAFIA:

      Días, Yolanda. “Medidas de Centralización y de Dispersión”.  Bioestadística.Escuela Superior Politécnica de Chimborazo. 15 de Octubre 2013.

     

    Días, Yolanda. “Organización y Representación de datos ”. Bioestadística. EscuelaSuperior Politécnica de Chimborazo. 17 de septiembre de 2013

      David S. Moore, Estadística aplicada básica, 8va edición ,2008.

      ESTADISTICA

    www.vitutor.com/estadistica/descriptiva/a_1.htm 

     

    BIOESTADISTICA www.seh-lelha.org/stat1.htm 

    http://www.google.es/search?hl=es&tbo=p&tbm=bks&q=inauthor:%22David+S.+Moore%22http://www.vitutor.com/estadistica/descriptiva/a_1.htmhttp://www.vitutor.com/estadistica/descriptiva/a_1.htmhttp://www.vitutor.com/estadistica/descriptiva/a_1.htmhttp://www.google.es/search?hl=es&tbo=p&tbm=bks&q=inauthor:%22David+S.+Moore%22