SEPARATA 2016

33
 ESTADISTICA GENERAL 1 Lic. Estadístico Hugo Luis Chunga Gutierrez ESTADÍSTICA Elaborado por: Lic. Ing. Hugo L. Chunga Gutiérrez

Transcript of SEPARATA 2016

Page 1: SEPARATA 2016

8/15/2019 SEPARATA 2016

http://slidepdf.com/reader/full/separata-2016 1/32

  ESTADISTICA GENERAL 

1Lic. Estadístico Hugo Luis Chunga Gutierrez

ESTADÍSTICA

Elaborado por: Lic. Ing. Hugo L. Chunga Gutiérrez

Page 2: SEPARATA 2016

8/15/2019 SEPARATA 2016

http://slidepdf.com/reader/full/separata-2016 2/32

  ESTADISTICA GENERAL 

2Lic. Estadístico Hugo Luis Chunga Gutierrez

INTRODUCCIÓN

La palabra estadística a menudo nos trae a la mente imágenes de números apilados en grandes

arreglos y tablas, de volúmenes de cifras relativas a nacimientos, muertes, viajes, visitantes,

ingresos, ventas y así sucesivamente.

Algunas personas podrían pensar que la enseñanza de la estadística sólo interesa a los profesores,

o bien a los investigadores que trabajan en los diferentes departamentos de una universidad. Esta

es una creencia errónea y podemos encontrar Estadísticos en psicología, economía, medicina,

ingeniería y otras áreas.

¿Qué es la estadística?

Estadística es un conjunto de métodos científicos para la recopilación, representación

condensación y análisis de los datos extraídos de un sistema en estudio. Con el objeto de poder

hacer estimaciones y sacar conclusiones, necesarias para tomar decisiones.

La Estadística es un método de razonamiento para describir e interpretar información, cuya

característica principal es la variabilidad de los datos.

DIVISIÓN DE LA ESTADÍSTICA

La Estadística para su mejor estudio se ha dividido en dos grandes ramas: la Estadística

Descriptiva y la Inferencial.

Estadística Descripti va:  Se denomina estadística descriptiva, al conjunto de métodos estadísticos

que se relacionan con el resumen y descripción de los datos, como tablas, gráficas, y el análisis

mediante algunos cálculos.

Estadística Inf erencial   Se denomina inferencia estadística al conjunto de métodos con los que se

hacen la generalización o la inferencia sobre una población utilizando una muestra. La inferencia

 puede contener conclusiones que pueden no ser ciertas en forma absoluta, por lo que es necesario

que éstas sean dadas con una medida de confiabilidad que es la probabilidad.

 La Estadística Inferencial investiga o analiza una población partiendo de una muestra tomada.

Estas dos partes de la estadística no son mutuamente excluyentes, ya que para utilizar los métodosde la inferencia estadística, se requiere conocer los métodos de la estadística descriptiva.

Page 3: SEPARATA 2016

8/15/2019 SEPARATA 2016

http://slidepdf.com/reader/full/separata-2016 3/32

  ESTADISTICA GENERAL 

3Lic. Estadístico Hugo Luis Chunga Gutierrez

TÉRMINOS DE ESTADÍSTICA

Los términos estadísticos que se usan en estadística es necesario conocerlos para poder entender el

lenguaje estadístico que se utiliza en el desarrollo de la asignatura:

Población: En forma general, en estadística; se denomina población, a un conjunto de elementos

(que consiste de personas, objetos, etc.), que contienen una o más características observables de

naturaleza cualitativa o cuantitativa que se pueden medir en ellos.

La población debe estar perfectamente definida en el tiempo y en el espacio.

Muestra:  Es un subconjunto de una población. Una muestra es representativa cuando los

elementos son seleccionados de tal forma que pongan de manifiesto las características de una

 población. Su característica más importante es la representatividad.

.

Unidad estadística o Unidad de análisis o unidad elemental: Es elemento de la población que

reporta la información y sobre el cual se realiza un determinado analisis.

La unidad de estudio es la entidad que va a ser objeto de medición y se refiere al qué o quién es

sujeto de interés en una investigación.

Parámetro: son aquellos valores que caracterizan numéricamente a la población como tal. El

 parámetro poblacional de interés es único (media, varianza, etc.), pero una población puede tener

muchas características de interés.

Indicador estadístico: Es el dato numérico, resultado de un proceso que cuantifica

científicamente una característica de una muestra. “Es el elemento característico que describe una

situación permitiendo su análisis” 

Diferencia entre dato e información

El dato es un elemento aislado, recabado para un cierto fin, pero que no ha pasado por un proceso

que lo interrelacione con otros; mientras que la información trata de datos procesados y

relacionados de manera que nos pueden dar pauta a la correcta toma de decisiones

Por lo tanto la diferencia radica en que la información se compone de datos que ya han sido

 procesados de algún modo para que tengan un sentido y un objetivo al momento de tomardecisiones.

Page 4: SEPARATA 2016

8/15/2019 SEPARATA 2016

http://slidepdf.com/reader/full/separata-2016 4/32

  ESTADISTICA GENERAL 

4Lic. Estadístico Hugo Luis Chunga Gutierrez

La medición: Los datos se obtienen a través un proceso llamado medición. Desde este punto de

vista, puede definirse medición como el proceso por el cual asignamos una categoría (o un valor) a

una variable, para determinada unidad de análisis.

Variable: Es una característica que puede tomar diferentes valores. Las variables son

características observables, susceptibles de adoptar distintos valores o ser expresados en varias

categorías.

Podemos iniciar el tema indicando que definir las variables “me permi tirá dar respuesta a lo

que quiero estudiar”.

Datos:  Comúnmente se le conoce como observaciones . Son los valores que toma la variable

en cada unidad estadística.

Son todas aquellas características o valores susceptibles de ser observados, clasificados y

contados.

La forma de medir las variables va a determinar el análisis matemático, estadístico, de las mismas.

Elementos de una variable:La identificación y definición de variables es la tarea más delicada de toda investigación y del

trabajo estadístico. Téngase presente que las variables se deducen a partir de los objetivos de

un estudio o investigación. En consecuencia, para tener éxito en la selección de variables, es

recomendable distinguir los siguientes elementos:

a)   Nombre o denominación de la variable.

 b)  Definición o conceptualizacion de la variable.

c) 

Un conjunto de categorías o niveles, que es definida por el investigador. Las categoríasno son únicas, lo mínimo es dos categorías y dependen de los objetivos de la

investigación.

Ejemplo:

Veamos la variable Cualitativa Estado Civil:

a)   Nombre: Estado Civil o conyugal

 b)  Definición: Es la situación de la persona empadronada en relación con las leyes y

costumbres del país.

c)  Categorías:

Page 5: SEPARATA 2016

8/15/2019 SEPARATA 2016

http://slidepdf.com/reader/full/separata-2016 5/32

  ESTADISTICA GENERAL 

5Lic. Estadístico Hugo Luis Chunga Gutierrez

1) Soltero 2) Casado 3) Conviviente 4) Divorciado 5) Viudo

Veamos la variable cuantitativa, Ingreso:

a)   Nombre: Ingresos

 b)  Definición: Son los recursos monetarios netos, incluyendo todas las bonificaciones que

 percibe una persona por su ocupación principal y secundaria durante el periodo de

referencia de la encuesta.

c)  Categorías: Puede proponerse en forma de niveles o simplemente intervalos.

Primera forma: Segunda forma:(01)  Alto(02)  Medio(03)  Bajo

(01) Menos de 300(02) De 301 a 500(03) De 501 a 700

(04) 

De 701 a mas

CLASIFICACIÓN DE LAS VARIABLES

Según su naturaleza:

 

VARIABLES CUALITATIVAS:

Miden una característica, en término de cualidad, nunca de forma numérica.

Cada uno de los valores que puede tomar la variable se llama categorías. Deben incluir todas

las opciones posibles que puede adoptar la variable.

Nominal:  Son aquellos variables que establecen la distinción de los elementos en diversas

categorías, sin implicar algún orden entre ellas, distribuye a la unidad de análisis en dos o mas

categorías. Ejemplo: Sexo, Estado Civil, profesiones, etc.

Ordinal: Son aquellas variables que implican orden entre sus categorías, pero no grados de

distancias iguales entre ellas; están referidas a un orden o jerarquía, donde las categorías

expresan una posición de orden.

Ejemplo: Grado de instrucción, clases sociales, orden de merito, ciclo de estudios, escala de

dolor: Sin dolor, con poco dolor, con mucho dolor.

Page 6: SEPARATA 2016

8/15/2019 SEPARATA 2016

http://slidepdf.com/reader/full/separata-2016 6/32

  ESTADISTICA GENERAL 

6Lic. Estadístico Hugo Luis Chunga Gutierrez

Si las variables cualitativas tienen solo dos categorías se llama variable cualitativa

dicotómica (Ejemplo: Sexo: Hombre. Mujer), y si tiene más de dos, variable cualitativa

 politómica (color de cabello: negro, rubio, castaño, pelirrojo)

  VARIABLES CUANTITATIVAS:

Miden una característica de forma numérica. Pueden ser:

Variables Discretas: Cuando el valor de la variable resulta de la operación de contar, su valor

representado solo por números naturales (enteros positivos) o entre dos valores consecutivos

no existe otro valor.

Ejemplo; Número de hijos de las pacientes con cáncer de mama, Número de pacientes

atendidos hospitales.

Variables Continuas: Cuando la variable es susceptible de medirse, es toda variable cuyo

valor se obtiene por medición o comparación con una unidad o patrón de medida. Las

variables pueden tener cualquier valor dentro de su rango o recorrido, por tanto se expresa por

cualquier número real. Entre dos valores consecutivos se pueden encontrar infinitos valores.

Ejemplo: Peso de los pacientes con tuberculosis, El grado de glucosa en la personas con

diabetes, la talla de los recién nacidos, etc.

Page 7: SEPARATA 2016

8/15/2019 SEPARATA 2016

http://slidepdf.com/reader/full/separata-2016 7/32

  ESTADISTICA GENERAL 

7Lic. Estadístico Hugo Luis Chunga Gutierrez

Según escala de medición:

  De escala nominal: Idem

  De escala ordinal: Idem

  De escala Intervalo: Mediante esta escala, además de existir una relación de orden como la

anterior, implica una relación de igualdad de diferencias entre pares de objetos respecto a una

característica determinada. Además las diferencias entre los números se corresponden

 puntualmente con las diferencias entre los objetos en la propiedad del objeto de medición. Pero

el valor cero es arbitrario y convencional. Ejemplos: Temperatura, inteligencia, rendimiento

académico y personalidad.

  De escala Razón o Proporción:  Mediante esta escala además de existir una relación de

igualdad de diferencias como la anterior, considera un punto de origen fijo o natural, el cero

absoluto. El valor cero significa la nulidad o ausencia de la característica o variable que se

estudia; y la proporción tiene sentido, ejemplos: Peso, estatura y edad de los alumnos.

 Número de alumnos, de computadoras, y de fotocopiadoras que posee un colegio.

 

Page 8: SEPARATA 2016

8/15/2019 SEPARATA 2016

http://slidepdf.com/reader/full/separata-2016 8/32

  ESTADISTICA GENERAL 

8Lic. Estadístico Hugo Luis Chunga Gutierrez

Page 9: SEPARATA 2016

8/15/2019 SEPARATA 2016

http://slidepdf.com/reader/full/separata-2016 9/32

  ESTADISTICA GENERAL 

9Lic. Estadístico Hugo Luis Chunga Gutierrez

EJERCICIOS 01

De los enunciados siguientes Identificar la población, muestra, unidad de análisis y la

variable (tipo de variable y sus elementos)

1)  Se desea saber el estado civil, grado de hemoglobina y el tiempo de gestación de las mujeres

que se atendieron en ESALUD de la ciudad de Piura en los seis primeros últimos del año

anterior.

2) 

En la a UNP se quiere saber cuál es el deporte más practicado, el tiempo de dedicación a estey que días lo practica, de los alumnos la cual se tomo información de 200 alumnos elegidos al

azar de las diferentes escuelas de esta universidad en el presente ciclo de estudios.

3)  Se desea saber cuál es la estatura, el peso y la edad de los niños menores de 5 años con

enfermedades respiratorias atendidos en los hospitales de la ciudad de Piura, la cual para

obtener esta información para la estimación se eligió solo a tres hospitales de esa ciudad y a

50 niños por cada hospital del presente mes.

4)  Una Institución publica recién creada empleara a 345 personas de las cuales ya están

seleccionadas, y a través de los registros de vida obtenemos de que universidad proceden, que

 profesión tienen, que cargo ocuparan, estado civil, y el numero de hijos, esta institución recién

creada en la cuidad de tumbes.

Page 10: SEPARATA 2016

8/15/2019 SEPARATA 2016

http://slidepdf.com/reader/full/separata-2016 10/32

  ESTADISTICA GENERAL 

10Lic. Estadístico Hugo Luis Chunga Gutierrez

DISTRIBUCION DE FRECUENCIAS

¿Qué es una distribución de frecuencias?

Distribución de frecuencias es una forma de organizar y resumir los datos con la finalidad dedescribir del comportamiento de las variables de interés. Esta organización, en su forma tabular,

consiste en presentar la lista de valores de una variable, clases o categorías de datos junto con el

número de veces que se repite cada valor de la variable o el número de valores que caen dentro de

cada clase o categoría respectivamente.

El número de veces que se repite cada valor de la variable o el número de valores que caen dentro

de cada clase o categoría se denominan frecuencias.

CUADROS O TABLAS ESTADÍSTICAS

Un cuadro estadístico es el arreglo ordenado, columnas y filas, de datos estadísticos o

características relacionadas, con el objeto de ofrecer información estadística de fácil lectura,

comparación e interpretación. Un cuadro estadísticos es le resultado de trabajos previos

(planeamiento, recopilación, tabulación, cálculos, etc.)

Partes pri ncipales:

1)  Número del Cuadro  

2)   Titulo , es la descripción resumida del contenido del cuadro.

Responder a las clásicas preguntas: Que, Donde, Como y Cuando

3)  Encabezamiento o conceptos  

4)  

Cuerpo  

5)  Columna Matriz  

6)   Fuente  

7)  Elaboración  

.

Page 11: SEPARATA 2016

8/15/2019 SEPARATA 2016

http://slidepdf.com/reader/full/separata-2016 11/32

  ESTADISTICA GENERAL 

11Lic. Estadístico Hugo Luis Chunga Gutierrez

GRÁFICOS ESTADÍSTICOS

En estadística denominamos gráficos a aquellas imágenes que, combinando la utilización De

sombreado, colores, puntos, líneas, símbolos, números, texto y un sistema de referencia

(coordenadas), permiten presentar información cualitativa y cuantitativa.

La utilidad De los gráficos es doble, ya que pueden servir no sólo como sustituto a las tablas, sino

que también constituyen por sí mismos una poderosa herramienta para el análisis De los datos,

siendo en ocasiones el medio más efectivo no sólo para describir y resumir la información, sino

también para analizarla.

Gráficos estadísticos

IMPORTANCIA:

  Son esenciales en el estudio y presentación de trabajos estadísticos.

  Permite observar en forma instantánea el comportamiento de la variable.

  Permite formar una idea sobre la tendencia de las variables en el futuro.

PRINCIPALES PARTES DE UN GRAFICO

1)  Numero del Grafico

2)  Titulo: 

3)  Los Diagramas:

4)  Escalas:

5)  Leyenda:

6)  Fuente:

Page 12: SEPARATA 2016

8/15/2019 SEPARATA 2016

http://slidepdf.com/reader/full/separata-2016 12/32

  ESTADISTICA GENERAL 

12Lic. Estadístico Hugo Luis Chunga Gutierrez

CUADROS ESTADÍSTICOS PARA VARIABLES CUALITATIVAS

En una muestra se recolecto datos sobre el estado civil de 30 personas que laboran en la empresa

EXPORT S.A de la cuidad de Talara.

co ca se co caca co ca ca se

se co se co co

co se co ca co

so co ca ca co

co co co co ca

Ejercicios1.  Se escogió un salón de clases de cuarto grado, con un total de 25 estudiantes, y se les pidió que

calificaran del 1 al 5 un programa televisivo.

(5 = Excelente 4 = Bueno 3 = Regular 2= No muy bueno 1 = Malo)

Estos fueron los resultados:

1 3 3 4 1 2 2 2 5 1 2 1 2 4 5 1 5 3 5 1 4 1 2 3 5

2. 

En el último del mes del año pasado se realizo en Chile la Reunión del Grupo Andino donde se

tomo datos de los participantes acerca de su nacionalidad.

C B P E P P C V P V

P V C B P P C E P B

Donde: P = Perú B = Bolivianos C = Colombianos E = Ecuatoriano V = Venezolano

3.  En una encuesta de opinión acerca de las preferencias de una marca de bebida gaseosa por sus

colores: Negro(N), Blanco(B), Rojo(R), 20 consumidores dieron las siguientes respuestas:

B, N, N, B, R, N, N, B, B, N, B, N, N, R, B, N, B, R, B, N.

4.  Al investigar el nivel socioeconómico en los valores: Bajo(B), medio (M), alto(A), 20 familias

dieron las siguientes respuestas:

M, B, B, M, A, B, B, M, M, B, M, B, B, A, M, B, M, A, M, B.

Donde:ca: casadaco: convivientese: separadaso: soltera

Page 13: SEPARATA 2016

8/15/2019 SEPARATA 2016

http://slidepdf.com/reader/full/separata-2016 13/32

  ESTADISTICA GENERAL 

13Lic. Estadístico Hugo Luis Chunga Gutierrez

5.  Una empresa encuestadora de mercados pregunta a un conjunto de personas acerca de la

 preferencia de un cierto candidato para las próximas elecciones. Los candidatos son A, B, C, D,

E, la pregunta fue: ¿Si las elecciones fueran mañana por quien votaria usted?. Los resultados

fueron:

E D A E A B A B A D A B A C A C A B A C A C A B A B A

B A B A B A B A C A C A D A B E B A A B D A E

6.  Se identifico una muestra de autos robados en la ciudad de Piura y se registro la marca de cada

auto. A continuación se presenta los datos que se obtuvo: (T = Toyota; D = Daewoo; N =

 Nissan; W = Volkswagen; H = Hyundai)

T D T H T W D T W T

D W H N H H T H N NT D T D T H N W H T N T T D H T W N T DD N T T N T T D T D

7.  Los siguientes datos corresponden a una muestra de 19 reclusos de un Centro penitenciario,

según el tipo de delito.

V R D D R R D D R V D D R R V R D D V

Donde:V : violación, R : robo agravado, D = Tráfico ilícito de drogas

8.  Los siguientes datos provienen del resultado de entrevistar a 30 personas sobre la marca de

gaseosa que más consume a la semana:

Marca 1 Marca 2 Marca 1 Marca 1 Marca 1 Marca 3 Marca 1 Marca 3 Marca 1 Marca 2Marca 1 Marca 1 Marca 2 Marca 1 Marca 3 Marca 3 Marca 2 Marca 1 Marca 1 Marca 1Marca 1 Marca 3 Marca 1 Marca 2 Marca 3 Marca 1 Marca 3 Marca 3 Marca 2 Marca 3

Page 14: SEPARATA 2016

8/15/2019 SEPARATA 2016

http://slidepdf.com/reader/full/separata-2016 14/32

  ESTADISTICA GENERAL 

14Lic. Estadístico Hugo Luis Chunga Gutierrez

GRÁFICOS PARA VARIABLES CUALITATIVAS

Los gráficos más usuales para representar variables cualitativas son los siguientes:

 

DIAGRAMA DE BARRAS VERTICAL: Es una forma grafica de representar datos

cualitativos que se han resumido en una distribución de frecuencias de frecuencias relativas o

 porcentuales. 

      C       A      N       T      I      D      A      D

0

15

30

45

60

75

      P    r

      i    m    a     r

      i    a 

      A    n    a 

      l      f    a       b 

    e       t     o 

      S     e     c     u     n

      d     a     r

      i    a 

      S     u     p      e     r

      i    o     r

GRADO DE INSTRUCCIÓN  

  GRÁFICOS SECTORIALES, CIRCULAR O DE PASTEL: Se usa para representar y

comparar la dimensión de las partes de un fenómeno con el fenómeno total. Para su

elaboración se utiliza la circunferencia, siendo necesario que los valores absolutos y/o

 porcentuales, sean traducidos en GRADOS.  Xiº= (360º Fiabs) / N o 

Xiº= (360º %) / 100

Otros tipos de gráficos estadísticos para datos cualitativos:

  GRÁFICO DE BARRAS COMPUESTAS: Para su elaboración se debe contar con una tabla

o cuadro de entrada doble.

MASCULINO

0

10

20

30

40

     P   r

     i   m   a    r

     i   a 

     A   n   a 

     l     f   a      b    e     t    o 

     S    e    c    u    n

     d    a    r     i   a 

     S    u    p     e    r

     i   o    r

GRADO DE INSTRUCCIÓN

FEMENINO

     C      A     N      T     I     D     A     D

 

Page 15: SEPARATA 2016

8/15/2019 SEPARATA 2016

http://slidepdf.com/reader/full/separata-2016 15/32

  ESTADISTICA GENERAL 

15Lic. Estadístico Hugo Luis Chunga Gutierrez

PACIENTES ATENDIDOS POR TUBERCULOSIS PULMONAR POR GRADO DE INSTRUCCIÓN

SEGÚN SEXO

LIMA: ABRIL DEL 2005

GRADO DEINSTRUCCIÓN

SEXO TOTAL

MASCULINO FEMENINO

AnalfabetoPrimariaSecundariaSuperior

13350902

15280701

28631603

TOTAL 59 51 110FUENTE: Hospital Loayza, Oficina de Estadística

Investigador piensa que existen variaciones en los abortos en función de la condición

socioeconómica de las familias. Para ello selecciona a seis mujeres de 50 años pertenecientes a tres

niveles de condición socioeconómica. El número total de hijos nacidos por mujer se refleja en la

siguiente tabla.

 Nivel SocioeconómicoAlto Medio Bajo

2 3 11 1 13 3 22 4 41 3 11 1 1

Page 16: SEPARATA 2016

8/15/2019 SEPARATA 2016

http://slidepdf.com/reader/full/separata-2016 16/32

  ESTADISTICA GENERAL 

16Lic. Estadístico Hugo Luis Chunga Gutierrez

Sexo Edad Iglesia Grado de estudios Deporte Fuma Grado satisfacción Calificación

Masculino De 31 a 40 Evangélica Maestría Si No Muy Insatisfecho Bueno

Femenino De 21 a 30 Otras Titulado universitario Si No Ni satisfecho ni insatisfecho Regular

Masculino De 21 a 30 Catolica Titulado universitario Si No Insatisfecho Regular

Femenino De 31 a 40 Otras Titulado universitario Si No Insatisfecho Bueno

Masculino De 31 a 40 Otras Titulado universitario Si Si Insatisfecho Regular

Femenino De 31 a 40 Catolica Tecnica No No Satisfecho Bueno

Masculino De 21 a 30 Otras Tecnica Si Si Satisfecho Regular

Masculino De 31 a 40 Catolica Tecnica Si No Insatisfecho Regular

Masculino De 11 a 20 Evangelica Titulado universitario No No Insatisfecho Regular

Masculino De 21 a 30 Otras Tecnica No No Satisfecho Bueno

Masculino De 11 a 20 Otras Titulado universitario No No Satisfecho Regular

Femenino De 21 a 30 Catolica Titulado universitario No No Insatisfecho BuenoMasculino De 11 a 20 Catolica Titulado universitario Si Si Satisfecho Excelente

Femenino De 11 a 20 Otras Titulado universitario Si Si Insatisfecho Regular

Masculino De 21 a 30 Evangelica Doctorado/PhD No No Ni satisfecho ni insatisfecho Bueno

Masculino De 21 a 30 Evangelica Tecnica Si Si Satisfecho Bueno

Femenino De 11 a 20 Otras Maestria Si Si Insatisfecho Regular

Femenino De 21 a 30 Evangelica Titulado universitario No No Satisfecho Regular

Masculino De 21 a 30 Otras Tecnica Si Si Satisfecho Regular

Masculino De 31 a 40 Catolica Tecnica Si Si Satisfecho Bueno

Masculino De 11 a 20 Catolica Titulado universitario No No Satisfecho Regular

Masculino De 21 a 30 Evangelica Maestria No No Satisfecho Bueno

Masculino De 31 a 40 Otras Tecnica Si No Satisfecho Regular

Femenino De 21 a 30 Evangelica Maestria No No Ni satisfecho ni insatisfecho Bueno

Masculino De 11 a 20 Evangelica Maestria No No Satisfecho Regular

Masculino De 21 a 30 Otras Titulado universitario Si No Satisfecho Regular

Femenino De 31 a 40 Evangelica Tecnica No No Satisfecho Regular

Femenino De 21 a 30 Catolica Tecnica No No Satisfecho Bueno

Masculino De 21 a 30 Catolica Tecnica Si No Satisfecho Regular

Masculino De 31 a 40 Catolica Doctorado/PhD Si No Satisfecho Regular

Page 17: SEPARATA 2016

8/15/2019 SEPARATA 2016

http://slidepdf.com/reader/full/separata-2016 17/32

  ESTADISTICA GENERAL 

17Lic. Estadístico Hugo Luis Chunga Gutierrez

CUADROS ESTADÍSTICOS PARA VARIABLES CUANTITATIVAS

PARA DATOS AGRUPADOS SIN INTERVALOS.

1.- Se tomo a 20 empresas de transportes de la Ciudad del norte del país la cual se tiene datos de

la cantidad de quejas por parte de los turistas que visitaron los diferentes puntos turísticos del

norte del país:

6 5 4 4 3 3 4 4 5 55 6 2 4 3 4 6 5 3 2

2.- Ante la pregunta del número de hijos por familia (variable X) una muestra de 20 hogares,

marcó las siguientes respuestas:

2, 1, 2, 4, 1, 3, 2, 3, 2, 0,3, 2, 1, 3, 2, 3, 3, 1, 2, 4.

3.- En una clase de 25 alumnos hemos preguntado la edad de cada uno, obteniendo estos

resultados:

14, 14, 15, 13, 15, 14, 14, 14, 14, 15, 13, 14,13, 14, 14, 14, 15, 14, 16, 14, 15, 15, 13, 14, 15

4.- El siguiente ejemplo que contiene las calificaciones obtenidas en una prueba de matemáticas:

78 93 61 100 70 83 88 74 97 72 66 73 76 81 83 64 91 70 77 86 

5.- Los siguientes datos es acerca las tallas expresadas en cm de la mujeres en gestación de la

 posta medica San Juan:

114 125 114 124 142 152 133 113 172 127 135 161 122 127 134 147

6.- Tenemos un conjunto de 20 calificaciones del curso de estadística:82 74 88 66 58 74 78 84 96 76 62 68 72 92 86 76 52 76 82 78

7.- Un estudio en una muestra de clientes de una empresa del número de llamadas recibidas reveló

la siguiente información:

52, 43, 30, 38, 30, 42, 12, 46, 39, 37, 34, 46, 32, 18, 41, 55

Page 18: SEPARATA 2016

8/15/2019 SEPARATA 2016

http://slidepdf.com/reader/full/separata-2016 18/32

Page 19: SEPARATA 2016

8/15/2019 SEPARATA 2016

http://slidepdf.com/reader/full/separata-2016 19/32

  ESTADISTICA GENERAL 

19Lic. Estadístico Hugo Luis Chunga Gutierrez

GRÁFICOS PARA VARIABLES CUANTITATIVAS

  HISTOGRAMA:

Es una grafica que se utiliza para representar la distribución de frecuencias absolutas o

relativas simples.

Consiste en un grupo de rectángulos adyacentes que tienen sus bases en el eje de las abscisas

(donde se representa los intervalos de clase de la variable) y altura igual a las frecuencias de

cada clase.

  POLÍGONO DE FRECUENCIA:

También es un grafico que se utiliza para representar la distribución de frecuencias absolutas

o relativas simples.Consiste en un grafico lineal que se obtiene uniendo los puntos hallados, mediante el par de

valores de marca y frecuencia correspondientes. Para fines de gráfico, se hace necesario

incrementar un intervalo de clase en cada extremo, con frecuencias cero.

         C          A        N         T        I        D

         A        D

0

5

10

15

20

25

7

30

35

EDAD (años)

12 17 22 27 32 37

 

Page 20: SEPARATA 2016

8/15/2019 SEPARATA 2016

http://slidepdf.com/reader/full/separata-2016 20/32

  ESTADISTICA GENERAL 

20Lic. Estadístico Hugo Luis Chunga Gutierrez

MEDIDAS DE RESUMEN Y MEDIDAS DE DISPERSION

MEDIDAS DE RESUMEN:En las tres semanas anteriores están referidos, con cierto detalle, a la clasificación de variables,

recolección de datos, construcción de tablas de frecuencia y a la representación grafica, como fase

 preliminar en la descripción y análisis estadístico. El objetivo principal de estas primeros temas,

ha sido determinar la naturaleza y formas de la distribución de frecuencias, como base para la

“reducción de datos” a través de ciertas características descriptivas y medidas de resumen.

En el problema de comparar dos o mas distribuciones de frecuencias, puede resultar fácil hacer

una comparación grafica de las frecuencias, sin embargo, existen dificultades para hacer

comparaciones cuantitativas. Estadísticamente para facilitar este análisis comparativo es necesario

disponer de algunos indicadores o medidas de resumen.

Para ello estudiaremos las medidas de posiciones centrales y no centrales.

MEDIDAS DE DISPERSIÓN:

Las medidas de dispersión o variabilidad son números que miden el grado de separación de los

datos con respecto a un valor central, que generalmente es la media aritmética. Las principales

medidas de dispersión son:

El rango, el rango intercuartil, la varianza, la desviación estándar, y el coeficiente de variación.

Page 21: SEPARATA 2016

8/15/2019 SEPARATA 2016

http://slidepdf.com/reader/full/separata-2016 21/32

  ESTADISTICA GENERAL 

21Lic. Estadístico Hugo Luis Chunga Gutierrez

MEDIDAS DE POSICIONES CENTRALES PARA DATOS NO

AGRUPADOS

Son valores que reflejan el centramiento o punto central de la variable estudiada. Son tres: la

media, la mediana y la moda.

MEDIA ARITMÉTICA (  x ) 

La media aritmética de un conjunto de valores de una variable es el promedio de todas las

observaciones. Esto es, se suman todos los valores de la variable y se divide por el número de

valores. Esta medida se obtiene mediante la siguiente expresión:

n

 x

 x

n

i

i

  1  n

 x x x x

n

 x X 

  ni  

    ...........321

 

LA MEDIANA (    Me)

La mediana de un conjunto de valores ordenados de una variable, es el valor central.

Si el conjunto de datos tiene un número impar de valores entonces la mediana es el valor de la

variable que esta localizado en la parte central y si es par el número de valores, entonces lamediana es el promedio simple de los dos valores de la variable que están localizados en la parte

central.

  Cuando se tiene un numero impar

  Cuando se tiene un numero par

LA MODA O EL VALOR MODAL (MO):

Es el valor de la variable que más veces se repite, es decir, aquella cuya frecuencia absoluta es

mayor. No tiene porque ser única.

Ejemplo:

  El conjunto: 2 2 5 7 9 9 9 10 10 11 13 tiene la moda Mo = 9

  El conjunto: 3 5 8 10 12 16 18 no tiene moda.

 

El conjunto: 2 3 4 4 4 5 5 7 7 7 9 tiene dos modas 4 y 7; es una distribución“bimodal”. 

1

2

n Me x  

12 2

2

n n x x  

Me 

Page 22: SEPARATA 2016

8/15/2019 SEPARATA 2016

http://slidepdf.com/reader/full/separata-2016 22/32

  ESTADISTICA GENERAL 

22Lic. Estadístico Hugo Luis Chunga Gutierrez

EJERCICIOS

1.- Consideremos el peso en kilogramos de una muestra de 13 alumnos deportista de esta

universidad:

65 76 48 48 68 78 90 87 67 72 78 77 84

2.- Supongamos que tenemos datos sobre las edades de 10 alumnos de esta universidad:

18 22 20 19 18 17 21 20 18 23

3.- Tenemos los calificativos de 11 alumnos en el curso de estadística:

09 10 08 17 14 08 11 14 12 14 14

4.- Los siguientes datos es acerca las tallas expresadas en cm de la mujeres en gestación de la

 posta medica San Juan:

114 125 114 124 142 152 133 113 172 127 135 161 122 127 134 147

5.- Un estudio en una muestra de clientes de una empresa del número de llamadas recibidas reveló

la siguiente información:

52, 43, 30, 38, 30, 42, 12, 46, 39, 37, 34, 46, 32, 18, 41, 55

Page 23: SEPARATA 2016

8/15/2019 SEPARATA 2016

http://slidepdf.com/reader/full/separata-2016 23/32

  ESTADISTICA GENERAL 

23Lic. Estadístico Hugo Luis Chunga Gutierrez

MEDIDAS DE POSICIONES NO CENTRALES PARA DATOS NO

AGRUPADOS

LOS CUARTILES (Qk ):

Los cua rt iles son los tres valores de la variable que dividen a un conjunt o de datos

ordenados en cuatro parte s iguales.

Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos.

LOS DECILES (Dk ):

Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales.

Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos.

LOS PERCENTILES (Pk ):

Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales.

Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos.

 

L= valor del centil (medida de la posición)K= porcentaje equivalente a la medida de posiciónn= tamaño de muestra

Si L resulta un número decimal se aproxima a entero y ese es el valor de la posición del porcentaje equivalente que estamos calculando.Ahora si resulta un número entero se toma esta posición junto con la siguiente para que se sumany se dividan entre dos.

Page 24: SEPARATA 2016

8/15/2019 SEPARATA 2016

http://slidepdf.com/reader/full/separata-2016 24/32

  ESTADISTICA GENERAL 

24Lic. Estadístico Hugo Luis Chunga Gutierrez

MEDIDAS DE DISPERSION PARA DATOS NO AGRUPADOS

Varianza: es el promedio del cuadrado de las distancias entre cada observación y la media

aritmética del conjunto de observaciones.

Desviación típica o Desviación estándar: La varianza viene dada por las mismas unidades que la

variable pero al cuadrado, para evitar este problema podemos usar como medida de dispersión la

desviación típica que se define como la raíz cuadrada positiva de la varianza.

Es la medida que mide cuánto se separan los datos.

Es una medida de dispersión, que nos indica cuánto pueden alejarse los valores respecto al

 promedio (media), La desviación sólo significa qué tan lejos de lo normal

Coeficiente de variación de Pearson: Cuando se quiere comparar el grado de dispersión de dos

distribuciones que no vienen dadas en las mismas unidades o que las medias no son iguales se

utiliza el coeficiente de variación de Pearson que se define como el cociente entre la desviación

típica y el valor absoluto de la media aritmética.

Es una medida que se emplea fundamentalmente para:

  Comparar la variabilidad entre dos grupos de datos referidos a distintos sistemas de unidades de

medida. Por ejemplo, kilogramos y centímetros.

  Comparar la variabilidad entre dos grupos de datos obtenidos por dos o más personas distintas.

  Comparar dos grupos de datos que tienen distinta media.

  Determinar si cierta media es consistente con cierta varianza.

Medida de dispersión Para una población Para una muestra

Varianza n

 xi

 

2

2       

1

2

2

n

 x x s

  i

 

Desviación estándar σ = √   s = √  Coeficiente de

variación  ̅   ̅ 

CV representa el número de veces que la desviación típica contiene a la media aritmética y por lo

tanto cuanto mayor es CV mayor es la dispersión y menor la representatividad de la media.

Si CV < =33% el grupo de estudio es mas Homogéneo;Si CV > 33% el grupo de estudio es mas Heterogéneo;

Page 25: SEPARATA 2016

8/15/2019 SEPARATA 2016

http://slidepdf.com/reader/full/separata-2016 25/32

  ESTADISTICA GENERAL 

25Lic. Estadístico Hugo Luis Chunga Gutierrez

Ejemplos

En la evaluación a 120 alumnos en 02 asignaturas, se obtienen los siguientes resultados:

1.  Examen de Estadística: 1 2 3 5; . x s  

2. 

Examen de Investigación: 4 5 7 4; . x s  ¿En cual de las pruebas el grupo tiene mayor variabilidad?

Analizar comparativamente la distribución de los sueldos de los 45 trabajadores de cierta empresa

Desv. Estándar MediaDirectivos 70 700Empleados 60 300Obreros 90 250

Con un micrómetro, se realizan mediciones del diámetro de un balero, que tienen una media de4.03 mm y una desviación estándar de 0.012 mm; con otro micrómetro se toman mediciones de la

longitud de un tornillo que tiene una media de 1.76 pulgadas y una desviación estándar de 0.0075

 pulgadas. ¿ Cuál de los dos micrómetros presenta una variabilidad relativamente menor?

Entendiendo la varianza y la desviación estándar:

Ejemplo: Tú y tus amigos han medido las alturas de sus perros (en milímetros):

 Nombre Perro  Milímetros Fido 600. 00Pulgas 470. 00Ringo 170. 00Boby 430. 00Lindo 300. 00

Las alturas (de los hombros) son: 600mm, 470mm, 170mm, 430mm y 300mm.

Calcula la media, la varianza y la desviación estándar.

Page 26: SEPARATA 2016

8/15/2019 SEPARATA 2016

http://slidepdf.com/reader/full/separata-2016 26/32

  ESTADISTICA GENERAL 

26Lic. Estadístico Hugo Luis Chunga Gutierrez

Así que la altura media es 394 mm. Vamos a dibujar esto en el gráfico:

Ahora calculamos la diferencia de cada altura con la media:

Para calcular la varianza, toma cada diferencia, elévala al cuadrado, y haz la media:

Varianza: σ2 = 206 + 76 + (-224) + 36 + (-94) = 108,520 = 21,7045 5

Así que la varianza es 21,704.

Y la desviación estándar es la raíz de la varianza, así que:

Desviación estándar: σ = √21,704 = 147 

y lo bueno de la desviación estándar es que es útil: ahora veremos qué alturas están a distancia

menos de la desviación estándar (147mm) de la media:

Page 27: SEPARATA 2016

8/15/2019 SEPARATA 2016

http://slidepdf.com/reader/full/separata-2016 27/32

  ESTADISTICA GENERAL 

27Lic. Estadístico Hugo Luis Chunga Gutierrez

Todas las estaturas entre 394 hasta 541. 32 (394 + 147. 32) son normales y estan dentro de los

limites establecidos, en este caso Fido es "Anormal" por estar muy alto.

Todas las estaturas entre 246. 68 hasta 394 (394 - 147. 32) son normales y estan dentro de los

limites establecidos, en este caso Chihua es "Anormal" por estar muy bajito.

Así que usando la desviación estándar tenemos una manera "estándar" de saber qué es normal, o

extra grande o extra pequeño.

Pudieramos decir que la desviacion estandar es la media de la media.

MEDIDAS DE POSICIONES CENTRALES PARA DATOS AGRUPADOS

LA MEDIA ARITMÉTICA

Los datos se pueden presentar en tablas sin intervalos y en tablas con intervalos, en ambos casos

se usa la Media aritmética Ponderada 

M(Y) = 1

 y 

i i i 

Y f  

n   

LA MEDIANA

1.  La mediana en tablas sin intervalos

a)  Que2

n  no coincide con algún Nj se tiene que:

 

 

b)  Que2

n  coincide con algún Nj, se tiene que:    

Entonces: 1

2:  j i j M e Y Y    

   

Page 28: SEPARATA 2016

8/15/2019 SEPARATA 2016

http://slidepdf.com/reader/full/separata-2016 28/32

  ESTADISTICA GENERAL 

28Lic. Estadístico Hugo Luis Chunga Gutierrez

2.  La mediana en tablas con intervalos

a.  Hallamos2

n      

     

LA MODA

La moda en tablas sin in tervalos

Una vez agrupados los datos en una tabla de frecuencia, el valor modal será el valor de la

variable que mas se repite o que tiene la mayor frecuencia. La mayor frecuencia se denotara con

 j n  .

La moda Mo =  j n   

2. La moda en tablas con intervalos

[  

   

MEDIDAS DE POSICIONES NO CENTRALES PARA DATOSAGRUPADOS

LOS CUARTILAS (QK )

 

    ̅ 

DECILES:

      ̅  

PERCENTILES:

      ̅  

Page 29: SEPARATA 2016

8/15/2019 SEPARATA 2016

http://slidepdf.com/reader/full/separata-2016 29/32

  ESTADISTICA GENERAL 

29Lic. Estadístico Hugo Luis Chunga Gutierrez

MEDIDAS DE DISPERSION PARA DATOS AGRUPADOS

Medida de dispersión Para una población Para una muestra

Varianza n

 f   x ii  

2

2   

    1

2

2

n

 f   x x s

  ii 

Desviación estándar σ = √   s = √  

Coeficiente de

variación  ̅   ̅ 

EJERCICIOS

CUADRO N° 01

 NIÑOS CON ENFERMEDADES RESPIRATORIAS DEL AAHH SAN MARTINSEGÚN EDAD, PIURA –  JUNIO 2012

Edad

 Niño con enfermedad

diarreica (f i)2 13 44 75 56 3

Total 20

CUADRO N° 02

ALUMNOS DE EPE DE LA UCV –  PIURA SEGÚN PUNTAJES OBTENIDOSEN ESTADÍSTICA EN EL 2012

Puntaje Alumnos (f i)9 2

10 611 1012 713 614 5

Total 36

Page 30: SEPARATA 2016

8/15/2019 SEPARATA 2016

http://slidepdf.com/reader/full/separata-2016 30/32

  ESTADISTICA GENERAL 

30Lic. Estadístico Hugo Luis Chunga Gutierrez

CUADRO N° 03

 NÚMEROS DE HOSPITALES SEGÚN INGRESOS (EN MILES DE SOLES) OBTENIDOS EN NUESTRO PAÍS EN DICIEMBRE DE 2012

[Li , L

 s>

xi f i  F j

[90 –  120> 11 11[120 –  150> 13 24[150 –  180> 20 44[180 –  210> 17 61[210 - 240> 15 76[240 - 270> 3 79[270 –  300> 1 80

Total  ***** 80 *****

CUADRO N° 04

 NÚMEROS DE HOSPITALES SEGÚN INGRESOS (EN MILES DE SOLES) OBTENIDOS EN NUESTRO REGION EN DICIEMBRE DE 2012

[Li , L

 s>

xi f i  F j

[60 –  120> 14 14

[120 –  180> 16 30[180 –  240> 12 42[240 –  300> 10 52[300 - 360> 6 58[360 - 420> 2 60

Total  ***** 60 *****

Page 31: SEPARATA 2016

8/15/2019 SEPARATA 2016

http://slidepdf.com/reader/full/separata-2016 31/32

  ESTADISTICA GENERAL 

31Lic. Estadístico Hugo Luis Chunga Gutierrez

MEDIDAS DE DEFORMACIÓN

Comparan la forma que tiene la representación gráfica, bien sea el histograma o el diagrama de

 barras de la distribución, con la distribución normal.

MEDIDA DE ASIMETRÍA

Diremos que una distribución es simétrica cuando su mediana, su moda y su media aritmética

coinciden.

Diremos que una distribución es asimétrica a la derecha si las frecuencias (absolutas o relativas)

descienden más lentamente por la derecha que por la izquierda.

Si las frecuencias descienden más lentamente por la izquierda que por la derecha diremos que la

distribución es asimétrica a la izquierda. Existen varias medidas de la asimetría de una distribución de frecuencias. Una de ellas es el

Coeficiente de Asimetría de Pearson:

 Mo xC  s

  o S 

 Me xC  s

)(3  

 

Su valor es cero cuando la distribución es simétrica, positivo cuando existe asimetría a la derecha

y negativo cuando existe asimetría a la izquierda.

La interpretación del coeficiente (1.10) es como sigue:

Sí,  0 sC 

, la distribución es con asimetría positiva o con cola a la derecha.

Sí,  0 sC 

, la distribución es con asimetría negativa o con cola a la izquierda.

Sí,  0 sC 

, la distribución es simétrica.

Asimetría Negativa

AsimetríaPositiva

Page 32: SEPARATA 2016

8/15/2019 SEPARATA 2016

http://slidepdf.com/reader/full/separata-2016 32/32

  ESTADISTICA GENERAL 

MEDIDA DE APUNTAMIENTO O KURTOSIS

Miden la mayor o menor cantidad de datos que se agrupan en torno a la moda. Se definen 3 tipos

de distribuciones según su grado de Kurtosis:Distribución mesocúrtica (K = 0.5): presenta un grado de concentración medio alrededor de los

valores centrales de la variable (el mismo que presenta una distribución normal).

Distribución leptocúrtica (K = 1): presenta un elevado grado de concentración alrededor de los

valores centrales de la variable.

Distribución platicúrtica (K = 0): presenta un reducido grado de concentración alrededor de los

valores centrales de la variable.

El Estadígrafo de Kurtosis es:

7 5 2 5

9 0 1 0

PP P 

K C o e f i c i e n t e e r c e n t i l d e K u r t o s i sP P