02 Conceptos Estadísticos Fundamentales
Transcript of 02 Conceptos Estadísticos Fundamentales
Conceptos Estadísticos Fundamentales
Ing. Julio Carreto
Ing. Julio Carreto 2
Conceptos Fundamentales
Hasta ahora hemos visto el caso de fenómenos o experimentos cuyo espacio muestral asociado tiene un número pequeño de elementos.
Esto nos sirvió para introducir la noción de probabilidad.
Ing. Julio Carreto 3
Conceptos Fundamentales
Pero en muchos casos es necesario trabajar con experiencias o procesos que generan un número muy grande de datos o resultados numéricos, es decir, espacios muestrales con un número infinito o muy grande de elementos.
Ing. Julio Carreto 4
Conceptos Fundamentales
Cuando tenemos un conjunto muy grande de datos numéricos para analizar decimos que tenemos un Universo o Población de observaciones.
Ing. Julio Carreto 5
Conceptos Fundamentales
2926
26
3132
30
27
28
25
29
3230
2927
28
30
30
31
3130 30
31
27
31
2829
32
33
3334
31
29
30
Población o Universo
Ing. Julio Carreto 6
Conceptos Fundamentales
Cada dato numérico es un elemento de la población o universo.
Una Muestra es un subconjunto pequeño de observaciones extraídas de un universo o población.
Ing. Julio Carreto 7
Conceptos Fundamentales
2926
26
3132
30
27
28
25
29
3230
2927
28
30
30
31
3130 30
31
27
31
2829
32
33
3334
31
29
30
30
Población o Universo
Extraemos un dato de la Población
Ing. Julio Carreto 8
Conceptos Fundamentales
2926
26
3132
30
27
28
25
29
3230
2927
28
30
30
31
3130 30
31
27
31
2829
32
33
3334
31
29
3028
29 3130
34
Población o Universo
Muestra de 5 datos
Ing. Julio Carreto 9
Conceptos Fundamentales
La Estadística trabaja con poblaciones de datos y con muestras extraídas de las mismas.
Ing. Julio Carreto 10
Conceptos Fundamentales
Los conceptos de población y muestra a veces resultan ambiguos en su aplicación práctica.
Ing. Julio Carreto 11
Conceptos Fundamentales
Por ejemplo, supongamos que en una ciudad de 5000 habitantes se realiza un censo médico en el cual se mide el peso, la altura y se relevan otros datos de todos los habitantes de la ciudad.
Ing. Julio Carreto 12
Conceptos Fundamentales
Alguien podría referirse al universo o población censada teniendo in mente el conjunto de los habitantes de la ciudad. Pero cuando hablamos en términos estadísticos, nos referimos a poblaciones o universos de datos.
Ing. Julio Carreto 13
Conceptos Fundamentales
Por ejemplo, el conjunto de todas las mediciones de altura (De los habitantes de la ciudad) es un conjunto de datos y por lo tanto constituye un universo o población de datos desde el punto de vista estadístico.
Ing. Julio Carreto 14
Conceptos Fundamentales
Otro universo o población de datos son los pesos medidos (De los habitantes de la ciudad). Pero la población de habitantes, es decir, las personas que habitan la ciudad no son la población a la que nos estamos refiriendo desde el punto de vista estadístico.
Ing. Julio Carreto 15
Conceptos Fundamentales
Supongamos que en una empresa se fabrica un lote muy grande, digamos 10 toneladas de un producto químico, y un técnico debe controlar la calidad del mismo.
Ing. Julio Carreto 16
Conceptos Fundamentales
El técnico toma una pequeña porción, por ejemplo, 100 gramos y dirá que tomó una muestra del producto para analizar en el laboratorio.
Ing. Julio Carreto 17
Conceptos Fundamentales
Hasta el momento, la muestra no fue analizada y por lo tanto no tenemos ningún dato numérico.
Ing. Julio Carreto 18
Conceptos Fundamentales
Cuando el laboratorio efectúa algún ensayo en la muestra y obtiene un resultado numérico, recién ahí tenemos un dato que puede ser analizado desde el punto de vista estadístico.
Ing. Julio Carreto 19
Conceptos Fundamentales
Vamos a suponer hipotéticamente que el técnico continúa sacando otras muestras del producto, hasta agotar el lote y cada una es ensayada en el laboratorio, el cual nos da los resultados.
Ing. Julio Carreto 20
Conceptos Fundamentales
Como teníamos 10 ton. de producto y las muestras son aproximadamente de 100 gr., el técnico seguramente extraerá alrededor de 100000 muestras y el laboratorio nos entregará alrededor de 100000 resultados. Este conjunto de datos numéricos es nuestro universo o población de datos.
Ing. Julio Carreto 21
Conceptos Fundamentales
Si nosotros tomamos al azar 10 de esos resultados, podemos decir que tenemos una muestra de 10 elementos de ese universo o población.
Ing. Julio Carreto 22
Conceptos Fundamentales
No debemos confundir esta muestra (Desde el punto de vista estadístico) con la muestra de material que extrajo el técnico para ser analizada en laboratorio.
Ing. Julio Carreto 23
Conceptos Fundamentales
Ahora bien, nuestro universo o población de datos a veces no existe en la realidad, sino que es un concepto o abstracción que utilizamos para referirnos al universo o población que hipotéticamente podría existir.
Ing. Julio Carreto 24
Conceptos Fundamentales
Veamos el ejemplo anterior. Supongamos que el técnico toma solamente 5 muestras y las envía para analizar al laboratorio.
Ing. Julio Carreto 25
Conceptos Fundamentales
El laboratorio nos enviará sólo 5 resultados, y nosotros diremos que tenemos una muestra de datos extraída del universo o población de datos total.
Ing. Julio Carreto 26
Conceptos Fundamentales
Y estamos pensando en el universo o población que tendríamos si se hubieran extraído y analizado las 100000 muestras de material.
Ing. Julio Carreto 27
Conceptos Fundamentales
Muchas veces resulta difícil imaginarse cual es el universo del cual extrajimos los datos.
Ing. Julio Carreto 28
Conceptos Fundamentales
Supongamos que tenemos una máquina que produce piezas de plástico en serie y un técnico toma 5 piezas sucesivas y les mide la altura con un calibre. Tenemos, entonces, 5 resultados, es decir una muestra de 5 elementos.
Ing. Julio Carreto 29
Conceptos Fundamentales
¿Cuál es el universo al cual pertenece esa muestra de datos?.
Ing. Julio Carreto 30
Conceptos Fundamentales
Debemos imaginar lo siguiente: Si la máquina continuara trabajando en las mismas condiciones (Es decir, a la misma velocidad, con las mismas materias primas, a la misma temperatura, manejada por el mismo operario, etc.) ...
Ing. Julio Carreto 31
Conceptos Fundamentales
... y a cada pieza que produce se le mide la altura tendríamos un conjunto muy grande de resultados numéricos.
Ing. Julio Carreto 32
Conceptos Fundamentales
Ese conjunto muy grande de resultados numéricos que no existe, pero que podría obtenerse en esas condiciones es el universo o población del cual extrajimos la muestra de 5 observaciones.
Ing. Julio Carreto 33
Conceptos Fundamentales
Veamos otro ejemplo. Supongamos que el sindicato de la industria textil desea saber cual es el sueldo promedio que gana un operario en esa industria.
Ing. Julio Carreto 34
Conceptos Fundamentales
Entonces, encarga una encuesta a una empresa especializada, que entrevista a 20 operarios de la industria textil y averigua sus salarios.
Ing. Julio Carreto 35
Conceptos Fundamentales
Estos datos son una muestra de 20 observaciones del universo o población formado por los salarios de todos los operarios de la industria textil del país.
Ing. Julio Carreto 36
Conceptos Fundamentales
Aunque el encuestador no disponga de esos datos, sabemos que existen miles de operarios que ganan un salario determinado y por lo tanto podemos hablar de un universo o población cuyos elementos son los salarios de los operarios de la industria textil en el país.
Ing. Julio Carreto 37
Conceptos Fundamentales
Además, esa población de datos es seguramente diferente de la población de salarios de los operarios de la industria textil chilena o brasileña (Usando una misma moneda de referencia).
Ing. Julio Carreto 38
Conceptos Fundamentales
¿Qué representa una Población de datos?
Ing. Julio Carreto 39
Conceptos Fundamentales
El análisis estadístico de una población o universo de datos tiene como objetivo final descubrir las características y propiedades de aquello que generó los datos.
Ing. Julio Carreto 40
Conceptos Fundamentales
Por ejemplo, se tiene una población de escolares (Población física, población humana) y se les mide la altura.
Ing. Julio Carreto 41
Conceptos Fundamentales
El conjunto de datos de altura constituye una población o universo estadístico. El análisis de estos datos de altura (Universo estadístico) sirve para caracterizar y estudiar a la población de estudiantes (Que no es una Población estadística).
Ing. Julio Carreto 42
Conceptos Fundamentales
Supongamos que un instituto dedicado a estudios económicos ha realizado una encuesta de ingresos en el país. El universo de datos generados por la encuesta sirve a los fines de caracterizar a la población física, a la población real del país, desde un punto de vista económico.
Ing. Julio Carreto 43
Conceptos Fundamentales
Población real
Salarios800 $
1250 $950 $
2150 $1780 $1340 $1500 $2100 $
...
Salarios800 $
1250 $950 $
2150 $1780 $1340 $1500 $2100 $
...
Población estadística
Ing. Julio Carreto 44
Conceptos Fundamentales
Un ingeniero controla un proceso industrial, que genera a diario muchos lotes de un producto (Población de lotes). Para cada lote se mide una característica de calidad, obteniéndose una gran cantidad de resultados numéricos (Población de datos).
Ing. Julio Carreto 45
Conceptos Fundamentales
Resultados Numéricos
Muestra
Medición
Proceso
Producto
Ing. Julio Carreto 46
Conceptos Fundamentales
El ingeniero realiza esta tarea no porque esté interesado en jugar con números, sino porque a través de los datos numéricos obtenidos se puede evaluar el comportamiento del proceso, que es lo que realmente le interesa.
Ing. Julio Carreto 47
Conceptos Fundamentales
Entonces, es importante destacar que detrás de un universo o población de datos se encuentra una población física subyacente, formada por elementos de la realidad que nos rodea, de la cual, a través de algún tipo de medición, se obtuvieron los datos numéricos.
Ing. Julio Carreto 48
Conceptos Fundamentales
Es esa población física subyacente (Elementos de la realidad, seres humanos, lotes de material, etc.) la que deseamos estudiar y caracterizar por medio del análisis estadístico de los datos obtenidos.
Ing. Julio Carreto 49
Conceptos Fundamentales
La población estadística está representando, entonces, una población física o natural formada por elementos de la realidad, con respecto a una característica o propiedad de esa población física.
Ing. Julio Carreto 50
Conceptos Fundamentales
Es muy importante, al utilizar métodos estadísticos, no confundir la población física, formada por elementos de la realidad que estamos estudiando, con la población o universo de datos generados a partir de la primera.
Ing. Julio Carreto 51
Conceptos Fundamentales
De aquí en adelante, cuando utilicemos los términos población o universo sin otro aditamento nos estaremos refiriendo a población o universo de datos numéricos (También llamados observaciones o mediciones o valores).
Ing. Julio Carreto 52
Conceptos Fundamentales
La Distribución de Frecuencias
Ing. Julio Carreto 53
Conceptos Fundamentales
Vimos que una Población o Universo de datos es un conjunto muy grande de números. Estos números pueden estar en un gran listado o puede ser un conjunto hipotético, es decir, podemos imaginar los números pero no los tenemos realmente.
Ing. Julio Carreto 54
Conceptos Fundamentales
Una gran tabla de números ordenados al azar prácticamente no nos muestra información acerca de la población de datos.
Ing. Julio Carreto 55
Conceptos Fundamentales
Suponiendo que disponemos de los datos del universo ¿Cómo podemos clasificar y ordenar los números para obtener más información acerca de ese universo de datos?
Ing. Julio Carreto 56
Conceptos Fundamentales
Una forma sería escribir los números desde el menor hasta el mayor y colocar encima de cada uno tantas cruces como veces que figure repetido en la población:
Ing. Julio Carreto 57
Conceptos Fundamentales
2926
26
3132
30
27
28
25
29
3230
2927
28
30
30
31
31 3030
31
27
31
28
29
32
33
3334
31
29
30
24 25 26 27 28 29 30 31 32 33 34 35x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x
x
x x
Población o Universo
Ing. Julio Carreto 58
Conceptos Fundamentales
... o utilizar cuadraditos en vez de cruces:
Ing. Julio Carreto 59
Conceptos Fundamentales
2926
26
3132
30
27
28
25
29
3230
2927
28
30
30
31
31 3030
31
27
31
28
29
32
33
3334
31
29
30
24 25 26 27 28 29 30 31 32 33 34 35Población o Universo
Ing. Julio Carreto 60
Conceptos Fundamentales
El número de veces que aparece repetido cada dato es la frecuencia de dicho valor.
La representación gráfica que hemos visto se denomina Distribución de Frecuencias de la población.
Ing. Julio Carreto 61
Conceptos Fundamentales
La representación gráfica nos permite ver información que antes no aparecía tan evidente. Por ejemplo, sin hacer ningún cálculo nos damos cuenta donde está aproximadamente el promedio de la población:
Ing. Julio Carreto 62
Conceptos Fundamentales
2926
26
3132
30
27
28
25
29
3230
2927
28
30
30
31
31 3030
31
27
31
28
29
32
33
3334
31
29
30
24 25 26 27 28 29 30 31 32 33 34 35Población o Universo
Promedio
Ing. Julio Carreto 63
Conceptos Fundamentales
También nos muestra cuales son los valores máximo y mínimo de la población, es decir, el rango:
Ing. Julio Carreto 64
Conceptos Fundamentales
2926
26
3132
30
27
28
25
29
3230
2927
28
30
30
31
31 3030
31
27
31
28
29
32
33
3334
31
29
30 24 25 26 27 28 29 30 31 32 33 34 35
Rango
Ing. Julio Carreto 65
Conceptos Fundamentales
En el caso anterior, los datos de la población son números enteros.
Ing. Julio Carreto 66
Conceptos Fundamentales
Cuando los números no son enteros o cuando tenemos un número muy grande de datos, se divide el rango total en subintervalos y se cuenta el número de valores que cae dentro de cada subintervalo.
Ing. Julio Carreto 67
Conceptos Fundamentales
Vamos a suponer, ahora, que tenemos una cierta población de N = 500 datos, por ejemplo el peso de varones adultos de 40 años.
Ing. Julio Carreto 68
Conceptos Fundamentales
Una manera de caracterizar esta población es construir una distribución de frecuencias o gráfico de frecuencias. Para ello seguimos los pasos siguientes:
Ing. Julio Carreto 69
Conceptos Fundamentales
1) Tomamos nota del valor máximo y el valor mínimo de la serie de datos que estamos considerando.
Ing. Julio Carreto 70
Conceptos Fundamentales
2) Subdividimos el intervalo entre el máximo y el mínimo en algún número de intervalos (15 ó 20) mas pequeños iguales entre sí.
Ing. Julio Carreto 71
Conceptos Fundamentales
3) Contamos el número de datos que encontramos dentro de cada intervalo (Frecuencia). Por ejemplo, supongamos que en el intervalo i hay ni observaciones ( ni = N).
Ing. Julio Carreto 72
Conceptos Fundamentales
4) Para construir el gráfico, colocamos en el eje de abcisas (Horizontal) los intervalos y levantamos en cada intervalo un rectángulo de altura proporcional al número ni de datos dentro del mismo.
Ing. Julio Carreto 73
Conceptos Fundamentales
Si hacemos el área del rectángulo levantado sobre el intervalo i-ésimo igual a la frecuencia relativa ni/N, el área total bajo el histograma será igual a la unidad:
1 N
NN
n
Nn
ATotalArea iii
Ing. Julio Carreto 74
Conceptos Fundamentales
Gráfico de Distribución de Frecuencias
0,00
0,02
0,04
0,06
0,08
0,10
0,12
0,14
0,16
0,18
0,20
60 66 72 78 84 90 96
Peso Kg.
Fre
cuen
cia
Rel
ativ
a
Ing. Julio Carreto 75
Conceptos Fundamentales
Obtenemos así una representación gráfica (Llamada también histograma) que nos muestra la distribución de frecuencias de la población.
Ing. Julio Carreto 76
Conceptos Fundamentales
Esta distribución de frecuencias nos muestra las características de una población, por ejemplo, si hay resultados que son mas frecuentes que otros.
Ing. Julio Carreto 77
Conceptos Fundamentales
Nos muestra si los valores están ubicados alrededor de un valor central, si están muy dispersos o poco dispersos. Podemos observar que fracción de todas las mediciones cae por ejemplo, entre 70 y 80 Kg. (Zona rayada en el gráfico):
Ing. Julio Carreto 78
Gráfico de Distribución de Frecuencias
0,00
0,02
0,04
0,06
0,08
0,10
0,12
0,14
0,16
0,18
0,20
60 66 72 78 84 90 96
Peso Kg.
Fre
cu
en
cia
Rela
tiva
Conceptos Fundamentales
Ing. Julio Carreto 79
Conceptos Fundamentales
Si elegimos una persona del grupo y la pesamos, el resultado es un dato que pertenece a la población de datos representada en el gráfico. Decimos, entonces, que estamos extrayendo un dato de la población de datos.
Ing. Julio Carreto 80
Conceptos Fundamentales
Pero hay distintas maneras de elegir la persona, es decir, distintas maneras de realizar la extracción del dato.
Ing. Julio Carreto 81
Conceptos Fundamentales
Si nos paramos frente al grupo y elegimos una persona, estaremos seleccionando al más gordo, al más flaco o al más alto (y por lo tanto pesa más que otros), de acuerdo a criterios subjetivos que no podemos evitar.
Ing. Julio Carreto 82
Conceptos Fundamentales
En cambio, si escribimos los nombres de todas las personas en una etiqueta, metemos todas las etiquetas en una caja y luego le pedimos a alguien que retire una etiqueta, la selección no estará influída por nuestra subjetividad. En este caso, decimos que la extracción es aleatoria.
Ing. Julio Carreto 83
Conceptos Fundamentales
Juan
Ing. Julio Carreto 84
Conceptos Fundamentales
Una extracción aleatoria es aquella en que cada miembro de la población tiene la misma posibilidad de ser elegido. Supongamos que realizamos una extracción aleatoria de la población antedicha y obtenemos el valor y.
Ing. Julio Carreto 85
Conceptos Fundamentales
Entonces: 1) La probabilidad P(y<70) de que y
sea menor que 70 Kg. es igual al área del histograma a la izquierda de 70 Kg.
Ing. Julio Carreto 86
2) La probabilidad P(y>70) de que y sea mayor que 70 Kg. es igual al área del histograma a la derecha de 70 Kg.
Conceptos Fundamentales
Ing. Julio Carreto 87
3) La probabilidad P(y>70, y<80) de que y sea mayor que 70 Kg. pero menor que 80 Kg. es igual al área del histograma entre 70 y 80 Kg.
Conceptos Fundamentales
Ing. Julio Carreto 88
Fin de la
sección