Hablemos de estadística parte I

54
1.1 ¿Qué es la estadística? OBJETIVO DE APRENDIZAJE Comprender los dos significados del término estadística y las ideas básicas que respaldan cualquier investigación estadística, incluyendo las relaciones entre la población de estudio, la muestra, la muestra estadística y los parámetros de la población.

Transcript of Hablemos de estadística parte I

1.1 ¿Qué es la estadística?

OBJETIVO DE APRENDIZAJE

Comprender los dos significados del término estadística y las ideas básicas que respaldan cualquier investigación estadística, incluyendo las relaciones entre la población de estudio, la muestra, la muestra estadística y los parámetros de la población.

Slide 1.1- 2

Definiciones de estadística y estadísticas

• Estadística es la ciencia que recolecta, organiza e

interpreta datos.

• Estadísticas son los datos (números y otras partes de información) que describen o resumen algo.

Slide 1.1- 3

Cómo funciona la estadística • ¿Cuál es el objetivo de la investigación? • En realidad ¿qué se obtiene con los estudios?

Definiciones La población en un estudio estadístico es el conjunto completo de personas u objetos a estudiar. Los parámetros de la población son las características específicas de la población.

Slide 1.1- 4

EJEMPLO 1 Poblaciones y parámetros de la población

Para cada una de las situaciones siguientes, describa la población que se estudiará e identifique algunos de los parámetros de la población que serían de interés. a. Usted trabaja para Seguros del Agricultor y ha

investigado para determinar el monto promedio pagado a víctimas de accidente en automóviles sin bolsas de aire para impactos laterales.

Solución: La población consiste en las personas que han recibido pagos de seguro por accidentes en automóviles que carecen de bolsas de aire para impactos laterales. El parámetro de la población relevante es la media (promedio) del monto pagado a estas personas.

Slide 1.1- 5

EJEMPLO 1 Poblaciones y parámetros de la población

Para cada una de las situaciones siguientes, describa la población que se estudiará e identifique algunos de los parámetros de la población que serían de interés. b. Has sido contratado por McDonald’s para determinar

los pesos de las papas enviadas cada semana para producir las papas fritas.

Solución: La población consiste en todas las papas enviadas cada semana para hacer papas fritas. Los parámetros relevantes de la población incluyen el peso medio de las papas y la variación de los pesos (por ejemplo, ¿la mayoría de ellos son cercanos o lejanos a la media?)

Slide 1.1- 6 Copyright © 2009 Pearson Education, Inc.

EJEMPLO 1 Poblaciones y parámetros de la población

Para cada una de las situaciones siguientes, describa la población que se estudiará e identifique algunos de los parámetros de la población que serían de interés. c. Usted es un reportero de negocios que está cubriendo los

Laboratorios Genentech, e investiga si su nuevo tratamiento es efectivo contra la leucemia infantil.

Solución: La población consiste en todos los niños con leucemia. Parámetros importantes de la población son el porcentaje de niños que se recuperaron sin el tratamiento nuevo y el porcentaje de niños que se recuperaron con el tratamiento nuevo.

Slide 1.1- 7

Definiciones Una muestra es un subconjunto de la población del cual se obtienen datos. Las medidas u observaciones reales recolectadas de la muestra constituyen los datos. Las estadísticas muestrales son características de la muestra encontradas mediante la consolidación o resumen de los datos.

Slide 1.1- 8

EJEMPLO 2 Encuesta de desempleo

El Departamento del Trabajo de Estados Unidos define la fuerza de trabajo civil como todas aquellas personas que están empleadas o bien de manera activa buscan un empleo. Cada mes este departamento informa la tasa de desempleo, que es el porcentaje de personas que están activamente buscando un empleo dentro de toda la fuerza de trabajo civil. Con el fin de determinar la tasa de desempleo, este departamento encuesta 60 000 hogares. Para los informes de desempleo, describe a. población b. muestra c. los datos d. estadísticas muestrales e. parámetros de la población

Slide 1.1- 9

EJEMPLO 2 Encuesta de desempleo

Solución: La población es el grupo del que el Departamento del Trabajo quiere aprender, todas las personas que conforman la fuerza de trabajo civil.

a. población

Slide 1.1- 10

EJEMPLO 2 Encuesta de desempleo

Solución: La muestra consiste en todas las personas de los 60 000 hogares encuestados.

b. muestra

Slide 1.1- 11

EJEMPLO 2 Encuesta de desempleo

Solución: Los datos consisten en toda la información recolectada de la encuesta.

c. Los datos

Slide 1.1- 12

EJEMPLO 2 Encuesta de desempleo

Solución: Las estadísticas muestrales resumen los datos de la muestra. En este caso, la estadística muestral relevante es el porcentaje de personas en la muestra que están buscando de manera activa trabajo.

d. Estadísticas muestrales

Slide 1.1- 13

EJEMPLO 2 Encuesta de desempleo

Solución: Los parámetros de la población son las características de toda la población que corresponden a las estadísticas muestrales. En este caso, el parámetro poblacional relevante es la tasa real de desempleo.

e. Parámetros de la población

Slide 1.1- 14

Cómo funciona la estadística • ¿Cómo se relacionan las estadísticas

muestrales con los parámetros de la población?

Slide 1.1- 15

UN MOMENTO DE REFLEXIÓN Suponga que Nielsen concluye que 30% de los estadounidenses vieron el Súper Tazón. ¿Cuántas personas representan esto? (La población de Estados Unidos es aproximadamente 300 millones).

Slide 1.1- 16

Definición El margen de error en una investigación estadística sirve para describir el rango de valores, o intervalo de confianza, que probablemente contenga al parámetro de la población. Este intervalo de confianza lo determinamos al sumar y restar el margen de error a la estadística muestral obtenida en el estudio. Es decir, el rango de valores que probablemente contengan el parámetro de la población es desde (estadística muestral – margen de error)

hasta (estadística muestral + margen de error) Por lo común el margen de error es definido paqra que proporcione un intervalo de 95% de confianza, esto quiere decir que 95% de las muestras del tamaño utilizado en el estudio contendrían el paámetro real de la población (y 5% no lo contendrían).

Slide 1.1- 17

EJEMPLO 3 ¿Vida en Marte?

El Centro de Investigación Pew para la Gente y Prensa encuestó a 1 546 adultos estadounidenses acerca de sus actitudes hacia el futuro. Les preguntó si el hombre llegaría a Marte en los próximos 50 años, 76% de estas 1 546 personas dijeron definitivamente sí o probablemente sí. El margen de error para la encuesta fue de 3 puntos porcentuales. Describa la población y la muestra para esta encuesta, y explique el significado del estadístico muestral de 76%. ¿Qué puede concluir acerca del procentaje de la población que piensa que el hombre llegará a Marte en los próximos 50 años?

Slide 1.1- 18

EJEMPLO 3 ¿Vida en Marte? Solución: La población son todos los adultos estadounidenses y la muestra consiste en las 1,546 personas que fueron encuestadas. El estadístico muestral de 76% es el porcentaje real de personas en la muestra que respondió que el hombre definitiva o probablemente llegaría a Marte en los próximos 50 años. El estadístico muestral de 76% y el margen de error de 3 puntos porcentuales nos dicen que el rango de valores desde 76% – 3% = 73%

hasta 76% + 3% = 79% es probable (con un 95% de confianza) que contenga el parámetro de la población, que en este caso es el porcentaje verdadero de todos los adultos estadounidenses que piensan que el hombre definitivamente o probablemente llegará a pisar Marte en los próximos 50 años.

Slide 1.1- 19

EJEMPLO 4 ¿Clonación de humanos?

La misma encuesta Pew preguntó a las personas si creían que los humanos serían clonados en los siguientes 50 años. A esta pregunta , 51% respondió definitivamente sí o probablemente sí. De nueva cuenta, el margen de error fue de 3 puntos porcentuales. ¿Podemos estar seguros que una mayoría de los adultos estadounidenses piensan que los humanos serán clonados en los próximos 50 años?

Slide 1.1- 20

EJEMPLO 4 ¿Clonación de humanos?

Solución : No. Para determinar el rango de valores que probablemente contenga el porcentaje de todos los adultos estadounidenses quienes piensan que la clonación humana definitiva o probablemente ocurra, sumamos y restamos el margen de error de 3 puntos porcentuales de la estadística muestral de 51%. Esto proporciona un rango de valores de 48% a 54%. Puesto que este rango incluye valores a ambos lados de 50%, no podemos estar seguros que la mayoría (es decir, más de 50%) de los adultos estadounidenses piense que los humanos serán clonados en los siguientes 50 años.

Slide 1.1- 21

Cómo reunir las partes: El proceso de una investigación

estadística

Slide 1.1- 22

Pasos básicos en una investigación estadística Paso 1. Indique con precisión el objetivo de su estudio, esto es,

determine la población que quiere estudiar y lo que quiere saber de ella.

Paso 2. Seleccione una muestra de la población. (Asegúrese de utilizar una técnica apropiada de muestreo)

Paso 3. Recolecte datos de la muestra y resuma esos datos determinando las estadísticas muestrales de interés.

Paso 4. Utilice las estadísticas muestrales para realizar inferencias acerca de la población.

Paso 5. Obtenga conclusiones, determine lo que aprendió y si alcanzó su objetivo.

Slide 1.1- 23

INICIO

POBLACIÓN MUESTRA

ESTADÍSTICAS MUESTRALES

PARÁMETROS POBLACIONALES

EL PROCESO DE UNA INVESTIGACIÓN ESTADÍSTICA

Slide 1.1- 24

EJEMPLO 5 Identificación de los pasos

Considere la encuesta del Centro de Investigación Pew que se describió en los ejemplos 3 y 4. Ahora identifique cómo los investigadores aplican los cinco pasos básicos en una investigación estadística. Solución: Los pasos se aplican como se indica a continuación. 1. Los investigadores tenían como objetivo aprender acerca de

las actitudes específicas que los estadounidenses tienen sobre el futuro. Ellos seleccionaron a los adultos estadounidenses como la población, dejaron intencionalmente fuera a los niños.

2. Seleccionaron 1,546 adultos estadounidenses como su muestra. Aunque no dijeron cómo tomaron la muestra, supondremos que fueron elegidos de modo que los 1,546 adultos estadounidenses son representativos de toda la población de adultos estadounidenses.

Slide 1.1- 25

EJEMPLO 5 Identificación de los pasos

Solución: Los pasos se aplican como se indica a continuación.

3.Ellos recolectaron los datos pidiendo a las personas en la muestra respuestas a las preguntas cuidadosamente seleccionadas. Los datos son las respuestas individuales a las preguntas. Ellos resumieron estos datos con estadísticas muestrales, tal como los porcentajes globales de personas, en la muestra, que respondieron sí o no a cada pregunta.

4.Las técnicas de la ciencia estadística permitieron a los investigadores inferir características de la población. En este caso, la inferencia consistió en la estimación de ciertos parámetros de la población y el cálculo de los márgenes de error.

Slide 1.1- 26

EJEMPLO 5 Identificación de los pasos Solución: Los pasos se aplican como se indica a continuación.

5. Seguros de que el estudio fue realizado adecuadamente e interpretando las estimaciones de los parámetros de la población, los investigadores sacaron conclusiones globales sobre las actitudes de los estadounidenses acerca del futuro.

Slide 1.1- 27

Estadística: decisiones para un mundo incierto

Propósito de la estadística

La estadística tiene muchos usos, pero quizás el más importante es ayudarnos a tomar buenas decisiones en situaciones que incluyen incertidumbre.

1.2 Muestreo

OBJETIVO DE APRENDIZAJE

Entender la importancia de seleccionar una muestra representativa y familiarizarse con los diversos métodos comunes de muestreo.

Slide 1.2- 29

Definición Un censo es una recolección de datos de cada uno de los miembros de una población.

Definición Una muestra representativa es una muestra en la cual las características relevantes de los elementos de la muestra generalmente son las mismas que las características de la población.

Slide 1.2- 30

EJEMPLO 1 Una muestra representativa para alturas Suponga que quiere determinar la altura media de todos los estudiantes de su escuela ¿Cuál podría ser una muestra más representativa para este estudio: los integrantes del equipo varonil de básquetbol o los estudiantes de su curso de estadística? Solución: Los integrantes del equipo varonil de básquetbol no son una muestra representativa para un estudio de altura, ya que sólo está formada por hombres y, segundo, los jugadores de básquetbol tienden a ser más altos que el promedio. La altura media de los estudiantes en su curso de estadística, tal vez, es mucho más cercana a la altura media de todos los estudiantes, de modo que su clase forma una muestra más representativa que los integrantes del equipo varonil de básquetbol.

Slide 1.2- 31

Sesgo Definición

Una investigación estadística sufre de sesgo si su diseño o realización tiende a favorecer ciertos resultados.

Slide 1.2- 32

EJEMPLO 2 ¿Por qué usar Nielsen?

Nielsen Media Research cobra a las redes y estaciones de televisiones por sus servicios. Por ejemplo, NBC paga a Nielsen por proporcionar índices de audiencia de sus programas de televisión. ¿Por qué NBC no hace sus propios índices de audiencia, en lugar de pagar a una compañía por hacerlos? Solución: El costo de publicidad en un programa de televisión depende del índice de audiencia del show. Entre mayor sea, más puede cobrar la red por un anuncio, lo que significa que NBC podría tener un claro sesgo si hace sus propios índices de audiencia. Por tanto, los anunciantes no confiarían en estos índices. Al contratar una fuente independiente, tal como Nielsen, NBC proporciona información más creíble para los anunciantes.

Slide 1.2- 33

UN MOMENTO DE REFLEXIÓN El hecho que NBC pague a Nielsen por sus servicios podría dar a Nielsen un incentivo financiero para hacer que NBC salga bien en los índices de audiencia. El hecho de que Nielsen también proporciona índices de audiencia para otras cadenas, ¿cómo ayuda a prevenir de un posible sesgo hacia NBC?

Slide 1.2- 34

Métodos de muestreo •Muestras aleatorias simples Una muestra aleatoria simple es aquélla en la cual cada elemento de la población tiene igual oportunidad de ser seleccionado como parte de la muestra. Con un muestreo aleatorio simple, cualquier muestra posible de un tamaño particular tiene igual oportunidad de ser seleccionada.

Slide 1.2- 35

UN MOMENTO DE REFLEXIÓN

Busque la tecla de números aleatorios en una calculadora ¿qué sucede cuando la oprime? ¿cómo podría utilizar la tecla de números aleatorios para seleccionar una muestra de 100 estudiantes?

Slide 1.2- 36

EJEMPLO 3 Muestreo en un directorio telefónico

Usted podría llevar a cabo una encuesta de opinión en la cual la población sean todos los residentes en una ciudad. ¿Podría seleccionar una muestra aleatoria simple escogiendo nombres aleatoriamente del directorio telefónico local?

Solución: Una muestra extraída de un directorio telefónico no es una muestra aleatoria simple de la población de la ciudad, ya que en los directorios invariablemente no hay muchos nombres y alguien que no aparezca no tiene oportunidad de ser elegido. Por ejemplo, el directorio telefónico no tendrá los nombres de dos o más personas que comparten el mismo número telefónico, sólo una de ellas está en la lista, o cuando una persona elige que su número telefónico no aparezca, o cuando dependen exclusivamente de un teléfono celular, o cuando una persona (tal como los vagabundos) no tienen teléfono.

Slide 1.2- 37

Métodos de muestreo •Muestreo sistemático Este tipo de muestreo, en el que utilizamos un sistema, tal como la elección de cada 50 miembros de la población, se denomina muestreo sistemático.

Slide 1.1- 37

Slide 1.2- 38

EJEMPLO 5 Cuando el muestreo sistemático no funciona Usted está realizando una encuesta de estudiantes en un dormitorio de una escuela mixta en el que los hombres tienen asignadas habitaciones con número impar y las mujeres habitaciones con número par. ¿puede obtener una muestra representativa cuando elige cada 10 habitaciones? Solución: No. Si usted inicia con una habitación con número impar, cada 10 habitaciones también será una con número impar (tal como las habitaciones con número 3, 13, 23…). De forma análoga, si inicia con una habitación con número par, cada 10 habitaciones también tendrá número par. Por tanto, obtendrá habitaciones con sólo hombres o con sólo mujeres, ninguna de ellas es representativa de la población de la escuela mixta. Slide 1.1- 38

Slide 1.2- 39

UN MOMENTO DE REFLEXIÓN

Suponga que en el ejemplo 5 elige cada 5 habitaciones, en lugar de cada 10, ahora ¿la muestra sería representativa?

Slide 1.2- 40

Métodos de muestreo •Muestreo de conveniencia

Este tipo de muestra selecciona por conveniencia en lugar de hacerlo por un procedimiento más complejo.

Slide 1.1- 40

Slide 1.2- 41

EJEMPLO 6 Prueba del sabor de una salsa Un supermercado necesita decidir si tener una nueva marca de salsa, por lo que ofrece una prueba gratis en un puesto en la tienda y pregunta a las personas si les gusta. ¿Qué tipo de muestreo se utiliza? ¿Es probable que la muestra sea representtiva de la población de todos los clientes?

Solución: La muestra de clientes que se paran a probar la salsa es un muestreo de conveniencia, ya que estas personas se encuentran en la tienda y son voluntarios para probar el producto nuevo. (Este tipo de muestreo de conveniencia, en el que las personas eligen o no ser parte de la muestra, también se denomina muestreo de autoselección).

Slide 1.1- 41

Slide 1.2- 42

EJEMPLO 6 Prueba del sabor de una salsa

Solución: cont. Tal muestra no es probable que sea representativa de la población de todos los clientes, ya que distintos tipos de personas podrían hacer sus compras en diferentes momentos (por ejemplo, los padres que están en casa es más probable que hagan las compras a medio día que los padres que trabajan) y sólo las personas a quienes les gusta la salsa es probable que participen. Aun así, la información podría ser muy útil, ya que las opiniones de las personas que les gusta la salsa quizá serían más importantes en este caso.

Slide 1.1- 42

Slide 1.2- 43

Métodos de muestreo • Muestreo por conglomerado

El muestreo por conglomerado incluye la selección de todos los miembros de grupo (o conglomerados) seleccionados aleatoriamente.

Slide 1.1- 43

Slide 1.2- 44

EJEMPLO 7 Precios de gasolina

Usted quiere conocer el precio medio de la gasolina en las gasolinerías localizadas en un radio de una milla de la ubicación de rentas de automóviles en los aeropuertos. Explique cómo podría utilizar el muestreo por conglomerados en este caso. Solución: Podría seleccionar aleatoriamente unos cuantos aeropuertos en todo el país. Para estos aeropuertos verificaría los precios de la gasolina en cada gasolinería en un radio de una milla de la ubicación de la renta de automóviles.

Slide 1.1- 44

Slide 1.2- 45

Métodos de muestreo • Muestreo estratificado

El muestreo estratificado consiste en seleccionar aleatoriamente a los miembros de un estrato.

Slide 1.1- 45

Slide 1.2- 46

EJEMPLO 8 Datos de desempleo

El Departamento del Trabajo de Estados Unidos encuesta cada mes 60 000 hogares para compilar su reporte de desempleo. Para seleccionar estos hogares este departamento primero agrupa las ciudades y condados en alrededor 2 000 áreas geográficas. Luego, de forma aleatoria, selecciona hogares en cada una de estas áreas geográficas para encuestarlos. ¿Es un ejemplo de muestreo estratificado? ¿Cuáles son los estratos? ¿Por qué el muestreo estratificado es importante en este caso?

Slide 1.1- 46

Slide 1.2- 47

EJEMPLO 8 Datos de desempleo

Solución: La encuesta de desempleo es un ejemplo de muestreo estratificado ya que primero divide la población en subgrupos. Los subgrupos, o estratos, son las personas en las 2 000 regiones geográficas. En este caso el muestreo estratificado es importante, porque las tasas de desempleo en la parte rural de Kansas podrían ser muy diferentes que en Silicon Valley. Al utilizar muestreo estratificado, el Departamento del Trabajo asegura que su muestra representa adecuadamente a todas las regiones geográficas.

Slide 1.1- 47

Slide 1.2- 48

Resumen de los métodos de muestreo Sin importar cómo se elija una muestra, tenga en mente las tres ideas clave siguientes:

• Un estudio puede tener éxito sólo si la muestra es representativa de la población.

• Una muestra sesgada no es probable que sea una muestra representativa.

• Aunque una muestra sea bien elegida, puede resultar no representativa, por mala suerte, al sacar la muestra.

Slide 1.1- 48

Slide 1.2- 49

Métodos comunes de muestreo • Muestreo aleatorio simple: elegimos una muestra de elementos

de tal manera que cualquier muestra del mismo tamaño tenga igual oportunidad de ser seleccionada.

• Muestreo sistemático: utilizamos un sistema sencillo para seleccionar la muestra, tal como elegir a cada 10 o cada 50 elementos de la población.

• Muestreo por conveniencia: utilizamos una muestra que pueda ser conveniente de seleccionar.

• Muestreo por conglomerados: primero dividimos la población en grupos, o conglomerados, y seleccionamos al azar algunos de estos conglomerados. Luego obtenemos la muestra mediante la selección de todos los miembros en cada uno de los conglomerados seleccionados.

• Muestreo estratificado: utilizamos este método cuando nos interesan las diferencias entre subgrupos, o estratos, dentro de una población. Primero identificamos los estratos y luego sacamos una muestra aleatoria en cada uno de los estratos. La muestra total consiste en todas las muestras de cada uno de los estratos individuales.

Slide 1.2- 50

Muestreo aleatorio simple: Cada muestra del mismo tamaño tiene igual oportunidad de ser elegida. Con frecuencia las computadoras son utilizadas para generar números aleatorios.

Slide 1.1- 50

Slide 1.2- 51

Muestreo sistemático: Selecciona cada k elementos.

Slide 1.1- 51

Slide 1.2- 52

Muestreo por conveniencia: Utiliza resultados que son fácilmente disponibles.

Slide 1.1- 52

Slide 1.2- 53

Muestreo por conglomerados: Divide la población en conglomerados, selecciona algunos de esos conglomerados y luego toma a todos los elementos de los conglomerados seleccionados.

Slide 1.1- 53

Slide 1.2- 54

Muestreo estratificado: Divide la población en al menos dos estratos, luego se saca una muestra de cada uno de ellos.

Slide 1.1- 54