Técnicas de muestreo

10

Click here to load reader

description

Técnicas de muestreo

Transcript of Técnicas de muestreo

Page 1: Técnicas de muestreo

Ing. Isabel Escudero Página 1

Aleatorio Simple Por Juicio o deliberado

• Sistemático • Estratificado • Por Conglomerados

Todos los procedimientos de muestreo

No Probabilísticos Probabilísticos

Por conveniencia

1. MÉTODOS Y TÉCNICAS DE MUESTREO

Muestreo probabilístico.

1. Se conoce la probabilidad de ser elegido

2. No existe garantía de que los resultados sean mejores que con la muestra no

probabilística

3. Con el muestreo probabilístico se puede conocer el error muestral.

Muestreo no probabilístico: Es aquel en el que la selección de los elementos de

la muestra no se hacen al azar.

Afijación simple: Supone repartir la muestra total en partes iguales para cada

estrato, independientemente del tamaño de la población, es decir, este criterio

determina que el número de encuestas que se realizarán será igual para cada

estrato. Este criterio es muy sencillo pero poco recomendable. Ejemplo: 25

elementos por estrato.

Afijación proporcional: Este criterio supone la división de la muestra en partes

proporcionales a la población de cada estrato, es decir, el reparto de las encuestas

se hace teniendo en cuenta el tamaño del estrato.

Afijación óptima: El reparto de la muestra se hace no solo atendiendo al tamaño

del estrato sino también a la dispersión de los datos dentro de los estratos, medida

ésta a través de la desviación típica.

Page 2: Técnicas de muestreo

Ing. Isabel Escudero Página 2

Muestreo aleatorio simple (m.a.s.)

Se eligen individuos de la población de estudio, de manera que todos tienen la

misma probabilidad de aparecer, hasta alcanzar el tamaño muestral deseado.

Se puede realizar partiendo de listas de individuos de la población, y eligiendo

individuos aleatoriamente con un programa estadístico.

En general, las técnicas de inferencia estadística suponen que la muestra ha

sido elegida usando m.a.s., aunque en realidad se use alguna de las que

veremos a continuación.

Muestra formulada de manera que cada integrante de la población tenga la misma

probabilidad de quedar incluido.

El método es impracticable con muestras muy grandes.

Ejemplo: Considerar una población de tamaño (Np) igual a 250.000 personas y

se elige una muestra (n) de 500 personas. En esa población existe un líder, por

tanto este se escogería directamente para la muestra y los 499 restantes se

eligen mediante un muestreo aleatorio simple entre las 249.999 personas

restantes de la población.

Supongamos que tenemos una población de 50.000 individuos, y que tenemos

un listado con sus nombres. Si queremos elegir 100 personas, lo que

necesitamos es que el ordenador elija al azar a 100 individuos de esos 50.000.

Muestreo sistemático

Se tiene una lista de los individuos de la población de estudio. Si queremos una

muestra de un tamaño dado, elegimos individuos igualmente espaciados de la lista,

donde el primero ha sido elegido al azar.

CUIDADO: Si en la lista existen periodicidades, obtendremos una muestra sesgada.

Un caso real: Se eligió una de cada cinco casas para un estudio de salud pública en una

ciudad donde las casas se distribuyen en manzanas de cinco casas. Salieron con mucha

frecuencia las de las esquinas, que reciben más sol, están mejor ventiladas…

Población Muestra

Page 3: Técnicas de muestreo

Ing. Isabel Escudero Página 3

Muestreo sistemático

Los integrantes de la población se ordenan de acuerdo algún método y se selecciona al

azar un punto de inicio y después se elige cada “k” elemento de la población para la

muestra de manera sistemática.

Ejemplo

Tenemos 10000 estudiantes (en una lista) y queremos obtener una muestra de

100 estudiantes. Primero elegimos al azar un estudiante entre los

10000/100=100 primeros (supongamos que salga el 26), el segundo elemento

será el estudiante 100+26 (126), el siguiente será el 226, luego el 326, etc.

Muestreo estratificado

Se aplica cuando sabemos que hay ciertos factores (variables, sub-poblaciones

o estratos) que pueden influir en el estudio y queremos asegurarnos de tener

cierta cantidad mínima de individuos de cada tipo:

Hombres y mujeres,

Jóvenes, adultos y ancianos…

Una población se divide en subgrupos denominados estratos, los cuales son lo más

homogéneo posible, y de cada estrato se seleccionan de manera proporcional los

integrantes de la muestra estratificada.

Aleatorización

Población ordenada

Muestra sistemática

Se realiza entonces una m.a.s. de los individuos de cada uno de los estratos.

Page 4: Técnicas de muestreo

Ing. Isabel Escudero Página 4

Ejemplo

Supongamos que, en Medellín, 70% de los niños de primaria van a escuela pública

y el 30% a privada. Si queremos 1,000 niños, lo que haremos es dividir los

alumnos en 2 estratos (pública y privada) y se eligen aleatoriamente 700 niños de

la pública y aleatoriamente 300 de la privada.

Muestreo por grupos o conglomerados

Se aplica cuando es difícil tener una lista de todos los individuos que forman parte

de la población de estudio, pero sin embargo sabemos que se encuentran

agrupados naturalmente en grupos.

Se realiza eligiendo varios de esos grupos al azar, y ya elegidos algunos podemos

estudiar a todos los individuos de los grupos elegidos o bien seguir aplicando

dentro de ellos más muestreos por grupos, por estratos, aleatorios simple…

Para conocer la opinión de los médicos del sistema nacional de salud, podemos

elegir a varias regiones de España, dentro de ellas varias comarcas, y dentro de

ellas varios centros de salud, y…

Al extrapolar los resultados a la población se debe tener en cuenta el tamaño relativo del estrato con

respecto al total de la población.

Población

estratificada

Aleatorización

Page 5: Técnicas de muestreo

Ing. Isabel Escudero Página 5

Al igual que en el muestreo estratificado, al extrapolar los resultados a la

población hay que tener en cuenta el tamaño relativo de unos grupos con respecto

a otros.

Regiones con diferente población pueden tener probabilidades diferentes de ser

elegidas, comarcas, hospitales grandes frente a pequeños.

La población se agrupa en conglomerados, los cuales poseen la característica de

ser dispersos dentro de ellos, esto son elegido por ubicación geográfica.

Tamaño de la muestra, poblaciones finitas e infinitas

El tamaño de la muestra está condicionado por el método de muestreo utilizado, pero en este

caso para simplificar el cálculo del tamaño de la muestra vamos a determinar dicho tamaño

para un muestreo aleatorio simple ya que, generalmente, ese muestreo aleatorio simple exige

muestras superiores (para un mismo grado de fiabilidad o nivel de confianza) al resto de

procedimientos.

La expresión a utilizar para calcular el tamaño de la muestra es diferente según sea la

población finita o infinita. Se considera que una población es infinita cuando es mayor o igual

Muestra estratificada

Muestra por conglomerado

Page 6: Técnicas de muestreo

Ing. Isabel Escudero Página 6

a 10.000 individuos. Mientras que se considera que una población es finita cuando la

población es menor de 10.000 individuos. Para el caso en que la población es infinita la

expresión a utilizar es la siguiente:

Estas son las formulas claves para la determinación del tamaño de la muestra.

Muestreo aleatorio simple

𝒏 =𝒏′

𝟏 +𝒏′

𝑵

𝒏′ = 𝒁𝜶/𝟐𝑺

𝑬

𝟐

Donde:

n = Tamaño de la muestra N = Tamaño del universo (población) 𝑍𝛼/2= Valor crítico de la distribución Z. (nivel de confianza)

E = error S = desviación estándar

Muestreo proporcional (cuando existen investigaciones anteriores)

Poblaciones infinitas Poblaciones finitas

𝑛 =𝑍𝛼/22 𝑝𝑞

𝐸2 𝑛 =

𝑍𝛼/22 𝑝𝑞𝑁

𝑁 − 1 𝐸2 + 𝑍𝛼/22 𝑝𝑞

Donde:

n = Tamaño de la muestra N = Tamaño del universo (población) e = Error muestral p = Probabilidad de ocurrencia q = Probabilidad de no ocurrencia 𝑍∝/2 = Valor de confianza (1,96)

Page 7: Técnicas de muestreo

Ing. Isabel Escudero Página 7

Muestreo proporcional (cuando no existen investigaciones anteriores)

Poblaciones infinitas Nivel de confianza 95% Poblaciones finitas

𝑛 =4p𝑞

𝐸2

e Encuestas

𝑛 =4p𝑞𝑁

𝑁 − 1 𝐸2 + 4𝑝𝑞

1% 2% 3% 4% 5%

10.000 2.500 1.111 620 400

Poblaciones infinitas Nivel de confianza 99.7% Poblaciones finitas

𝑛 =9p𝑞

𝑒2

e Encuestas

𝑛 =9p𝑞𝑁

𝑁 − 1 𝐸2 + 9p𝑞

1% 2% 3% 4% 5%

22.500 5.625 2.500 1.400 900

Donde: p = Probabilidad de ocurrencia (0.5) q = Probabilidad de no ocurrencia (1-0.5) Por ejemplo: Sabiendo la población de camas en un hospital es de 100, considerando un e = 0.05, un nivel de confianza del 95% y el caso más común para p = 0.5 y para q=1-0.5 el tamaño de la muestra será:

𝑛 =𝑍𝛼

2 2 pqN

𝑁 − 1 𝐸2 + 𝑍𝛼2

2 pq

)50,0)(50,0()96,1()05,0)(1100(

)100)(50,0)(50,0()96,1(22

2

n

2079.1

04.96n

50.79n

80n

Page 8: Técnicas de muestreo

Ing. Isabel Escudero Página 8

Una vez calculado el tamaño de la muestra procedemos a realizar el cálculo estratificado de la siguiente manera:

Formula: 𝑛ℎ = 𝑛𝑁ℎ

𝑁

𝑛ℎ = Tamaño de muestra del estrato N = Tamaño de la muestra 𝑁ℎ = Población del estrato N = Población estadística

Clínica = 8020

100 = 16 camas

Cirugía = 8010

100 = 8 camas

Pediatría = 8050

100 = 40 camas

Gineco-obstetricia = 8020

100 =16 camas

El escogitamiento de las camas se lo realiza utilizando la aleatoriedad y similar a un sorteo, tabla de números aleatorios, realizando un listado de las camas, asignando números.

EJERCICIO 1: El departamento de turismo planea realizar muestreos en los centros de

información de visitantes que llegan a este territorio para determinar la proporción

de los turistas que van a acampar al Estado. Se tiene una información según la cual

35% de los visitantes va a acampar. De que tamaño habría que tomar la muestra para

estimar la proporción poblacional, con un nivel de confianza del 95% y un error del

2%? Se sabe que en promedio mensual 7000 visitantes llegan a los centros de

información.

Datos

p = 0.35

= 0.05

E = 0.02

N = 7000

𝑛 =𝑍𝛼

2 2 pqN

𝑁 − 1 𝐸2 + pq𝑍𝛼2

2

22

2

)96.1)(65.0)(35.0()02.0)(17000(

)7000)(65.0)(35.0()96.1(

n

0873964.07996.2

50.1592)8416.3(

n

673564.3

748.6117n

166634.1665 n

Page 9: Técnicas de muestreo

Ing. Isabel Escudero Página 9

1.1.1 Tamaño de la muestra en poblaciones a través de

intervalos de confianza.

RELACIÓN Media muestral Proporcional Intervalo de confianza

𝑥 ± 𝑍∝2

𝜎

𝑛

p ± 𝑍∝2 p(1 − p)

𝑛

Error máximo admisible

𝐸 = 𝑍∝2

𝜎

𝑛

𝐸 = 𝑍∝2 p(1 − p)

𝑛

Tamaño de muestra

𝑛 = 𝑍∝2

𝜎

𝐸 2

𝑛 = p(1− p) 𝑍∝

2

𝐸

2

NOTA:

Mientras más alto sea el nivel de confianza elegido mayor es el numero de la muestra

EJEMPLOS 1: Se desea estimar el número medio de días que viaja un vendedor

foráneo. En un estudio piloto la media encontrada es 150 días, y la desviación

estándar, 14 días. Si usted debe estimar la media poblacional en 2 días. ¿Cuántos

agentes foráneos habrá que tomar en la muestra? Use el nivel de confianza de 90%.

50x 14s

10.0

2E

2

22

E

sZn

2

22

)2(

)14()64.1(n

1344.133 n

0.005

99%

1.64-1.64

Se mamarán 134 agentes foráneos.

EJEMPLOS 2: Se desea realizar un estudio para estimar la proporción de la fuerza

laboral que tiene dos o más empleos. Se quiere un nivel de confianza de 95% y que la

proporción estimada no se aleje más de 2% de la proporción poblacional. En un

estudio piloto se encontró que 5 de los 50 entrevistados tenían más de dos empleos.

¿Cuántas personas de la fuerza laboral deberán entrevistarse para satisfacer los

requerimientos?

∝= 0.05 𝐸 = 0.02

p =5

50

Page 10: Técnicas de muestreo

Ing. Isabel Escudero Página 10

𝑛 = p(1− p) 𝑍

𝐸 2

2

02.0

96.1)90.0)(010.0(

n

86536.864 n

Deberán entrevistarse 865 personas de la fuerza laboral.

EJEMPLOS 2: En una muestra de suscriptores a una revista, se encontró que la media

del tiempo que usan Internet por semana es 13.4 horas, con una desviación estándar

de 6.8 horas. Encuentre el intervalo de confianza de 95% para la media del tiempo que

los suscriptores de la revista utilizan Internet.

hx 4.13 hs 8.6 05.0

𝐸 = 2ℎ

2

E

zsn

n

sZx

2

2

2

)8.6(96.1

hn

45

)8.6)(96.1(4.13

4541.44 n 99.14.13

99.14.1399.14.13

El intervalo de confianza de 95% para la media del tiempo que los suscriptores

utilizan internet se encuentra entre 11.41 y 15.39.