Download - Fundamentos de Muestreo

Introducción al Muestreo

INTRODUCCIÓN AL MUESTREO

Una investigación estadística de campo, atendiendo a su cobertura, únicamente puede hacerse de 2 formas:

a. Investigando todos y cada uno de los elementos dela población. CENSO

b. Investigando cada uno de los elementos de una parteo porción de la población, denominada muestra.ENCUESTA

De manera general, una encuesta comprende la metodología, los trabajos efectuados y los instrumentos utilizados para elaborar una inferencia acerca de las características de la población bajo estudio, y toma como base la información obtenida por la observación de una muestra.

El objetivo de las encuestas es evaluar variables que caracterizan un agregado de la población, a través de la observación de un subconjunto llamado “muestra”.

ENCUESTA

Clasificación de las encuestas

ENE FEB MAR ABR MAY JUN JUL AGO SEP OCT NOV DIC

AÑO 2010

Transversal

Longitudinal

Por su frecuencia:

1. Transversal

2. Longitudinal

2.1. Paneles Fijos

2.2. Paneles Rotativos

2.1.1. Continuos

2.1.2. Por intervalos de tiempo

2.2.1. Continuos

2.2.2. Por intervalos de tiempo

Por su frecuencia:

Clasificación de las encuestas

Un panel: es una muestra en la que se miden los mismos elementos en dos o más ocasiones.

a. Su realización es menos costosa en comparación con el censo.

b. Mayor rapidez y oportunidad en la recopilación y análisis de datos.

c. Capacitación más intensiva y supervisión más cuidadosa para el personal de la encuesta debido al número de personal involucrado en la encuesta.

d. Permite flexibilidad en los temas cubiertos por la encuesta.

e. Mejor calificación y mayor capacidad del personal de campo de una encuesta.

f. Es menos notoria que el censo y no constituye un fardo tan pesado para la buena voluntad del público.

g. Capacidad de aplicar análisis estadísticos avanzados.h. Es el único procedimiento utilizado para medir fenómenos

cambiantes en el corto plazo debido a su costo relativamente bajo.

VENTAJAS DE LA ENCUESTRA

• No cubre la población total.• Los resultados son cien porciento confiables a nivel

muestral.• Dificultad para evitar el rechazo y la no respuesta.• La aceptación pública es más difícil de alcanzar para

datos completos.• Dificultad de determinar si los entrevistados responden

honestamente.• Acepta un grado de error en la estimación.• Necesita recurrir a un proceso inferencial para generar

resultados validos a la población total (ya que supone de un instrumento delicado y complejo).

DESVENTAJAS DE LA ENCUESTRA

MUESTREO

El muestreo consiste en la selección de un número relativamente pequeño de elementos tomado de un grupo de elementos definido mayor, con la expectativa de que la información recogida del grupo menor permita que se hagan inferencias sobre el grupo mayor.

TIPOS DE MUESTREO

a. Probabilístico o científico. b. No probabilístico.

MUESTREO PROBABILÍSTICO

Es el tipo de muestreo que se basa en la Ciencia Matemática y Estadística (cálculo de probabilidades).

Existen numerosas variaciones en el muestreo probabilístico, pero todas comparten un rasgo común: la selección de las unidades para la muestra se realiza por procedimientos aleatorios y con probabilidades conocidas de selección.

Las muestras probabilísticas se diseñan generalmente para que sean medibles, es decir, se diseñan de tal manera que la inferencia estadística a valores de la población pueda basarse enmedidas de variabilidad, generalmente errores estándar, calculados a partir de datos de una muestra.

PROCEDIMIENTOS ALEATORIOS (AZAR) Y PROBABILIDADES CONOCIDAS DE SELECCIÓN

NÚMEROS

123456

1/61/61/61/6

1/61/6

En el muestreo probabilístico, cada elemento de la población tiene una probabilidad conocida y no nula de ser seleccionado.

MUESTREO NO PROBABILÍSTICOO MUESTREO DE MODELOS

El muestreo no probabilístico incluye todos los métodos en que las unidades NO se seleccionan por procedimientos al azar o con probabilidades conocidas de selección.

Se le llama también muestreo de modelos, porque se basa en suposiciones muy amplias acerca de la distribución de las variables de una muestra de la población.

Población de viviendas

Muestra deviviendas

Limitante:No es posibleestimar

Importancia del Muestreo Probabilístico

1. Su medibilidad lleva a inferencias estadísticas objetivas, en contraste con las inferencias subjetivas que se obtienen en el muestreo no probabilístico.

2. Como sucede con cualquier método científico, éste permite mejoramientos acumulativos a través de la separación y la evaluación objetiva de sus fuentes de errores.

3. Cuando los métodos simples fallan, los investigadores acuden al muestreo probabilístico.

El muestreo probabilístico es importante por tres razones:

La base de una buena encuesta por muestreo esla muestra.

Subconjunto o parte constituida de “n” elementos, tomados o seleccionados de una población de “N”elementos, la cual reúne ciertas características que la hacen ser representativa, significativa y confiable, y que en base a ella se pueden hacer inferencias válidas respecto a la población total de la cual procede.

LA MUESTRA

POBLACIÓN

N

nMUESTRA

Una buena muestra debe reunir tres características esenciales:

a. Representativa: en el sentido de que cada unidad muestreada representará las características de una cantidad conocida de unidades de la población.

b. Significativa: en relación a la precisión de las estimaciones (error muestral considerado).

c. Confiable: al considerar un valor de “Z” en la distribución normal, lo cual indica el nivel de confiabilidad aceptado para la muestra.

Conceptos Básicos

Los elementos de una población son las unidades de las que se busca la información; son los individuos, las unidades elementales que forman la población acerca de la cual se van a hacer inferencias. Son las unidades de análisis, y su naturaleza se determina mediante los objetivos de la encuesta.

Elementos de una población

Población

La población se define conjuntamente con los elementos: la población es el agregado de los elementos, y los elementos son las unidades básicas que forman y definen la población. Esta debe definirse en términos de: a) el contenido; b) las unidades; c) la extensión, y d) el tiempo.

Es una expresión numérica que sintetiza los valores de una o varias características de los N elementos de una población completa; es una medida resumida de la cualidad de la distribución de la variable o variables en la población definida.

Valor de la población:

Valor verdaderoEl valor verdadero es aquel que se obtendría de todos los elementos de la población, si las observaciones no estuvieran sujetas a error.

La investigación por medio de encuestas tiene por objeto estimar valores específicos de la población:

Valor de la muestra o estadísticaEs una estimación que se calcula a partir de los n elementos de una muestra.

Los errores de muestreo son aquellos que ocurren porque solamente se designa una parte de la población total para que sea observada en la muestra.

Error muestral

En una encuesta probabilística se manifiestan dos tipos de errores:

Se presentan porque los procedimientos de observación son imperfectos.

Ejemplo: equivocaciones y deficiencias durante el desarrollo y ejecución de los procedimientos de la encuesta, definiciones concebidas erróneamente, imperfecciones en los planes de tabulación, preguntas mal formuladas, errores en el procesamiento de los datos, deficiencias en el marco de muestreo y la no respuesta.

Errores no muestrales

Es aquella para la cual se desea obtener información estadística. Se define como: el objeto, institución, región, persona, familia, animal etc. que va a ser sometido al estudio, en cuanto a aquellas características que más interesan.

Unidad de análisis ounidad de observación

Son las unidades que se utilizan para constituir o seleccionar la muestra (unidad de selección).

Unidad de muestreo

La unidad de información es aquella que provee información de las unidades de análisis.

Unidad de información

En el muestreo probabilístico se distinguen tres tipos de unidades:

Es un conjunto finito de unidades (personas, viviendas, instituciones, etc.), denominadas unidades de muestreo, sobre las cuales se desea aplicar el proceso de selección.

MARCO MUESTRAL

Se pueden distinguir dos tipos de marcos:

1. Marco en forma de listado (elementos):

En el cual cada unidad de marco esta asociada con un único elemento de la población objetivo. Un muestreo de elementos puede ser obtenido directamente a partir del marco. Un listado de empleados de una compañía, un listado de clientes de una tarjeta de crédito, un listado de las cuentas corrientes de un banco, son algunos ejemplos de este tipo de marco.

2. Marco de grupos (conjuntos de elementos):

En el cual cada unidad del marco esta asociada con varios elementos de la población objetivo. En este caso el muestreo no es tan directo, ya que primero se seleccionan algunos grupos y luego se observan todos o algunos de los elementos pertenecientes a los grupos seleccionados.

Un caso especial y muy importante de marcos de grupos es el marco de áreas, que se emplea principalmente para seleccionar viviendas, aunque también puede usarse para seleccionar locales comerciales (farmacias, heladerías, venta de electrodomésticos, etc.), escuelas, centros asistenciales, etc. Como su nombre lo indica, el marco de áreas esta formado por unidades territoriales delimitadas geográficamente.

Es una fórmula algebraica que permite agregar o combinar las respuestas o mediciones hechas sobre una variable o atributo en las unidades seleccionadas. Formalmente y en general en una muestra de tamaño “n” el estimador relaciona a los “n” valores de la variable en cuestión y lo que se busca con él es que brinde una aproximación al parámetro.

El estimador se clasifica en puntual cuando hace referencia a un solo valor o punto calculado, y por intervalos cuando corresponde a dos puntos dentro de los cuales se considera estará contenido el parámetro, con cierto grado de confiabilidad establecido por el investigador.

ESTIMADOR

Parámetros estimados enmuestreos probabilísticos

En general, interesa la estimación de alguno de los siguientes parámetros o características de la población:

Variable Parámetro a estimar ( )θ

Cuantitativa Total ( )τ Media ( )Y Razón ( )R

Cualitativa Total de

clase ( )τ Proporción ( )P

La inferencia estadística se basa en los errores estándar, y ésta toma típicamente la forma:

( )pt s yθ ± Esto denota el enunciado de que el valor poblacional está dentro del intervalo:

p pt s(y) t s(y)aθ − θ + Y la probabilidad P de este enunciado es función (en general aproximadamente normal) de la constante escogida tp (desvío t).

Diseño de encuestas y diseño de muestras

MUESTREO DE ENCUESTASO MUESTREO DE POBLACIÓN

Estudia los métodos para seleccionar y observar una parte (muestra) de la población con el fin de hacer inferencias acerca de toda la población.

El muestreo de encuestas se concentra en el estudio de muestras probabilísticas para estimar valores de la población.

Diseño de encuestas y diseño de muestras

El diseño de muestras tiene dos aspectos:

Un proceso de selección: que consiste en las reglas y operaciones mediante las cuales se incluyen en la muestra algunos miembros de la población.

Un proceso de estimación: para calcular las estadísticas de la

muestra, que son estimaciones muestrales de valores de la

población. Frecuentemente interesa la aplicación de alguna de

las siguientes medidas en la estimación: la media o promedio, el

total, la proporción (tasas) y la razón.

El diseño de encuestas incluye además otros aspectos importantes que pueden llamarse conjuntamenteobjetivos de la encuesta.

Objetivos de la encuesta:

La definición de las variables de la encuesta: debe especificar la naturaleza de las características, las reglas de la categoría de clasificación, y las unidades para expresarlas. Debe determinar también el alcance y el contenido de la población de la encuesta.

Los métodos de observación (medición): que incluyen tanto la

recolección como el procesamiento de datos.

Los métodos de análisis: que incluyen tanto los estadísticos

como los sustanciales. Con ello se reduce la encuesta a

resultados que puedan comprenderse y utilizarse.

La utilización de los resultados de la encuesta: que en

ocasiones, puede tomar la forma de decisiones concretas

basadas en los resultados de la encuesta y de información

proveniente de otras fuentes.

La precisión: que se desea que tengan los resultados de la encuesta, para llegar a una decisión estadística especificada.

Los objetivos de la encuesta deben determinar el diseño de la muestra**

Criterios del diseño de una muestra

El muestreo de encuestas se ocupa principalmente de modificaciones al muestreo irrestricto aleatorio. Las que impliquen una mayor complejidad deberán justificarse con vigorosas consideraciones.

Un buen diseño de muestreo requiere que se equilibren sensatamente cuatro amplios criterios:

1. Orientación hacia la meta: el diseño completo, tanto en la selección como en la estimación, debe orientarse a los objetivos de la investigación, hechos a la medidas del diseño de la encuesta y ajustados a las condiciones de la encuesta.


2. La medibilidad: es una característica de los diseños que permite calcular, a partir de la propia muestra, estimaciones válidas o aproximaciones a su variabilidad de muestreo (esto se suele expresar en las encuestas con errores estándar).

La medibilidad es la base necesaria para la inferencia estadística, y sirve como puente científico y objetivo, entre el resultado de la muestra y el valor desconocido de la población.

La teoría de la inferencia estadística depende de muestreo probabilísticos, es decir, muestreos en los que se conoce la probabilidad de selección de cada elemento de la población.


3. La practicidad: se refiere a los problemas que deben resolverse para llevar a cabo el diseño esencialmente como se propuso.

Se requiere de cuidado para traducir el modelo de selección teórico a un conjunto de instrucciones de oficina y campo. Estas instrucciones deben ser simples, claras, prácticas y completas.

4. La economía: se refiere a cumplir los objetivos de la encuesta con un costo (esfuerzo) mínimo y al grado (precisión) en que se alcanza este objetivo.

Clases de Muestras

CLASES DE MUESTRAS PROBABILÍSTICAS

1.Muestreo aleatorio simple.2.Muestreo estratificado.3.Muestreo estratificado aleatorio.4.Muestreo aleatorio sistemático.5.Muestreo por conglomerados o áreas.6.Muestreo monotápico.7.Muestreo bietápico.8.Muestreo polietápico.9.Muestreo simple.10.Muestreo doble o bifásico.11.Muestreo múltiple o polifásico.12.Muestreo balanceado.13.Métodos mixtos.

CLASES DE MUESTRAS NO PROBABILÍSTICAS

1.Muestreo por conveniencia.2.Muestreo por juicio.3.Muestreo por cuotas.4.Muestreo por bola de nieve.5.Muestreo de poblaciones móviles.

MUESTREO ALEATORIO SIMPLE MUESTREO IRRESTRICTO ALEATORIO

(Sin reemplazamiento )

n

N

Es la forma esencial del muestreo probabilístico. Es un método de selección de muestras en la cual las unidades se eligen individual y directamente por medio de un proceso aleatorio, cada unidad muestral que forma parte de la población meta definida tiene una probabilidad conocida, igual y diferente de cero de ser elegida.

MUESTREO ALEATORIO SIMPLEO MUESTREO IRRESTRICTO ALEATORIOPoblación de N unidades elementales

Muestra “n”

3 14

16

42

38

3528

36

32

25

22

49

21

34

44

3033

17

29

4 59

31

7

15

2423

39

6

2

585

40

57

13

9

26

5551

47

18

48

37

20

12

8

1

54

10 5243

56

11

4653

60

61

62

63

n = 550

19

2741

45

El muestreo irrestricto aleatorio (mia) consiste en la selección de n unidades elementales entre los N elementos que constituyen una población, de modo que todas las muestras posibles de tamaño n (tantas como combinaciones de N elementos de n en n) tengan la misma probabilidad 1/(N n) de ser obtenidas.

Propiedades del muestreo irrestricto aleatorio (mia)

Con este supuesto, por ser equiprobables todas las muestras de n elementos, la probabilidad de que un elemento poblacional dado forme parte de la muestra se puede calcular así:

N 1

n 1#muestras _ favorables n

N#muestras _ posibles N

n

− − = =

Ejemplo: si se dispone de una población de tamaño N= {A, B, C, D, E, F} y se obtiene una muestra irrestricta aleatoria de n = 3, entonces:

6 1 5

3 1 2 10 n 30.5 0.5

6 6 20 N 6

3 3

− − = = = = = =

En el mia, al seleccionar la primera una unidad elemental de una muestra, con los N-1 restantes pueden hacerse (N-1 n-1) combinaciones que completan la muestra de n.

Por consiguiente, todos los elementos tienen la misma probabilidad n/N de ser extraídos (y 1/N de serlo en determinado lugar). Recíprocamente, si el supuesto es que todos los elementos son equiprobables, la probabilidad de una muestra constituida por n elementos dados es:

Propiedades del muestreo irrestricto aleatorio (mia)

11 1 1n!

NN N 1 N n 1

n

=∗ − − +

…

Continuando con el ejemplo anterior, para una muestra de n=3 de una población N=6, se observa lo siguiente en un muestreo irrestricto aleatorio:

11 1 13!* *

N6 5 4

n

= =

116

20120

= =

0.05 0.05=

016.811.204.007612Media

86.54.336.671422096520

613.59.006.001261896319

5149.335.671151795318

23.52.334.67701465317

424.516.335.331181696116

32416.005.001071595115

010.57.004.00621265114

12617.334.33911393113

-29.56.333.33461063112

-364.003.0035953111

331.521.005.001171596010

230.520.334.67106149509

-115.510.333.6761116508

031.521.004.0090129307

-313.59.003.004596306

-49.56.332.673485305

-236.524.333.3382109104

-515.510.332.333776103

-610.57.002.002665102

-83.52.331.331043101

y - fYvar (y)s2mediay2yy3y2y1n

9876543210

Ejemplo: una población de N=6 elementos tiene los valores Yi ={0, 1, 3, 5, 6, 9}

El total de la población es Y=24 y la media de la población es Y/N = 24/6 = 4. La ΣYi

2 = 152, y tenemos que la varianza por elemento es Sy2=(ΣYi

2-(Y2/N))/(N-1)=11.2

Una muestra irrestricta aleatoria de n=3 elementos resulta en f = n/N = 0.5. La distribución de muestreo contiene (N n) = 20 muestras posibles en la columna 1, 2 y 3. cada uno de los elementos aparece f = 0.5 de las muestras.

Se puede ver que las estimaciones muestrales de y en la columna 4 varían. Su promedio o valor esperado es de 12, los que nos señala que E(y)=fY, que y es un estimador insesgado de fY. Entonces y/f es un estimador insesgado de Y, y y/n lo es de la media poblacional.

Nótese que en la columna 5 el valor esperado de Σyi

2=76, igual a fΣYi2 y por lo tanto es un

estimador insesgado.

Nótese que para una Var(y)=(1-n/N)nSy2 = 16.8.

Las varianzas calculadas en la columna 8 varían grandemente, pero su esperanza es 16.8; por tanto, E[var (y)] = Var (y) y en lasdesviaciones de (y-fY) en la distribución de la muestra también se ve que E[y-E(y)]=0 puestoque y es un estimador insesgado.

1s(y) 2s(y) 3s(y)-1s(y)-3s(y) -2s(y) E(y)

DISTRIBUCIÓN DE MUESTREO

Pc

Probabilidad (Pc) de yc

YVY

Una muestraEspecificada y´

Error estándar de ( ) 2y s(y) E y E y= = −

Sesgo de muestreo E(y) Y= −

Sesgo no de muestreo VY Y= −

Error total de una muestra especifica

Vy Y−

La distribución de muestreo de un estimador (media) es la distribución teórica de todos los valores posibles del estimador (yc), cada uno con una probabilidad de materialización (PC).

Los valores posibles y sus probabilidades dependen del diseño de muestreo (tamaño, selección y estimación) aplicado a una población fija de características.

La media de la distribución de muestreo es el valor esperado (o la esperanza matemática E(y)) del estimador.

Este valor medio E(y) puede ser igual al valor de la población Y, o puede no serlo.

Estimadores en el muestreo irrestricto aleatorio:

Los estimadores son funciones matemáticas de la información proporcionada por las unidades elementales de una muestra. En general, interesa la estimación alguno de los siguientes parámetros o características de la población:

Variable Parámetro a estimar ( )θ

Cuantitativa Total ( )τ Media ( )Y Razón ( )R

Cualitativa Total de

clase ( )τ Proporción ( )P

Estimadores en un muestreo irrestricto aleatorio

Por definición, la media aritmética poblacional se obtiene de:

N1 2 3 N

jj 1

y y y ... y 1Y y

N N =

+ + + += = ∑

Por lo que utilizaremos como estimador de la media poblacional la media muestral:

n1 2 3 n

jj 1

y y y ... y 1Y y

n n =

+ + + += = ∑

Estimador de la media


La varianza verdadera de una población está dada por:N N

2 2 2j j

j 1 j 12v

(y Y) y NY

SN N

= =

− −

= =∑ ∑

La varianza de la media en un mia se obtiene de:2S

var(y) (1 f)n

= −

Varianza y error estándar del estimador de la media

En donde:n

2 2j2nn

j 122 2jj

j 1j 1

n y yy1 1

yS (y y)nn 1 n 1 n(n 1)

=

==

−

−= − = = − − −

∑∑∑

Simplificada (cuasi-varianza)

N2

jj 12

(y Y)

SN 1

=

−

=−

∑

El error estándar de la media muestral es la raíz cuadrada de su varianza:

ss(y) var(y) 1 f

n= = −


Por definición, el total poblacional se obtiene de:

N

1 2 3 N jj 1

Y (y y y ... y ) y=

= + + + + =∑

Estimador del total

Por lo tanto, un estimador simple de Y en un mia es el siguiente:

O bien, Y NY=

Y Ny=

y su error estándar se estima mediante:

O bien,

n

jj 1

NY y

n =

= ∑Varianza y error estándar del estimador de un total

2Sˆvar(Y) (1 f)n

= − donde:

n2 2j2nn

j 122jj

j 1j 1

n y yy1 1ˆ yvar(Y) (y y)nn 1 n 1 n(n 1)

=

==

−

−= − = = − − −

∑∑∑

sˆs(Y) N var(y) N 1 fn

= = −


Por definición, en una población constituida por a1, a2,…aN elementos que poseen una característica cualitativa o atributo, definimos la proporción como el cociente de la suma de los N valores de ai por el número de elementos de la población N.

Estimador de una proporción (características cualitativas o atributos)

N

ii 1

aA

PN N== =∑

y la antiproporción Q 1 P= −

Por lo tanto, un estimador simple de P en el mia está dado por el cociente:n

ii 1

aa

Pn n

== =∑ y el total de la clase

n

ii 1

N NA a a Np

n n=

= = =∑

Varianza y error estándar del estimador de una proporción

p(1 p)ˆvar(P) (1 f)n 1

−= −

−

1 p(1 p) 1ˆs(P) var(p) (1 f)2n n 1 2n

−= + = − +

−

Nota técnica: La distribución de p de una muestra irrestricta aleatoria se llama distribución hipergeométrica debido a su selección sin reemplazamiento.


Por definición, la razón es aquella que mide la relación entre dos variables, permitiendo su comparación, calculado generalmente por cociente.

Estimador de razón

N N

i ij 1 j 1

N N

i ij 1 j 1

1y y

N YR

1 Xx x

N

= =

= =

= = =∑ ∑

∑ ∑

Por lo tanto, un estimador simple de R en un mia es el siguiente:

n n

i ij 1 j 1

n n

i ij 1 j 1

1y y

n yR

1 xx x

n

= =

= =

= = =∑ ∑

∑ ∑

Varianza y error estándar del estimador de una razón

n n n n2 2 2 2

j j j j j jj 1 j 1 j 1 j 1

2 2

ˆ ˆ ˆ(y Rx ) y 2R y x R x1 f 1 fˆvar(R)nx n 1 nx n 1

= = = =

− − +− −

= ⋅ = ⋅− −

∑ ∑ ∑ ∑

y su error estándar se estima mediante:

n n n n2 2 2 2

j j j j j jj 1 j 1 j 1 j 1

ˆ ˆ ˆ(y Rx ) y 2R y x R x1 f 1 fˆs(R)

n 1 n 1nx nx

= = = =

− − +− −

= ⋅ = ⋅− −

∑ ∑ ∑ ∑

MUESTREO ALEATORIO SISTEMÁTICOO MUESTREO SEUDOALEATORIO

(supuesto aleatorio)

n

N

Método de muestreo que denota la selección de las unidades de una muestra, de k en k (unidad de muestreo k-ésima), a partir de uno de ellos elegido aleatoriamente entre los que ocupan el lugar primero y el i-ésimo lugar en una población objeto de estudio.

Universo “N”

22 232018 191716 30292826 272524

37 38363533 3432 454443424039

52 535048 494746 60595856 575554

7 8653 42 15141312109

Muestra

n = 6

Selección aleatoria = 41

Datos:

K = 60 / 6 = 10

N = 60

K = 101 11

213141

51

MUESTREO ALEATORIO SISTEMÁTICOO MUESTREO SEUDOALEATORIO

NOTA: Cuando el origen no es aleatorio (paso 1 selección aleatoria), el muestreo puede denominarse rígida o estrictamente sistemático y deja de ser probabilístico.

Ran# = 0.683

Paso 1: Selección aleatoria

0.683 x 60 = 40.98 = 41

Paso 2: Intervalo KK = N / n

Estratificación: proceso mediante el cual se agrupan los elementos de una población conforme a determinadas características comunes.

El muestreo estratificado indica la selección a partir de varias subpoblaciones, llamadas estratos, en los cuales se ha dividido la población.

Razones principales para recurrir a la estratificación:

•Se pueden formar los estratos para utilizar diferentes métodos de muestreo y procedimientos dentro de ellos (diseños muestrales eficientes).

•Disminuir o minimizar las varianzas de las estimaciones de la muestra; con lo que se contribuye a reducir el número de observaciones en la muestra.

•Obtener estimaciones separadas por estrato; los estratos también pueden ser dominios de estudio. Un dominio de estudio es una parte de la población para la cual se han planeado estimaciones separadas en el diseño de una muestra.

MUESTREO ESTRATIFICADO

La formación de estratos requiere determinar:

1. Las variables de estratificación.

2. Numero de estratos.

3. Los límites de los estratos

-Métodos univariados.-Métodos multivariados.

-De acuerdo a las necesidades del estudio.-Con base a la reducción de la varianza.

Criterios de varianza mínima (dado un tamaño de n se debe determinar los límites que minimicen la varianza)

MUESTREO ESTRATIFICADO

N1

n

N2N3

AfijaciónSe denomina afijación, al modo

de distribuir las unidades de una

muestra entre los diferentes

estratos.

MUESTREO ESTRATIFICADO ALEATORIO

POBLACIÓN 1 POBLACIÓN 2 POBLACIÓN 3 POBLACIÓN 4

Si se parte de una población de N unidades elementales, que se encuentra dividida en L subpoblaciones (estratos o subclases) de N1, N2 ….NL unidades elementales cada uno, y posteriormente seleccionamos una muestra irrestricta aleatoria independiente en cada estrato, entonces el procedimiento se denomina muestreo estratificado aleatorio.

np

n4

np

n1

np

n2

np

n3

nT

MUESTREO POR CONGLOMERADOS O ÁREAS

N = conglomerados (que formarán las unidades de muestreo)

n = muestra de 2conglomeradosde elementos.

Conjunto de elementos

Método de muestreo cuya unidad de muestreo o de selección, contiene más de un elemento de la población.

Unidad de análisis:

Población de viviendasdel departamento deHuehuetenango.

Intervalos de 40

minutosVehículosOrigen y destino

Tránsito anual en

un puente

PueblosAdultosActitudes socialesGente de pueblo

Salones de claseEstudiantesPlanes de carrerasUniversidades

Vuelos

Pasajeros que

salen

Información acerca

de viajesAeropuerto

ViviendasPersonasCompras de ropaCiudad B

ManzanasViviendas

Características de la

viviendaCiudad A

CONGLOMERADOS O

UNIDADES DE

MUETREO

ELEMENTOSVARIABLESPOBLACIÓN OBJETIVO

Ejemplos de muestreos porconglomerados

MUESTREO MONOTÁPICO, BIETÁPICO, TRIETÁPICO Y POLIETÁPICO

Muestra de primera etapa (MONOTÁPICO)

Muestra de segunda etapa(BIETÁPICO)

Muestra de tercera etapa(TRIETÁPICO)

Muestra de más de tres etapas(POLIETÁPICO)

El muestreo bietápico, trietápico y polietápico emplea una jerarquía de unidades de muestreo o conglomerados, de manera que el elemento pertenezca únicamente a una unidad de muestreo en cada etapa.

MUESTRAS NOPROBABILÍSTICAS

MUESTREO POR CONVENIENCIA O MUESTREO ACCIDENTAL

(MUESTRAS CASUALES O FORTUITAS)

MUESTREO POR JUICIO (SELECCIÓN EXPERTA)

MUESTREO POR CUOTAS

MUESTREO DE LA BOLA DE NIEVE

MUESTREO DE RECOMENDACIÓN

= medido y marcadomedido (2da. ocasión) =

Métodos de captura-marca-recapturaMétodos de captura-marca-recaptura

Muestreo de poblaciones móviles

Tamaño de la muestra

POBLACIÓN 3POBLACIÓN 1 POBLACIÓN 2

Muestra 3

Muestra 1Muestra 2

El tamaño de una muestra está estrechamente relacionado con el tipo de muestreo aplicado en un estudio (probabilístico o no probabilístico).

En muestreos de tipo no probabilístico el tamaño de la muestra suele determinarse de la siguiente manera:

TAMAÑO ADECUADO DE LA MUESTRA

1. A través de un juicio subjetivo, intuitivo, que hace el investigador basándose en estudios pasados.

2. En función de los costos y las limitaciones financieras de una encuesta.

Para el caso del tamaño de la muestra en un muestreo probabilístico, el investigador debe considerar lo precisosque tienen que ser los estimados y de cuánto tiempo y dinero dispone para recolectar los datos requeridos, pues esta tarea de recolección es generalmente una de las partes más costosas del estudio.

Hay tres factores que tienen una función importante en la determinación de los tamaños de muestra apropiados en un diseño muestral probabilístico (no incluyen los recursos y el tiempo):

TAMAÑO ADECUADO DE LA MUESTRA

a. Variabilidad de la característica de población que se investiga: Cuando mayor sea la variabilidad de la característica, mayor será el tamaño de la muestra necesaria.

El nivel de ingresos en Guatemala

BAJO

ALTO

b. Nivel de confianza deseado en el estimado: Cuando más alto sea el nivel de confianza que se desee, mayor será el tamaño de la muestra necesario.

Confianza: grado de certeza de que la estimación obtenida con la muestra contenga al valor verdadero del parámetro. Por ejemplo, si se dice que el nivel de confianza es de 95%, esto significa que el valor del parámetro poblacional se encontrará dentro del intervalo especificado en 95 de cada 100 muestras posibles.

95 % 2.5 %2.5 %

Nivel de confiabilidad asumido en el diseño muestral

Error asumido en el diseño muestral

Error asumido en el diseño muestral

θ

c. Grado de precisión deseado en la estimación de la característica de la población: Cuanto más precisos sean los resultados de la muestra que se requieren (esto es, cuando menor sea el error), mayor será el tamaño de muestra necesario.

GRACIAS POR SUATENCIÓN