Introducción al Muestreo
INTRODUCCIÓN AL MUESTREO
Una investigación estadística de campo, atendiendo a su cobertura, únicamente puede hacerse de 2 formas:
a. Investigando todos y cada uno de los elementos dela población. CENSO
b. Investigando cada uno de los elementos de una parteo porción de la población, denominada muestra.ENCUESTA
De manera general, una encuesta comprende la metodología, los trabajos efectuados y los instrumentos utilizados para elaborar una inferencia acerca de las características de la población bajo estudio, y toma como base la información obtenida por la observación de una muestra.
El objetivo de las encuestas es evaluar variables que caracterizan un agregado de la población, a través de la observación de un subconjunto llamado “muestra”.
ENCUESTA
Clasificación de las encuestas
ENE FEB MAR ABR MAY JUN JUL AGO SEP OCT NOV DIC
AÑO 2010
Transversal
Longitudinal
Por su frecuencia:
1. Transversal
2. Longitudinal
2.1. Paneles Fijos
2.2. Paneles Rotativos
2.1.1. Continuos
2.1.2. Por intervalos de tiempo
2.2.1. Continuos
2.2.2. Por intervalos de tiempo
Por su frecuencia:
Clasificación de las encuestas
Un panel: es una muestra en la que se miden los mismos elementos en dos o más ocasiones.
a. Su realización es menos costosa en comparación con el censo.
b. Mayor rapidez y oportunidad en la recopilación y análisis de datos.
c. Capacitación más intensiva y supervisión más cuidadosa para el personal de la encuesta debido al número de personal involucrado en la encuesta.
d. Permite flexibilidad en los temas cubiertos por la encuesta.
e. Mejor calificación y mayor capacidad del personal de campo de una encuesta.
f. Es menos notoria que el censo y no constituye un fardo tan pesado para la buena voluntad del público.
g. Capacidad de aplicar análisis estadísticos avanzados.h. Es el único procedimiento utilizado para medir fenómenos
cambiantes en el corto plazo debido a su costo relativamente bajo.
VENTAJAS DE LA ENCUESTRA
• No cubre la población total.• Los resultados son cien porciento confiables a nivel
muestral.• Dificultad para evitar el rechazo y la no respuesta.• La aceptación pública es más difícil de alcanzar para
datos completos.• Dificultad de determinar si los entrevistados responden
honestamente.• Acepta un grado de error en la estimación.• Necesita recurrir a un proceso inferencial para generar
resultados validos a la población total (ya que supone de un instrumento delicado y complejo).
DESVENTAJAS DE LA ENCUESTRA
MUESTREO
El muestreo consiste en la selección de un número relativamente pequeño de elementos tomado de un grupo de elementos definido mayor, con la expectativa de que la información recogida del grupo menor permita que se hagan inferencias sobre el grupo mayor.
TIPOS DE MUESTREO
a. Probabilístico o científico. b. No probabilístico.
MUESTREO PROBABILÍSTICO
Es el tipo de muestreo que se basa en la Ciencia Matemática y Estadística (cálculo de probabilidades).
Existen numerosas variaciones en el muestreo probabilístico, pero todas comparten un rasgo común: la selección de las unidades para la muestra se realiza por procedimientos aleatorios y con probabilidades conocidas de selección.
Las muestras probabilísticas se diseñan generalmente para que sean medibles, es decir, se diseñan de tal manera que la inferencia estadística a valores de la población pueda basarse enmedidas de variabilidad, generalmente errores estándar, calculados a partir de datos de una muestra.
PROCEDIMIENTOS ALEATORIOS (AZAR) Y PROBABILIDADES CONOCIDAS DE SELECCIÓN
NÚMEROS
123456
1/61/61/61/6
1/61/6
En el muestreo probabilístico, cada elemento de la población tiene una probabilidad conocida y no nula de ser seleccionado.
MUESTREO NO PROBABILÍSTICOO MUESTREO DE MODELOS
El muestreo no probabilístico incluye todos los métodos en que las unidades NO se seleccionan por procedimientos al azar o con probabilidades conocidas de selección.
Se le llama también muestreo de modelos, porque se basa en suposiciones muy amplias acerca de la distribución de las variables de una muestra de la población.
Población de viviendas
Muestra deviviendas
Limitante:No es posibleestimar
Importancia del Muestreo Probabilístico
1. Su medibilidad lleva a inferencias estadísticas objetivas, en contraste con las inferencias subjetivas que se obtienen en el muestreo no probabilístico.
2. Como sucede con cualquier método científico, éste permite mejoramientos acumulativos a través de la separación y la evaluación objetiva de sus fuentes de errores.
3. Cuando los métodos simples fallan, los investigadores acuden al muestreo probabilístico.
El muestreo probabilístico es importante por tres razones:
La base de una buena encuesta por muestreo esla muestra.
Subconjunto o parte constituida de “n” elementos, tomados o seleccionados de una población de “N”elementos, la cual reúne ciertas características que la hacen ser representativa, significativa y confiable, y que en base a ella se pueden hacer inferencias válidas respecto a la población total de la cual procede.
LA MUESTRA
POBLACIÓN
N
nMUESTRA
Una buena muestra debe reunir tres características esenciales:
a. Representativa: en el sentido de que cada unidad muestreada representará las características de una cantidad conocida de unidades de la población.
b. Significativa: en relación a la precisión de las estimaciones (error muestral considerado).
c. Confiable: al considerar un valor de “Z” en la distribución normal, lo cual indica el nivel de confiabilidad aceptado para la muestra.
Conceptos Básicos
Los elementos de una población son las unidades de las que se busca la información; son los individuos, las unidades elementales que forman la población acerca de la cual se van a hacer inferencias. Son las unidades de análisis, y su naturaleza se determina mediante los objetivos de la encuesta.
Elementos de una población
Población
La población se define conjuntamente con los elementos: la población es el agregado de los elementos, y los elementos son las unidades básicas que forman y definen la población. Esta debe definirse en términos de: a) el contenido; b) las unidades; c) la extensión, y d) el tiempo.
Es una expresión numérica que sintetiza los valores de una o varias características de los N elementos de una población completa; es una medida resumida de la cualidad de la distribución de la variable o variables en la población definida.
Valor de la población:
Valor verdaderoEl valor verdadero es aquel que se obtendría de todos los elementos de la población, si las observaciones no estuvieran sujetas a error.
La investigación por medio de encuestas tiene por objeto estimar valores específicos de la población:
Valor de la muestra o estadísticaEs una estimación que se calcula a partir de los n elementos de una muestra.
Los errores de muestreo son aquellos que ocurren porque solamente se designa una parte de la población total para que sea observada en la muestra.
Error muestral
En una encuesta probabilística se manifiestan dos tipos de errores:
Se presentan porque los procedimientos de observación son imperfectos.
Ejemplo: equivocaciones y deficiencias durante el desarrollo y ejecución de los procedimientos de la encuesta, definiciones concebidas erróneamente, imperfecciones en los planes de tabulación, preguntas mal formuladas, errores en el procesamiento de los datos, deficiencias en el marco de muestreo y la no respuesta.
Errores no muestrales
Es aquella para la cual se desea obtener información estadística. Se define como: el objeto, institución, región, persona, familia, animal etc. que va a ser sometido al estudio, en cuanto a aquellas características que más interesan.
Unidad de análisis ounidad de observación
Son las unidades que se utilizan para constituir o seleccionar la muestra (unidad de selección).
Unidad de muestreo
La unidad de información es aquella que provee información de las unidades de análisis.
Unidad de información
En el muestreo probabilístico se distinguen tres tipos de unidades:
Es un conjunto finito de unidades (personas, viviendas, instituciones, etc.), denominadas unidades de muestreo, sobre las cuales se desea aplicar el proceso de selección.
MARCO MUESTRAL
Se pueden distinguir dos tipos de marcos:
1. Marco en forma de listado (elementos):
En el cual cada unidad de marco esta asociada con un único elemento de la población objetivo. Un muestreo de elementos puede ser obtenido directamente a partir del marco. Un listado de empleados de una compañía, un listado de clientes de una tarjeta de crédito, un listado de las cuentas corrientes de un banco, son algunos ejemplos de este tipo de marco.
2. Marco de grupos (conjuntos de elementos):
En el cual cada unidad del marco esta asociada con varios elementos de la población objetivo. En este caso el muestreo no es tan directo, ya que primero se seleccionan algunos grupos y luego se observan todos o algunos de los elementos pertenecientes a los grupos seleccionados.
Un caso especial y muy importante de marcos de grupos es el marco de áreas, que se emplea principalmente para seleccionar viviendas, aunque también puede usarse para seleccionar locales comerciales (farmacias, heladerías, venta de electrodomésticos, etc.), escuelas, centros asistenciales, etc. Como su nombre lo indica, el marco de áreas esta formado por unidades territoriales delimitadas geográficamente.
Es una fórmula algebraica que permite agregar o combinar las respuestas o mediciones hechas sobre una variable o atributo en las unidades seleccionadas. Formalmente y en general en una muestra de tamaño “n” el estimador relaciona a los “n” valores de la variable en cuestión y lo que se busca con él es que brinde una aproximación al parámetro.
El estimador se clasifica en puntual cuando hace referencia a un solo valor o punto calculado, y por intervalos cuando corresponde a dos puntos dentro de los cuales se considera estará contenido el parámetro, con cierto grado de confiabilidad establecido por el investigador.
ESTIMADOR
Parámetros estimados enmuestreos probabilísticos
En general, interesa la estimación de alguno de los siguientes parámetros o características de la población:
Variable Parámetro a estimar ( )θ
Cuantitativa Total ( )τ Media ( )Y Razón ( )R
Cualitativa Total de
clase ( )τ Proporción ( )P
La inferencia estadística se basa en los errores estándar, y ésta toma típicamente la forma:
( )pt s yθ ± Esto denota el enunciado de que el valor poblacional está dentro del intervalo:
p pt s(y) t s(y)aθ − θ + Y la probabilidad P de este enunciado es función (en general aproximadamente normal) de la constante escogida tp (desvío t).
Diseño de encuestas y diseño de muestras
MUESTREO DE ENCUESTASO MUESTREO DE POBLACIÓN
Estudia los métodos para seleccionar y observar una parte (muestra) de la población con el fin de hacer inferencias acerca de toda la población.
El muestreo de encuestas se concentra en el estudio de muestras probabilísticas para estimar valores de la población.
Diseño de encuestas y diseño de muestras
El diseño de muestras tiene dos aspectos:
Un proceso de selección: que consiste en las reglas y operaciones mediante las cuales se incluyen en la muestra algunos miembros de la población.
Un proceso de estimación: para calcular las estadísticas de la
muestra, que son estimaciones muestrales de valores de la
población. Frecuentemente interesa la aplicación de alguna de
las siguientes medidas en la estimación: la media o promedio, el
total, la proporción (tasas) y la razón.
El diseño de encuestas incluye además otros aspectos importantes que pueden llamarse conjuntamenteobjetivos de la encuesta.
Objetivos de la encuesta:
La definición de las variables de la encuesta: debe especificar la naturaleza de las características, las reglas de la categoría de clasificación, y las unidades para expresarlas. Debe determinar también el alcance y el contenido de la población de la encuesta.
Los métodos de observación (medición): que incluyen tanto la
recolección como el procesamiento de datos.
Los métodos de análisis: que incluyen tanto los estadísticos
como los sustanciales. Con ello se reduce la encuesta a
resultados que puedan comprenderse y utilizarse.
La utilización de los resultados de la encuesta: que en
ocasiones, puede tomar la forma de decisiones concretas
basadas en los resultados de la encuesta y de información
proveniente de otras fuentes.
La precisión: que se desea que tengan los resultados de la encuesta, para llegar a una decisión estadística especificada.
Los objetivos de la encuesta deben determinar el diseño de la muestra**
Criterios del diseño de una muestra
El muestreo de encuestas se ocupa principalmente de modificaciones al muestreo irrestricto aleatorio. Las que impliquen una mayor complejidad deberán justificarse con vigorosas consideraciones.
Un buen diseño de muestreo requiere que se equilibren sensatamente cuatro amplios criterios:
1. Orientación hacia la meta: el diseño completo, tanto en la selección como en la estimación, debe orientarse a los objetivos de la investigación, hechos a la medidas del diseño de la encuesta y ajustados a las condiciones de la encuesta.
Criterios del diseño de una muestra
2. La medibilidad: es una característica de los diseños que permite calcular, a partir de la propia muestra, estimaciones válidas o aproximaciones a su variabilidad de muestreo (esto se suele expresar en las encuestas con errores estándar).
La medibilidad es la base necesaria para la inferencia estadística, y sirve como puente científico y objetivo, entre el resultado de la muestra y el valor desconocido de la población.
La teoría de la inferencia estadística depende de muestreo probabilísticos, es decir, muestreos en los que se conoce la probabilidad de selección de cada elemento de la población.
Criterios del diseño de una muestra
3. La practicidad: se refiere a los problemas que deben resolverse para llevar a cabo el diseño esencialmente como se propuso.
Se requiere de cuidado para traducir el modelo de selección teórico a un conjunto de instrucciones de oficina y campo. Estas instrucciones deben ser simples, claras, prácticas y completas.
4. La economía: se refiere a cumplir los objetivos de la encuesta con un costo (esfuerzo) mínimo y al grado (precisión) en que se alcanza este objetivo.
Clases de Muestras
CLASES DE MUESTRAS PROBABILÍSTICAS
1.Muestreo aleatorio simple.2.Muestreo estratificado.3.Muestreo estratificado aleatorio.4.Muestreo aleatorio sistemático.5.Muestreo por conglomerados o áreas.6.Muestreo monotápico.7.Muestreo bietápico.8.Muestreo polietápico.9.Muestreo simple.10.Muestreo doble o bifásico.11.Muestreo múltiple o polifásico.12.Muestreo balanceado.13.Métodos mixtos.
CLASES DE MUESTRAS NO PROBABILÍSTICAS
1.Muestreo por conveniencia.2.Muestreo por juicio.3.Muestreo por cuotas.4.Muestreo por bola de nieve.5.Muestreo de poblaciones móviles.
MUESTREO ALEATORIO SIMPLE MUESTREO IRRESTRICTO ALEATORIO
(Sin reemplazamiento )
n
N
Es la forma esencial del muestreo probabilístico. Es un método de selección de muestras en la cual las unidades se eligen individual y directamente por medio de un proceso aleatorio, cada unidad muestral que forma parte de la población meta definida tiene una probabilidad conocida, igual y diferente de cero de ser elegida.
MUESTREO ALEATORIO SIMPLEO MUESTREO IRRESTRICTO ALEATORIOPoblación de N unidades elementales
Muestra “n”
3 14
16
42
38
3528
36
32
25
22
49
21
34
44
3033
17
29
4 59
31
7
15
2423
39
6
2
585
40
57
13
9
26
5551
47
18
48
37
20
12
8
1
54
10 5243
56
11
4653
60
61
62
63
n = 550
19
2741
45
El muestreo irrestricto aleatorio (mia) consiste en la selección de n unidades elementales entre los N elementos que constituyen una población, de modo que todas las muestras posibles de tamaño n (tantas como combinaciones de N elementos de n en n) tengan la misma probabilidad 1/(N n) de ser obtenidas.
Propiedades del muestreo irrestricto aleatorio (mia)
Con este supuesto, por ser equiprobables todas las muestras de n elementos, la probabilidad de que un elemento poblacional dado forme parte de la muestra se puede calcular así:
N 1
n 1#muestras _ favorables n
N#muestras _ posibles N
n
− − = =
Ejemplo: si se dispone de una población de tamaño N= {A, B, C, D, E, F} y se obtiene una muestra irrestricta aleatoria de n = 3, entonces:
6 1 5
3 1 2 10 n 30.5 0.5
6 6 20 N 6
3 3
− − = = = = = =
En el mia, al seleccionar la primera una unidad elemental de una muestra, con los N-1 restantes pueden hacerse (N-1 n-1) combinaciones que completan la muestra de n.
Por consiguiente, todos los elementos tienen la misma probabilidad n/N de ser extraídos (y 1/N de serlo en determinado lugar). Recíprocamente, si el supuesto es que todos los elementos son equiprobables, la probabilidad de una muestra constituida por n elementos dados es:
Propiedades del muestreo irrestricto aleatorio (mia)
11 1 1n!
NN N 1 N n 1
n
=∗ − − +
…
Continuando con el ejemplo anterior, para una muestra de n=3 de una población N=6, se observa lo siguiente en un muestreo irrestricto aleatorio:
11 1 13!* *
N6 5 4
n
= =
116
20120
= =
0.05 0.05=
016.811.204.007612Media
86.54.336.671422096520
613.59.006.001261896319
5149.335.671151795318
23.52.334.67701465317
424.516.335.331181696116
32416.005.001071595115
010.57.004.00621265114
12617.334.33911393113
-29.56.333.33461063112
-364.003.0035953111
331.521.005.001171596010
230.520.334.67106149509
-115.510.333.6761116508
031.521.004.0090129307
-313.59.003.004596306
-49.56.332.673485305
-236.524.333.3382109104
-515.510.332.333776103
-610.57.002.002665102
-83.52.331.331043101
y - fYvar (y)s2mediay2yy3y2y1n
9876543210
Ejemplo: una población de N=6 elementos tiene los valores Yi ={0, 1, 3, 5, 6, 9}
El total de la población es Y=24 y la media de la población es Y/N = 24/6 = 4. La ΣYi
2 = 152, y tenemos que la varianza por elemento es Sy2=(ΣYi
2-(Y2/N))/(N-1)=11.2
Una muestra irrestricta aleatoria de n=3 elementos resulta en f = n/N = 0.5. La distribución de muestreo contiene (N n) = 20 muestras posibles en la columna 1, 2 y 3. cada uno de los elementos aparece f = 0.5 de las muestras.
Se puede ver que las estimaciones muestrales de y en la columna 4 varían. Su promedio o valor esperado es de 12, los que nos señala que E(y)=fY, que y es un estimador insesgado de fY. Entonces y/f es un estimador insesgado de Y, y y/n lo es de la media poblacional.
Nótese que en la columna 5 el valor esperado de Σyi
2=76, igual a fΣYi2 y por lo tanto es un
estimador insesgado.
Nótese que para una Var(y)=(1-n/N)nSy2 = 16.8.
Las varianzas calculadas en la columna 8 varían grandemente, pero su esperanza es 16.8; por tanto, E[var (y)] = Var (y) y en lasdesviaciones de (y-fY) en la distribución de la muestra también se ve que E[y-E(y)]=0 puestoque y es un estimador insesgado.
1s(y) 2s(y) 3s(y)-1s(y)-3s(y) -2s(y) E(y)
DISTRIBUCIÓN DE MUESTREO
Pc
Probabilidad (Pc) de yc
YVY
Una muestraEspecificada y´
Error estándar de ( ) 2y s(y) E y E y= = −
Sesgo de muestreo E(y) Y= −
Sesgo no de muestreo VY Y= −
Error total de una muestra especifica
Vy Y−
La distribución de muestreo de un estimador (media) es la distribución teórica de todos los valores posibles del estimador (yc), cada uno con una probabilidad de materialización (PC).
Los valores posibles y sus probabilidades dependen del diseño de muestreo (tamaño, selección y estimación) aplicado a una población fija de características.
La media de la distribución de muestreo es el valor esperado (o la esperanza matemática E(y)) del estimador.
Este valor medio E(y) puede ser igual al valor de la población Y, o puede no serlo.
Estimadores en el muestreo irrestricto aleatorio:
Los estimadores son funciones matemáticas de la información proporcionada por las unidades elementales de una muestra. En general, interesa la estimación alguno de los siguientes parámetros o características de la población:
Variable Parámetro a estimar ( )θ
Cuantitativa Total ( )τ Media ( )Y Razón ( )R
Cualitativa Total de
clase ( )τ Proporción ( )P
Estimadores en un muestreo irrestricto aleatorio
Por definición, la media aritmética poblacional se obtiene de:
N1 2 3 N
jj 1
y y y ... y 1Y y
N N =
+ + + += = ∑
Por lo que utilizaremos como estimador de la media poblacional la media muestral:
n1 2 3 n
jj 1
y y y ... y 1Y y
n n =
+ + + += = ∑
Estimador de la media
Estimadores en un muestreo irrestricto aleatorio
La varianza verdadera de una población está dada por:N N
2 2 2j j
j 1 j 12v
(y Y) y NY
SN N
= =
− −
= =∑ ∑
La varianza de la media en un mia se obtiene de:2S
var(y) (1 f)n
= −
Varianza y error estándar del estimador de la media
En donde:n
2 2j2nn
j 122 2jj
j 1j 1
n y yy1 1
yS (y y)nn 1 n 1 n(n 1)
=
==
−
−= − = = − − −
∑∑∑
Simplificada (cuasi-varianza)
N2
jj 12
(y Y)
SN 1
=
−
=−
∑
El error estándar de la media muestral es la raíz cuadrada de su varianza:
ss(y) var(y) 1 f
n= = −
Estimadores en un muestreo irrestricto aleatorio
Por definición, el total poblacional se obtiene de:
N
1 2 3 N jj 1
Y (y y y ... y ) y=
= + + + + =∑
Estimador del total
Por lo tanto, un estimador simple de Y en un mia es el siguiente:
O bien, Y NY=
Y Ny=
y su error estándar se estima mediante:
O bien,
n
jj 1
NY y
n =
= ∑Varianza y error estándar del estimador de un total
2Sˆvar(Y) (1 f)n
= − donde:
n2 2j2nn
j 122jj
j 1j 1
n y yy1 1ˆ yvar(Y) (y y)nn 1 n 1 n(n 1)
=
==
−
−= − = = − − −
∑∑∑
sˆs(Y) N var(y) N 1 fn
= = −
Estimadores en un muestreo irrestricto aleatorio
Por definición, en una población constituida por a1, a2,…aN elementos que poseen una característica cualitativa o atributo, definimos la proporción como el cociente de la suma de los N valores de ai por el número de elementos de la población N.
Estimador de una proporción (características cualitativas o atributos)
N
ii 1
aA
PN N== =∑
y la antiproporción Q 1 P= −
Por lo tanto, un estimador simple de P en el mia está dado por el cociente:n
ii 1
aa
Pn n
== =∑ y el total de la clase
n
ii 1
N NA a a Np
n n=
= = =∑
Varianza y error estándar del estimador de una proporción
p(1 p)ˆvar(P) (1 f)n 1
−= −
−
1 p(1 p) 1ˆs(P) var(p) (1 f)2n n 1 2n
−= + = − +
−
Nota técnica: La distribución de p de una muestra irrestricta aleatoria se llama distribución hipergeométrica debido a su selección sin reemplazamiento.
Estimadores en un muestreo irrestricto aleatorio
Por definición, la razón es aquella que mide la relación entre dos variables, permitiendo su comparación, calculado generalmente por cociente.
Estimador de razón
N N
i ij 1 j 1
N N
i ij 1 j 1
1y y
N YR
1 Xx x
N
= =
= =
= = =∑ ∑
∑ ∑
Por lo tanto, un estimador simple de R en un mia es el siguiente:
n n
i ij 1 j 1
n n
i ij 1 j 1
1y y
n yR
1 xx x
n
= =
= =
= = =∑ ∑
∑ ∑
Varianza y error estándar del estimador de una razón
n n n n2 2 2 2
j j j j j jj 1 j 1 j 1 j 1
2 2
ˆ ˆ ˆ(y Rx ) y 2R y x R x1 f 1 fˆvar(R)nx n 1 nx n 1
= = = =
− − +− −
= ⋅ = ⋅− −
∑ ∑ ∑ ∑
y su error estándar se estima mediante:
n n n n2 2 2 2
j j j j j jj 1 j 1 j 1 j 1
ˆ ˆ ˆ(y Rx ) y 2R y x R x1 f 1 fˆs(R)
n 1 n 1nx nx
= = = =
− − +− −
= ⋅ = ⋅− −
∑ ∑ ∑ ∑
MUESTREO ALEATORIO SISTEMÁTICOO MUESTREO SEUDOALEATORIO
(supuesto aleatorio)
n
N
Método de muestreo que denota la selección de las unidades de una muestra, de k en k (unidad de muestreo k-ésima), a partir de uno de ellos elegido aleatoriamente entre los que ocupan el lugar primero y el i-ésimo lugar en una población objeto de estudio.
Universo “N”
22 232018 191716 30292826 272524
37 38363533 3432 454443424039
52 535048 494746 60595856 575554
7 8653 42 15141312109
Muestra
n = 6
Selección aleatoria = 41
Datos:
K = 60 / 6 = 10
N = 60
K = 101 11
213141
51
MUESTREO ALEATORIO SISTEMÁTICOO MUESTREO SEUDOALEATORIO
NOTA: Cuando el origen no es aleatorio (paso 1 selección aleatoria), el muestreo puede denominarse rígida o estrictamente sistemático y deja de ser probabilístico.
Ran# = 0.683
Paso 1: Selección aleatoria
0.683 x 60 = 40.98 = 41
Paso 2: Intervalo KK = N / n
Estratificación: proceso mediante el cual se agrupan los elementos de una población conforme a determinadas características comunes.
El muestreo estratificado indica la selección a partir de varias subpoblaciones, llamadas estratos, en los cuales se ha dividido la población.
Razones principales para recurrir a la estratificación:
•Se pueden formar los estratos para utilizar diferentes métodos de muestreo y procedimientos dentro de ellos (diseños muestrales eficientes).
•Disminuir o minimizar las varianzas de las estimaciones de la muestra; con lo que se contribuye a reducir el número de observaciones en la muestra.
•Obtener estimaciones separadas por estrato; los estratos también pueden ser dominios de estudio. Un dominio de estudio es una parte de la población para la cual se han planeado estimaciones separadas en el diseño de una muestra.
MUESTREO ESTRATIFICADO
La formación de estratos requiere determinar:
1. Las variables de estratificación.
2. Numero de estratos.
3. Los límites de los estratos
-Métodos univariados.-Métodos multivariados.
-De acuerdo a las necesidades del estudio.-Con base a la reducción de la varianza.
Criterios de varianza mínima (dado un tamaño de n se debe determinar los límites que minimicen la varianza)
MUESTREO ESTRATIFICADO
N1
n
N2N3
AfijaciónSe denomina afijación, al modo
de distribuir las unidades de una
muestra entre los diferentes
estratos.
MUESTREO ESTRATIFICADO ALEATORIO
POBLACIÓN 1 POBLACIÓN 2 POBLACIÓN 3 POBLACIÓN 4
Si se parte de una población de N unidades elementales, que se encuentra dividida en L subpoblaciones (estratos o subclases) de N1, N2 ….NL unidades elementales cada uno, y posteriormente seleccionamos una muestra irrestricta aleatoria independiente en cada estrato, entonces el procedimiento se denomina muestreo estratificado aleatorio.
np
n4
np
n1
np
n2
np
n3
nT
MUESTREO POR CONGLOMERADOS O ÁREAS
N = conglomerados (que formarán las unidades de muestreo)
n = muestra de 2conglomeradosde elementos.
Conjunto de elementos
Método de muestreo cuya unidad de muestreo o de selección, contiene más de un elemento de la población.
Unidad de análisis:
Población de viviendasdel departamento deHuehuetenango.
Intervalos de 40
minutosVehículosOrigen y destino
Tránsito anual en
un puente
PueblosAdultosActitudes socialesGente de pueblo
Salones de claseEstudiantesPlanes de carrerasUniversidades
Vuelos
Pasajeros que
salen
Información acerca
de viajesAeropuerto
ViviendasPersonasCompras de ropaCiudad B
ManzanasViviendas
Características de la
viviendaCiudad A
CONGLOMERADOS O
UNIDADES DE
MUETREO
ELEMENTOSVARIABLESPOBLACIÓN OBJETIVO
Ejemplos de muestreos porconglomerados
MUESTREO MONOTÁPICO, BIETÁPICO, TRIETÁPICO Y POLIETÁPICO
Muestra de primera etapa (MONOTÁPICO)
Muestra de segunda etapa(BIETÁPICO)
Muestra de tercera etapa(TRIETÁPICO)
Muestra de más de tres etapas(POLIETÁPICO)
El muestreo bietápico, trietápico y polietápico emplea una jerarquía de unidades de muestreo o conglomerados, de manera que el elemento pertenezca únicamente a una unidad de muestreo en cada etapa.
MUESTRAS NOPROBABILÍSTICAS
MUESTREO POR CONVENIENCIA O MUESTREO ACCIDENTAL
(MUESTRAS CASUALES O FORTUITAS)
MUESTREO POR JUICIO (SELECCIÓN EXPERTA)
MUESTREO POR CUOTAS
MUESTREO DE LA BOLA DE NIEVE
MUESTREO DE RECOMENDACIÓN
= medido y marcadomedido (2da. ocasión) =
Métodos de captura-marca-recapturaMétodos de captura-marca-recaptura
Muestreo de poblaciones móviles
Tamaño de la muestra
POBLACIÓN 3POBLACIÓN 1 POBLACIÓN 2
Muestra 3
Muestra 1Muestra 2
El tamaño de una muestra está estrechamente relacionado con el tipo de muestreo aplicado en un estudio (probabilístico o no probabilístico).
En muestreos de tipo no probabilístico el tamaño de la muestra suele determinarse de la siguiente manera:
TAMAÑO ADECUADO DE LA MUESTRA
1. A través de un juicio subjetivo, intuitivo, que hace el investigador basándose en estudios pasados.
2. En función de los costos y las limitaciones financieras de una encuesta.
Para el caso del tamaño de la muestra en un muestreo probabilístico, el investigador debe considerar lo precisosque tienen que ser los estimados y de cuánto tiempo y dinero dispone para recolectar los datos requeridos, pues esta tarea de recolección es generalmente una de las partes más costosas del estudio.
Hay tres factores que tienen una función importante en la determinación de los tamaños de muestra apropiados en un diseño muestral probabilístico (no incluyen los recursos y el tiempo):
TAMAÑO ADECUADO DE LA MUESTRA
a. Variabilidad de la característica de población que se investiga: Cuando mayor sea la variabilidad de la característica, mayor será el tamaño de la muestra necesaria.
El nivel de ingresos en Guatemala
BAJO
ALTO
b. Nivel de confianza deseado en el estimado: Cuando más alto sea el nivel de confianza que se desee, mayor será el tamaño de la muestra necesario.
Confianza: grado de certeza de que la estimación obtenida con la muestra contenga al valor verdadero del parámetro. Por ejemplo, si se dice que el nivel de confianza es de 95%, esto significa que el valor del parámetro poblacional se encontrará dentro del intervalo especificado en 95 de cada 100 muestras posibles.
95 % 2.5 %2.5 %
Nivel de confiabilidad asumido en el diseño muestral
Error asumido en el diseño muestral
Error asumido en el diseño muestral
θ
c. Grado de precisión deseado en la estimación de la característica de la población: Cuanto más precisos sean los resultados de la muestra que se requieren (esto es, cuando menor sea el error), mayor será el tamaño de muestra necesario.
GRACIAS POR SUATENCIÓN
Top Related