Metodología Gran Encuesta Integrada de Hogares (GEIH)

10
1 Metodología Gran Encuesta Integrada de Hogares (GEIH) Texto adaptado del Manual de metodología del DANE, para este diplomado. Diseño estadístico Como menciona el DANE, la Gran Encuesta Integrada de Hogares (GEIH) produce información a nivel nacional, urbano-rural y para las trece principales ciudades y áreas metropolitanas. Esta es una encuesta por muestreo probabilístico, multietápico, estratificado, de conglomerados desiguales y autoponderado. El universo para la GEIH está conformado por la población civil no institucional residente en todo el territorio nacional; se excluyen los nuevos departamentos, denominados territorios nacionales antes de la Constitución de 1991. El tamaño de la muestra mensual corresponde a 23.000 hogares aproximadamente; los tamaños de muestra se calculan con una precisión deseada de la variable tasa de desempleo no superior a un error estándar relativo del 5% y una tasa de desempleo del 10%. Muestreo probabilístico. La Gran Encuesta Integrada de Hogares (GEIH) y la Encuesta de Calidad de Vida (ECV) se basan en un método estadístico de muestreo, esto es, no tomar toda la población total que habita en Colombia, sino tomar una pequeña parte de esa población: la muestra. Ahora, no solo es muestreo, sino que también es probabilístico: todos los individuos que hacen parte de la población total pueden ser seleccionados dentro de la muestra con la misma probabilidad. Por tanto, el diseño estadístico de estas encuestas parte del muestreo probabilístico. Estratificado y multietápico. Peter Mandeville expone tales conceptos de esta manera: “Un marco muestral es una relación completa de las unidades en el universo del estudio. El muestreo estratificado requiere que los elementos en este universo sean divididos en grupos, llamados estratos,

Transcript of Metodología Gran Encuesta Integrada de Hogares (GEIH)

Page 1: Metodología Gran Encuesta Integrada de Hogares (GEIH)

 

  1  

Metodología Gran Encuesta Integrada de Hogares (GEIH)

Texto adaptado del Manual de metodología del DANE, para este diplomado.

Diseño estadístico

Como menciona el DANE, la Gran Encuesta Integrada de Hogares (GEIH) produce información a nivel nacional, urbano-rural y para las trece principales ciudades y áreas metropolitanas. Esta es una encuesta por muestreo probabilístico, multietápico, estratificado, de conglomerados desiguales y autoponderado. El universo para la GEIH está conformado por la población civil no institucional residente en todo el territorio nacional; se excluyen los nuevos departamentos, denominados territorios nacionales antes de la Constitución de 1991. El tamaño de la muestra mensual corresponde a 23.000 hogares aproximadamente; los tamaños de muestra se calculan con una precisión deseada de la variable tasa de desempleo no superior a un error estándar relativo del 5% y una tasa de desempleo del 10%.

Muestreo probabilístico. La Gran Encuesta Integrada de Hogares (GEIH) y la Encuesta de Calidad de Vida (ECV) se basan en un método estadístico de muestreo, esto es, no tomar toda la población total que habita en Colombia, sino tomar una pequeña parte de esa población: la muestra. Ahora, no solo es muestreo, sino que también es probabilístico: todos los individuos que hacen parte de la población total pueden ser seleccionados dentro de la muestra con la misma probabilidad. Por tanto, el diseño estadístico de estas encuestas parte del muestreo probabilístico.

Estratificado y multietápico. Peter Mandeville expone tales conceptos de

esta manera: “Un marco muestral es una relación completa de las unidades en el universo del estudio. El muestreo estratificado requiere que los elementos en este universo sean divididos en grupos, llamados estratos,

Page 2: Metodología Gran Encuesta Integrada de Hogares (GEIH)

  2  

antes de empezar el proceso de muestreo. Cada unidad es asignada a un estrato basado en el conocimiento previo de las características de la unidad. Entonces, se seleccionan muestras aleatorias independientes de cada estrato. Un muestreo polietápico utiliza más que una etapa de selección para formar la muestra. La primera etapa utiliza las unidades de muestreo de mayor tamaño que se llaman unidades de muestreo primarios (PSUs primary sampling units), mientras que en la etapa final se utilizan las unidades de muestreo más pequeño denominadas unidades de muestreo secundarias (SSUs secondary sampling units). Si el objeto es investigar alumnos, entonces los PSUs pueden ser las escuelas, y los SSUs, los alumnos dentro de las escuelas seleccionadas. Si el objeto es investigar pacientes, entonces los PSUs pueden ser los hospitales, y los SSUs, los pacientes dentro de los hospitales seleccionados” (Mandeville, 2010).

Conglomerados iguales y desiguales. “El muestreo por conglomerados es un procedimiento en el cual se eligen conglomerados de elementos, y a cada conglomerado que resulte en la muestra se le revisa completamente, es decir, se censa. Podemos definir como conglomerados a familias, salones de clase, manzanas de viviendas, centros de salud, comunidades, etc., según sea el estudio que se desarrolle. En una encuesta por conglomerados, por ejemplo, el caso de cajas de productos terminados, debido a la uniformidad en el proceso de producción, estas constituyen conglomerados de igual tamaño M o de tamaños iguales. Claramente, el caso más general se considera en que los conglomerados son tamaños desiguales, por ejemplo, las familias contienen un número variable de personas y las manzanas de viviendas que por su estructura en muchos casos son de tamaños diferentes”1.

Autoponderación. En los casos de muestreo autoponderado, la probabilidad de selección de un segmento (población dentro de un conglomerado) cualquiera está dada por:

!   =  !/!  

donde n es el tamaño de la muestra (segmentos) y N es el tamaño de la población del conglomerado (segmentos). Esta fórmula sencilla resulta del hecho que al efectuar el producto de probabilidades, el numerador de cada probabilidad se simplifica con el denominador del siguiente, y al final resulta la expresión dada. (Encuesta Nacional de Calidad de vida, 1993)

Universo y población objetivo en la GEIH y en la Encuesta de Calidad de Vida (ECV). El universo está conformado por la población civil no

                                                                                                                         1 Disponible en: http://www.coesi.com.pe/archivos/cursos/muestreo/Muestreo_por_conglomerados.pdf

Page 3: Metodología Gran Encuesta Integrada de Hogares (GEIH)

  3  

institucional, residente en todo el territorio nacional. Sin embargo, la población objetivo difiere de este universo en que no incluye a la población rural de los llamados nuevos departamentos, que son San Andrés y la Orinoquía-Amazonia.

Sobre la evolución de las encuestas de hogares

Fue en 1976 cuando se iniciaron las encuestas de hogares. Las ciudades de estudio primeramente fueron Bogota, Medellín, Cali y Barranquilla, con sus respectivas áreas metropolitanas. En etapas más avanzadas de la encuesta de hogares se empezaron a incluir otras ciudades: en 1984, siete áreas metropolitanas, las ya nombradas más Bucaramanga, Manizales y Pasto; en 1991 se estudia el comportamiento laboral para el total nacional, y se categoriza tal comportamiento en los niveles rural y urbano; en 1996 este comportamiento también se podrá categorizar por las cabeceras municipales y el resto del territorio; para el 2003, ya son 13 las áreas metropolitanas en que se analiza el comportamiento del empleo nacional; en el 2006 son 24 áreas metropolitanas y 11 ciudades intermedias las áreas que servirán para el análisis del total nacional. Esto queda mejor explicado a traves de los siguientes cuadros. Fuente: Metodología GEIH 2009.

Page 4: Metodología Gran Encuesta Integrada de Hogares (GEIH)

  4  

Períodos de referencia. Es el período durante el cual se hacen las respectivas preguntas a los encuestados. Este es distinto para la GEIH y la ECV. En el tema laboral el período de referencia es la semana anterior a la que se realiza la encuesta a los hogares, pero por el interés de algunas situaciones, esto cambia en la ECV, donde los períodos de referencia son: los últimos siete días (gastos de alimentos del hogar), la semana anterior a la encuesta (fuerza de trabajo), el mes anterior al mes en el que se hace la encuesta (gastos en educación, ingresos laborales, gastos en servicios públicos y otros gastos distintos a la alimentación), últimas cuatro semanas (fuerza de trabajo), los últimos treinta días (problemas de salud y sus gastos), los últimos tres meses (gastos de los hogares) y los últimos doce meses (ingresos de personas de más de doce años, fuerza de trabajo, gastos de los hogares, problemas del hogar y hospitalizaciones). El período de recolección de los datos es de ocho semanas para la ECV y de una semana para la GEIH.

Los formularios de la encuesta

Capítulos de los formularios. Son los conjuntos de preguntas que tienen un fin específico en la búsqueda de cierta información. Estos son distintos en algunos casos para la GEIH y la ECV. Los cuatros primeros hacen referencia a información y registro básico de los hogares: ubicación de las viviendas, vías de acceso, la conformación del hogar, etc. Debido al especial objetivo de cada encuesta, algunos capítulos cambian; por ejemplo, en la GEIH se busca profundizar, entre otras cosas, sobre qué tipo de trabajo desempeñan las personas encuestadas y las razones del desempleo; en la ECV se busca información sobre las condiciones de vida de las personas (hacinamiento, estado de salud, entre otros).

Page 5: Metodología Gran Encuesta Integrada de Hogares (GEIH)

  5  

GEIH EVC A Identificación A Identificación y control B Vivienda B Datos de la vivienda C Datos del hogar C Datos del hogar D Registro de personas D Características y composición del

hogar

E Características generales E Salud F Seguridad social en salud F Cuidado de niños y niñas menores de

cinco años G Educación G Educación H Fuerza de trabajo H Fuerza de trabajo I Ocupados I Tenencia y financiación de la vivienda

que ocupa el hogar J Desocupados J Condiciones de vida del hogar K Inactivos K Gastos de los hogares L Otras actividades L Componente rural M Ingresos no laborales N Módulo de fecundidad O Módulo de tecnologías de información y comunicación (para personas de 5 años y más) P Módulo de consumo de arroz Q Módulo de percepción sobre los servicios y los mecanismos de atención al ciudadano ¿Cómo se conoce el número de hogares y su ubicación? Esta información es común para la GEIH y para la ECV, en el sentido de que ambas utilizan el inventario cartográfico y el archivo agregado de viviendas y hogares. Muestreo estadístico y selección de la población a encuestar. En el caso específico de la GEIH y de la ECV debemos adentrarnos sobre las consideraciones que el DANE hace sobre la población a la que hace los análisis estadísticos. Para la GEIH, antes del muestreo se debe hacer la estratificación. Lo primero es decir que un estrato está constituido por las 24 ciudades y sus áreas metropolitanas. El otro estrato está constituido por el resto del país urbano y el rural. Cuando nos referimos a que este muestreo es multietápico, queremos decir que debe haber otras etapas anteriores a la selección de la población que será encuestada. Esto en la GEIH para el primer estrato significa organizar las áreas geográficas según principios cartográficos, teniendo en cuenta los datos geográficos, socioeconómicos, de urbanización, de la estructura urbano-rural y de

Page 6: Metodología Gran Encuesta Integrada de Hogares (GEIH)

  6  

las necesidades básicas insatisfechas (NBI). En una segunda etapa se eligen aleatoriamente las USM (Unidades Secundarias de Muestreo), que son regiones o áreas de muestreo más pequeñas. Y en la última etapa, se eligen al azar la UTM (Unidades Terciarias de Muestreo), es decir, las manzanas. En el caso del segundo estrato debemos definir un concepto: la UPM (Unidad Primaria de Muestreo), que son los municipios de 7000 habitantes o más; si hay un municipio con menos habitantes, se combinará con otro para alcanzar el nivel de habitantes. La primera etapa es escoger controladamente las UPM a analizar. En la segunda etapa, se elige la manzana en lo urbano, y la USM en lo rural. Y en la tercera etapa se selecciona el segmento o UTM. En la ECV, “en las capitales de departamento seleccionadas (primera estratificación) el marco se organizó según las definiciones cartográficas establecidas en sectores, secciones y manzanas, con la información del número de viviendas y hogares y el estrato socioeconómico”. Para el resto, es decir, para otras zonas urbanas y rurales, se parte de las etapas explicadas para la GEIH. Para la selección de la población a encuestar, se eligen secuencialmente las UPM, USM y UTM que tienen las mismas definiciones que en la GEIH. Tamaño de la muestra. En la GEIH, “inicialmente el tamaño de la muestra mensual correspondía aproximadamente a 23.000 hogares. En el año 2000, con la implementación de la Encuesta Continua de Hogares (ECH), la muestra maestra fue ampliada de 165 a más de 240, con 30.000 hogares en 13 áreas y 7500 en Zona Rural. Durante el 2004, se amplió la muestra maestra, con un total de 44.400 hogares, con 30.000 hogares en 13 áreas y 14.400 en Zona Rural. Para el 2006, con la implementación de la GEIH, se amplió la muestra a 11 ciudades más, con un total de 62.000 hogares (30.000 hogares en 13 áreas, 14.400 en Zona Rural y 17.600 en 11 ciudades)”.

Definiciones DANE

Page 7: Metodología Gran Encuesta Integrada de Hogares (GEIH)

  7  

PEA: Población Económicamente Activa o fuerza laboral que incluye todas las personas en edad de trabajar que están empleadas o están buscando empleo.

Preguntas que se realizan en Colombia para clasificar a las personas según su participación en el mercado laboral:

Fuerza de trabajo

Las siguientes preguntas se hacen a todas las personas en edad de trabajar; es decir, aquellas de diez años y más:

Page 8: Metodología Gran Encuesta Integrada de Hogares (GEIH)

  8  

Page 9: Metodología Gran Encuesta Integrada de Hogares (GEIH)

  9  

Fuente: DANE Según sus respuestas, las personas son clasificadas entre ocupados, desocupados e inactivos.

Page 10: Metodología Gran Encuesta Integrada de Hogares (GEIH)

  10  

A los ocupados se les pregunta sobre las características de su empleo principal y secundario, si aplica. Se indaga, entre otras cuestiones, sobre su condicion de asalariados o independientes, su posicion ocupacional, el tipo de contrato y los ingresos recibidos. A los desocupados se les pregunta, entre otras cuestiones, sobre el tiempo que llevan buscando empleo, las características de su empleo anterior y el tipo de empleo buscado.

A los inactivos se les pregunta, entre otra cuestiones, sobre las razones de su actividad y las características de su empleo anterior, si aplica.

El cuestionario con sus respectivas preguntas estan disponibles en los manuales de metodologia de la Gran Encuesta Integrada de Hogares (GEIH) del DANE.