Efectos de los Ingresos No Reportados en el Nivel y ...€¦ · mediciones de pobreza en MØxico...

24
Introduccin ¿Por quØ necesitamos imputacin? MØtodos de Imputacin Resultados Conclusiones Efectos de los Ingresos No Reportados en el Nivel y Tendencia de la Pobreza Laboral en MØxico Raymundo M. Campos VÆzquez Colmex Marzo 27, 2013 El Colegio de MØxico Raymundo M. Campos VÆzquez Imputacin

Transcript of Efectos de los Ingresos No Reportados en el Nivel y ...€¦ · mediciones de pobreza en MØxico...

Page 1: Efectos de los Ingresos No Reportados en el Nivel y ...€¦ · mediciones de pobreza en MØxico ignoran a los individuos que reportan trabajar por remuneración pero que deciden

Introducción¿Por qué necesitamos imputación?

Métodos de ImputaciónResultados

Conclusiones

Efectos de los Ingresos No Reportados en el Nively Tendencia de la Pobreza Laboral en México

Raymundo M. Campos Vázquez

Colmex

Marzo 27, 2013El Colegio de México

Raymundo M. Campos Vázquez Imputación

Page 2: Efectos de los Ingresos No Reportados en el Nivel y ...€¦ · mediciones de pobreza en MØxico ignoran a los individuos que reportan trabajar por remuneración pero que deciden

Introducción¿Por qué necesitamos imputación?

Métodos de ImputaciónResultados

Conclusiones

Pobreza LaboralI La mayoría de los estudios en economía laboral así como lasmediciones de pobreza en México ignoran a los individuos quereportan trabajar por remuneración pero que deciden noreportar ingresos.

I En la medición del Índice de la Tendencia Laboral de laPobreza por el CONEVAL (2010) se incluyen pero como si notuvieran un ingreso

I El supuesto detrás de esas decisiones es que las personas quedeciden no reportar ingresos son una muestra aleatoria de lostrabajadores o bien que la composición de ese tipo depersonas se mantiene constante en el tiempo.

I En este artículo argumento que esos supuestos dejaron de serválidos para el caso de México.

Raymundo M. Campos Vázquez Imputación

Page 3: Efectos de los Ingresos No Reportados en el Nivel y ...€¦ · mediciones de pobreza en MØxico ignoran a los individuos que reportan trabajar por remuneración pero que deciden

Introducción¿Por qué necesitamos imputación?

Métodos de ImputaciónResultados

Conclusiones

Importancia

I Tener un dato preciso de pobreza es sumamente importante:cambios en política pública, asignaciones presupuestales porentidad federativa.

I La proporción de individuos que decide no declarar ingresosaun cuando trabaja por remuneración ha aumentado.

I Por ejemplo, en 2005 la proporción era de 10 por cientomientras que en 2012 era de 20 por ciento.

I Más aún, la proporción de ingresos inválidos ha aumentadoprincipalmente entre los individuos con educación superior.Esta proporción era de 20 por ciento en 2005 pero para 2012era de 38 por ciento.

Raymundo M. Campos Vázquez Imputación

Page 4: Efectos de los Ingresos No Reportados en el Nivel y ...€¦ · mediciones de pobreza en MØxico ignoran a los individuos que reportan trabajar por remuneración pero que deciden

Introducción¿Por qué necesitamos imputación?

Métodos de ImputaciónResultados

Conclusiones

Métodos

I En este artículo utilizo métodos de imputación para asignar uningreso a los trabajadores que no lo reportan.

I Existe un amplio consenso sobre la conveniencia de corregirdatos faltantes con métodos de imputación: Little y Rubin(2003) y Rubin (2004).

I Imputar con la media es incorrecto: picos en la distribución ysubestimación de la varianza.

I 4 métodos de imputación: Pareamiento de puntajes depropensión, Hot-Deck, Medias por grupo más un error,pareamiento por puntajes predictivos

Raymundo M. Campos Vázquez Imputación

Page 5: Efectos de los Ingresos No Reportados en el Nivel y ...€¦ · mediciones de pobreza en MØxico ignoran a los individuos que reportan trabajar por remuneración pero que deciden

Introducción¿Por qué necesitamos imputación?

Métodos de ImputaciónResultados

Conclusiones

Resultados

I Encuentro que la pobreza laboral está sobreestimada:CONEVAL-pobreza ↑25% para 2005-2012.

I Imputación: ↑12%.I Es decir, para 2012:3 existen 8.1 millones de personas que sondeclarados como pobres laborales pero, de acuerdo al métodode imputación, no lo son.

I Restricción de este estudio: Pobreza laboral, y no la mediciónoficial de pobreza con ENIGH.

Raymundo M. Campos Vázquez Imputación

Page 6: Efectos de los Ingresos No Reportados en el Nivel y ...€¦ · mediciones de pobreza en MØxico ignoran a los individuos que reportan trabajar por remuneración pero que deciden

Introducción¿Por qué necesitamos imputación?

Métodos de ImputaciónResultados

Conclusiones

Datos

I ENOE: 2005-2012I Imputación nos restringimos a trabajadores con horaspositivas pero que no reportan ingresos.

I Trabajadores sin pago, desempleados, o trabajadores con horascero NO se les imputa ingreso. En la muestra de imputaciónno los utilizo, pero los incluyo en el cálculo de pobreza.

I No hay restricción por edad.I Todos los ingresos en pesos constantes del segundo trimestrede 2012.

Raymundo M. Campos Vázquez Imputación

Page 7: Efectos de los Ingresos No Reportados en el Nivel y ...€¦ · mediciones de pobreza en MØxico ignoran a los individuos que reportan trabajar por remuneración pero que deciden

Introducción¿Por qué necesitamos imputación?

Métodos de ImputaciónResultados

Conclusiones

Problema (I)

I Las personas que deciden no reportar ingresos son unamuestra aleatoria de los trabajadores.

I O bien que la composición de ese tipo de personas semantiene constante en el tiempo.

I Esto no se cumple ya para el caso de MéxicoI Si las personas que no declaran ingresos son una muestraaleatoria de la población en general el único problema es deeficiencia (mayores errores estándar) sin problema de sesgo.

I Si las personas con ingresos inválidos no son una muestraaleatoria de la población entonces los estadísticos de interésno son representativos de la población en su conjunto

Raymundo M. Campos Vázquez Imputación

Page 8: Efectos de los Ingresos No Reportados en el Nivel y ...€¦ · mediciones de pobreza en MØxico ignoran a los individuos que reportan trabajar por remuneración pero que deciden

Introducción¿Por qué necesitamos imputación?

Métodos de ImputaciónResultados

Conclusiones

Problema (II)Porcentaje de Trabajdores con ingreso faltante

0.0

5.1

.15

.2.2

5%

 Ingr

eso 

falta

nte

2005

q1

2005

q3

2006

q1

2006

q3

2007

q1

2007

q3

2008

q1

2008

q3

2009

q1

2009

q3

2010

q1

2010

q3

2011

q1

2011

q3

2012

q1

2012

q3

Periodo

Raymundo M. Campos Vázquez Imputación

Page 9: Efectos de los Ingresos No Reportados en el Nivel y ...€¦ · mediciones de pobreza en MØxico ignoran a los individuos que reportan trabajar por remuneración pero que deciden

Introducción¿Por qué necesitamos imputación?

Métodos de ImputaciónResultados

Conclusiones

Problema (III)Porcentaje de Trabajadores con ingreso faltante: Educación y Formalidad

A. Educación B. Formalidad

0.0

5.1

.15

.2.2

5.3

.35

.4%

 Ingr

eso 

falta

nte

2005

q1

2005

q3

2006

q1

2006

q3

2007

q1

2007

q3

2008

q1

2008

q3

2009

q1

2009

q3

2010

q1

2010

q3

2011

q1

2011

q3

2012

q1

2012

q3

Periodo

<Primaria PrimariaSecundaria PreparatoriaUniversidad

0.0

5.1

.15

.2.2

5%

 Ingr

eso 

falta

nte

2005

q1

2005

q3

2006

q1

2006

q3

2007

q1

2007

q3

2008

q1

2008

q3

2009

q1

2009

q3

2010

q1

2010

q3

2011

q1

2011

q3

2012

q1

2012

q3

Periodo

Formal Informal

Raymundo M. Campos Vázquez Imputación

Page 10: Efectos de los Ingresos No Reportados en el Nivel y ...€¦ · mediciones de pobreza en MØxico ignoran a los individuos que reportan trabajar por remuneración pero que deciden

Introducción¿Por qué necesitamos imputación?

Métodos de ImputaciónResultados

Conclusiones

Problema (IV)Estadísticas

InválidosVálidos Inválidos Diferencia Válidos Inválidos Diferencia 2005­2012

Edad 36.86 40.25 ­3.4 * 37.8 40.8 ­2.99 * ­0.54 *[0.125] [0.090] [0.144]

Formal 0.41 0.41 0 0.39 0.46 ­0.07 * ­0.06 *[0.004] [0.003] [0.005]

Rural 0.25 0.19 0.06 * 0.28 0.18 0.1 * 0.01[0.003] [0.002] [0.004]

0.19 0.22 ­0.03 * 0.21 0.25 ­0.04 * ­0.03 *[0.003] [0.003] [0.004]

0.14 0.27 ­0.13 * 0.15 0.31 ­0.16 * ­0.04 *[0.003] [0.003] [0.004]

N 132849 13977 120491 29344

Preparatoriacompleta

Universidadcompleta

2005 2012

Raymundo M. Campos Vázquez Imputación

Page 11: Efectos de los Ingresos No Reportados en el Nivel y ...€¦ · mediciones de pobreza en MØxico ignoran a los individuos que reportan trabajar por remuneración pero que deciden

Introducción¿Por qué necesitamos imputación?

Métodos de ImputaciónResultados

Conclusiones

MétodosExplicación General

I Abundante literatura para tratar datos faltantes: Allison, 2000; Camerony Trivedi, 2005; Little y Rubin, 2003; Rubin, 2004.

I Uno de los métodos comúnmente utilizados para resolver el problema deingresos faltantes es imputar con la media del valor observado.

1. Erróneo por: distribución de ingreso imputada tendría picos enciertas partes de la distribución

2. Erróneo por: subestima la varianza del ingreso sustancialmente.

I Utilizamos métodos de imputación única y múltiple utilizando el supuestode Rubin (1976) Missing at Random: Pr(Y faltante|Y ,X ) = Pr(Yfaltante|X ).

I Imputación múltiple reconoce que el resultado final puede variardependiendo de la aleatoriedad. Con IM el resultado final es el promediode cada imputación.

Raymundo M. Campos Vázquez Imputación

Page 12: Efectos de los Ingresos No Reportados en el Nivel y ...€¦ · mediciones de pobreza en MØxico ignoran a los individuos que reportan trabajar por remuneración pero que deciden

Introducción¿Por qué necesitamos imputación?

Métodos de ImputaciónResultados

Conclusiones

MétodosPareamiento y Hot-Deck

1. Pareamiento por puntaje de propensión: Rosenbaum y Rubin (1983);DiNardo et al (1996) —PSM estimar puntaje y luego pareamiento conpuntaje.

1.1 Método intensivo computacionalmente.1.2 No es posible extenderlo a IM

2. Hot-Deck: Ampliamente utilizado, por ej: Censo o encuestas en EstadosUnidos: Andridge y Little (2010), Rubin (1987).

2.1 Muestra aleatoria con reemplazo (bootstrap) de los ingresosválidos (la muestra se mantiene del mismo tamaño n0)

2.2 De n0, tomar una muestra aleatoria con reemplazo de tamañon1.

2.3 Sustituir el ingreso de la muestra n1 en el paso 2 como ingresoimputado para aquellos con ingreso inválido.

I Ventaja: Toma valores observados, extensión a imputaciónmúltiple, no es computacionalmente intenso.

Raymundo M. Campos Vázquez Imputación

Page 13: Efectos de los Ingresos No Reportados en el Nivel y ...€¦ · mediciones de pobreza en MØxico ignoran a los individuos que reportan trabajar por remuneración pero que deciden

Introducción¿Por qué necesitamos imputación?

Métodos de ImputaciónResultados

Conclusiones

MétodosMedia más ruido y pareamiento por promedios predictivos

1. Grupo con aleatoriedad: Se calcula la mediana más un"ruido" pare evitar el problema de subestimar la varianza.Desventaja: falta de rigor teórico.

2. Pareamiento por promedios predictivos: Little (1988)

2.1 Obtener los parámetros OLS de Y = X β+ ξ.2.2 Obtener los parámetros (β̂, σ̂2) de una distribución aleatoria.

La varianza se obtiene de una χ2, y β̂ de una normalmultivariada.

2.3 Se obtiene una predicción con los nuevos parámetros, y se haceel pareamiento y se sustituye el ingreso inválido con elverdadero observado.

I Es computacionalmente intenso.

Raymundo M. Campos Vázquez Imputación

Page 14: Efectos de los Ingresos No Reportados en el Nivel y ...€¦ · mediciones de pobreza en MØxico ignoran a los individuos que reportan trabajar por remuneración pero que deciden

Introducción¿Por qué necesitamos imputación?

Métodos de ImputaciónResultados

Conclusiones

MétodosEstimación y restricción de datos

1. Se tiene información de ingreso en términos de los múltiplos de salariomínimo. Para esos individuos siempre se busca un ingreso dentro de eseintervalo para la imputación ≈ 50%

2. PSM: polinomio edad, variables dummy de educación, estado civilcasado, mujer, trabajador formal, vive en sector rural, trabajador detiempo completo, geográficas e interacciones entre algunas variables. Elpareamiento se realiza diferenciado por género.

3. Hot-Deck: utiliza variables dicotómicas de edad (12 grupos), áreametropolitana, nivel educativo, trabajador formal, vive en sector rural,trabajador de tiempo completo. Si no hay match, se realiza eliminandoformal y tiempo completo.

4. Mediana más ruido: Igual que hot deck.

5. Pareamiento por promedios predictivos: Igual que PSM

Raymundo M. Campos Vázquez Imputación

Page 15: Efectos de los Ingresos No Reportados en el Nivel y ...€¦ · mediciones de pobreza en MØxico ignoran a los individuos que reportan trabajar por remuneración pero que deciden

Introducción¿Por qué necesitamos imputación?

Métodos de ImputaciónResultados

Conclusiones

Resultados: Ingreso Individual

A. Promedio de ingreso laboral B. Razón de ingreso laboral

4500

5000

5500

6000

Ingr

eso 

Labo

ral

2005

q1

2005

q3

2006

q1

2006

q3

2007

q1

2007

q3

2008

q1

2008

q3

2009

q1

2009

q3

2010

q1

2010

q3

2011

q1

2011

q3

2012

q1

2012

q3

Periodo

Reportado Puntajes de PropensiónHotDeck Por CeldaPromedios Predictivos

.85

.9.9

51

1.05

Ingr

eso 

Labo

ral, 

2005

:1 =

 1

2005

q1

2005

q3

2006

q1

2006

q3

2007

q1

2007

q3

2008

q1

2008

q3

2009

q1

2009

q3

2010

q1

2010

q3

2011

q1

2011

q3

2012

q1

2012

q3

Periodo

Reportado Puntajes de PropensiónHotDeck Por CeldaPromedios Predictivos

Raymundo M. Campos Vázquez Imputación

Page 16: Efectos de los Ingresos No Reportados en el Nivel y ...€¦ · mediciones de pobreza en MØxico ignoran a los individuos que reportan trabajar por remuneración pero que deciden

Introducción¿Por qué necesitamos imputación?

Métodos de ImputaciónResultados

Conclusiones

Resultados: Desigualdad Ingreso Individual

A. Desigualdad de ingreso B. Razón de desigualdad

.4.4

2.4

4.4

6C

oef. 

Gin

i

2005

q1

2005

q3

2006

q1

2006

q3

2007

q1

2007

q3

2008

q1

2008

q3

2009

q1

2009

q3

2010

q1

2010

q3

2011

q1

2011

q3

2012

q1

2012

q3

Periodo

Reportado Puntajes de PropensiónHotDeck Por CeldaPromedios Predictivos

.9.9

2.9

4.9

6.9

81

Coe

f. G

ini

2005

q1

2005

q3

2006

q1

2006

q3

2007

q1

2007

q3

2008

q1

2008

q3

2009

q1

2009

q3

2010

q1

2010

q3

2011

q1

2011

q3

2012

q1

2012

q3

Periodo

Reportado Puntajes de PropensiónHotDeck Por CeldaPromedios Predictivos

Raymundo M. Campos Vázquez Imputación

Page 17: Efectos de los Ingresos No Reportados en el Nivel y ...€¦ · mediciones de pobreza en MØxico ignoran a los individuos que reportan trabajar por remuneración pero que deciden

Introducción¿Por qué necesitamos imputación?

Métodos de ImputaciónResultados

Conclusiones

Consecuencias en Ingreso Familiar

I Los resultados anteriores se refieren al individuoI Si hogares con mayores ingresos y niveles de educación noreportan, al calcular ingresos por hogar se puede aumentar elproblema.

I Para lo siguiente se incluye a todos los hogares en la ENOE.I Trabajadores sin pago, desempleados o con horas cero tienenun ingreso cero.

Raymundo M. Campos Vázquez Imputación

Page 18: Efectos de los Ingresos No Reportados en el Nivel y ...€¦ · mediciones de pobreza en MØxico ignoran a los individuos que reportan trabajar por remuneración pero que deciden

Introducción¿Por qué necesitamos imputación?

Métodos de ImputaciónResultados

Conclusiones

Resultados: Ingreso Familiar per Cápita

A. Promedio B. Razón

1400

1600

1800

2000

2200

Ingr

eso 

Labo

ral p

er C

ápita

2005

q1

2005

q3

2006

q1

2006

q3

2007

q1

2007

q3

2008

q1

2008

q3

2009

q1

2009

q3

2010

q1

2010

q3

2011

q1

2011

q3

2012

q1

2012

q3

Periodo

Nacional Imputado.8

5.9

.95

11.

051.

1Ín

dice

 de 

Ingr

eso 

Labo

ral p

er C

ápita

2005

q1

2005

q3

2006

q1

2006

q3

2007

q1

2007

q3

2008

q1

2008

q3

2009

q1

2009

q3

2010

q1

2010

q3

2011

q1

2011

q3

2012

q1

2012

q3

Periodo

Nacional Imputado

Raymundo M. Campos Vázquez Imputación

Page 19: Efectos de los Ingresos No Reportados en el Nivel y ...€¦ · mediciones de pobreza en MØxico ignoran a los individuos que reportan trabajar por remuneración pero que deciden

Introducción¿Por qué necesitamos imputación?

Métodos de ImputaciónResultados

Conclusiones

Resultados: Ingreso Familiar per CápitaNo es un problema de los ingresos cero únicamente

1800

2000

2200

2400

2600

Ingr

eso 

Labo

ral p

er C

ápita

2005

q1

2005

q3

2006

q1

2006

q3

2007

q1

2007

q3

2008

q1

2008

q3

2009

q1

2009

q3

2010

q1

2010

q3

2011

q1

2011

q3

2012

q1

2012

q3

Periodo

Hogares con ingreso positivo (sin imputación)Hogares con ingreso imputado

Raymundo M. Campos Vázquez Imputación

Page 20: Efectos de los Ingresos No Reportados en el Nivel y ...€¦ · mediciones de pobreza en MØxico ignoran a los individuos que reportan trabajar por remuneración pero que deciden

Introducción¿Por qué necesitamos imputación?

Métodos de ImputaciónResultados

Conclusiones

Resultados: Pobreza Laboral

A. Pobreza B. ITLP

.3.3

5.4

.45

.5.5

5P

obre

za

2005

q1

2005

q3

2006

q1

2006

q3

2007

q1

2007

q3

2008

q1

2008

q3

2009

q1

2009

q3

2010

q1

2010

q3

2011

q1

2011

q3

2012

q1

2012

q3

Periodo

Nacional IC 95%Imputado IC 95%

.91

1.1

1.2

1.3

Índi

ce T

LP

2005

q1

2005

q3

2006

q1

2006

q3

2007

q1

2007

q3

2008

q1

2008

q3

2009

q1

2009

q3

2010

q1

2010

q3

2011

q1

2011

q3

2012

q1

2012

q3

Periodo

Nacional IC 95%Imputado IC 95%

Raymundo M. Campos Vázquez Imputación

Page 21: Efectos de los Ingresos No Reportados en el Nivel y ...€¦ · mediciones de pobreza en MØxico ignoran a los individuos que reportan trabajar por remuneración pero que deciden

Introducción¿Por qué necesitamos imputación?

Métodos de ImputaciónResultados

Conclusiones

Robustez de resultados

A. Pobreza B. ITLP

.2.3

.4.5

.6P

obre

za

2005

q1

2005

q3

2006

q1

2006

q3

2007

q1

2007

q3

2008

q1

2008

q3

2009

q1

2009

q3

2010

q1

2010

q3

2011

q1

2011

q3

2012

q1

2012

q3

Periodo

Nacional ImputadoIngreso Válido Ingreso Válido+Sin Pago

.91

1.1

1.2

1.3

Índi

ce T

LP

2005

q1

2005

q3

2006

q1

2006

q3

2007

q1

2007

q3

2008

q1

2008

q3

2009

q1

2009

q3

2010

q1

2010

q3

2011

q1

2011

q3

2012

q1

2012

q3

Periodo

Nacional ImputadoIngreso Válido Ingreso Válido+Sin Pago

Raymundo M. Campos Vázquez Imputación

Page 22: Efectos de los Ingresos No Reportados en el Nivel y ...€¦ · mediciones de pobreza en MØxico ignoran a los individuos que reportan trabajar por remuneración pero que deciden

Introducción¿Por qué necesitamos imputación?

Métodos de ImputaciónResultados

Conclusiones

Implicaciones en Pobreza Laboral

I Encuentro que la pobreza laboral está sobreestimada:CONEVAL-pobreza ↑25% para 2005-2012.

I Imputación: ↑12%.I Tomando la población total de INEGI y los % pobrezatenemos que: la medición oficial implica un aumento de lapobreza laboral de 17.3 millones de personas en el periodo2005 a 2012, pero utilizando el ingreso imputado se tiene unincremento de 9.2 millones de personas en ese periodo.

I Es decir, para 2012:3 existen 8.1 millones de personas que sondeclarados como pobres laborales pero, de acuerdo al métodode imputación, no lo son.

I Son número no triviales.

Raymundo M. Campos Vázquez Imputación

Page 23: Efectos de los Ingresos No Reportados en el Nivel y ...€¦ · mediciones de pobreza en MØxico ignoran a los individuos que reportan trabajar por remuneración pero que deciden

Introducción¿Por qué necesitamos imputación?

Métodos de ImputaciónResultados

Conclusiones

ConclusionesResumen

La proporción de trabajadores que no declara ingresos ha ido en aumento, y sucomposición está cambiando de tal manera que cada vez más trabajadores coneducación superior evitan dar información de ingreso.

1. Para el año 2012 el ingreso individual está subestimado enaproximadamente 4%.

2. La caída en la desigualdad de ingresos individuales está sobreestimada.3. El ingreso familiar está subestimado en 36%. En particular, se encuentraque el ingreso familiar per cápita verdadero tiene el mismo valor real en elaño 2005 primer trimestre y el año 2012 tercer trimestre. Mientras que elingreso reportado en ese mismo periodo ha caído cerca de 15 por cientoen términos reales.

4. La pobreza laboral como la calcula CONEVAL está sobreestimada. Tantola subestimación de ingresos familiares como la sobreestimación de lapobreza laboral se deben principalmente a que se toman como ingresoscero los ingresos de personas que sí tienen un ingreso positivo (perodeciden no reportarlo).

Raymundo M. Campos Vázquez Imputación

Page 24: Efectos de los Ingresos No Reportados en el Nivel y ...€¦ · mediciones de pobreza en MØxico ignoran a los individuos que reportan trabajar por remuneración pero que deciden

Introducción¿Por qué necesitamos imputación?

Métodos de ImputaciónResultados

Conclusiones

ConclusionesImplicación de Política Pública

I Esta información es importante, tanto que no tomarla encuenta sesga sustancialmente las cifras oficiales de pobreza ydel ingreso familiar per cápita.

I Existe una seria sobreestimación en la pobreza laboral delpaís, y en la tendencia observada.

I Los resultados anteriores implican que las institucionesoficiales en México deben de considerar imputar los ingresosinválidos siguiendo la misma metodología que en este artículo,o alguna cercana. Suma importancia si se considera asignarrecursos con esa medición.

I Limitación importante y trabajo futuro: ENIGH vs ENOE. Notan sencillo pues ENIGH diferentes fuentes de ingreso.

Raymundo M. Campos Vázquez Imputación