Notas de Clase (Modelos de Duración)

8/18/2019 Notas de Clase (Modelos de Duración)

1/6

Nota de Clase 1

Modelos de Duración: Generalidades

1.

¿Por qué modelos de duración?

Los modelos de duración utilizados en economía tienen su origen en las ciencias

biomédicas y en la ingeniería. De ahí adoptan su nombre original: modelos de

sobrevivencia (survival models). El objetivo general de estos modelos es estudiar el

tiempo que tarda un determinado fenómeno en ocurrir o el tiempo en que un

determinado individuo permanece en un determinado estado. Para ello, debe definirse

un grupo de individuos en un estado inicial para quienes un determinado evento

claramente definido puede ocurrir en el futuro. Dicho evento se conoce como falla

(failure), el cual ocurre luego de un tiempo (failure time) y puede darse una sola vez por

individuo. El ejemplo típico en esta tradición es el fallecimiento de un paciente luego de

una determinada intervención quirúrgica o procedimiento médico. Así, la falla sería la

muerte del individuo y se trata de estudiar el tiempo que sobrevivió desde laintervención realizada (duración). Este tipo de información resulta sumamente valiosa

para la medicina ya que permite predecir la esperanza de vida de los pacientes o las

consecuencias de ciertos procedimientos médicos.

En economía también estamos interesados en estudiar los fenómenos en términos de su

duración. Por ejemplo, nos interesa saber el tiempo en que dura el desempleo. Así, el

estado inicial de los individuos es estar sin trabajo, la falla sería el momento en que

encuentran empleo (cambia de estado) y el tiempo de falla los meses o semanas en que

el individuo se encuentra desempleado (duración en un mismo estado). Las

conclusiones que ofrece un análisis sobre la duración del desempleo (y sus

determinantes) tiene importantes implicancias en la ciencia económica en la medida que permitiría diseñar políticas orientadas a reducir el periodo de inactividad, calcular tasas

óptimas de seguro de desempleo o identificar cuanto tarda un individuo en cambiarse de

un empleo a otro. Este último factor asociado a políticas de reconversión laboral, por

ejemplo.

Es posible pensar en otros fenómenos que pueden ser estudiados mediante modelos de

duración. Así, por ejemplo, aquellos interesados en gestión de programas sociales

estarían interesados en analizar el tiempo en que un pobre deja de utilizar un

determinado programa. De modo similar, existen aplicaciones en el mundo de los

negocios para predecir el momento de quiebra de una empresa o en el mundo bancario

para estudiar demoras en el pago de crédito o cuanto demora un deudor en entrar endefault. En economía de la regulación podría utilizarse para estudiar el tiempo que

demora que las tarifas locales (por ejemplo, precios locales de los derivados del

petróleo) se ajustan ante un cambio en el precio de referencia internacional (WTI, por

ejemplo). Incluso, recientemente las ciencias políticas han adoptado este tipo de

modelos para predecir reelecciones o duración de conflictos sociales y el marketing para

estudiar el tiempo que le toma a un comprador decidir su compra. Finalmente, en

macroeconomía recientes aplicaciones han demostrado que son muy útiles para analizar

la efectividad de los esquemas de metas explícitas de inflación. En tal contexto, se

intenta estudiar cuanto tiempo tarda la inflación en converger al rango meta dado que un

país adopta tal esquema.


2/6

En resumen, los modelos de duración tienen una amplia aplicabilidad en economía ya

que pueden considerarse una forma alternativa (y ciertamente complementaria) de

analizar los fenómenos sociales frente a lo que ofrecen los modelos de corte transversal

tradicionales o aquellos de series de tiempo. Así, en un modelo de corte transversal el

investigador está interesado en estudiar los determinantes de “estar” en un determinado

estado. Su naturaleza estática permite estudiar los eventos tal y como aparecen en larealidad en un momento determinado en el tiempo a partir de las diferencias “entre”

individuos en diferentes estados. Mientras tanto, los modelos de series de tiempo

analizan los determinantes de los “cambios” de estado que presenta un determinado

individuo a lo largo del tiempo. Su naturaleza dinámica le permite estudiar individuos

en continuo movimiento. Por contraste, un modelo de duración estudia el tiempo en que

un individuo “ permanece” en un determinado estado o dicho de otro modo la

probabilidad de que cambie de estado, condicionado a que ha permanecido cierto

tiempo en un estado diferente.

En las siguientes secciones de estas notas de clase se definirán los conceptos asociados a

los modelos de duración. El entendimiento de tales conceptos y su ámbito de aplicaciónen el presente contexto permitirá guiar la discusión de las próximas notas de clase. Así,

interesa definir: tiempo de falla (failure time), censura, función de superviviencia

(survivor), función de riesgo (hazard) y función de riesgo acumulado.

2.

Tiempo de falla (failure time)

El tiempo de falla es el tiempo en que un individuo se mantiene en un determinado

estado o lapso de tiempo en que un fenómeno toma lugar. Existen tres requisitos para

definirlo de manera precisa:

a)

El origen debe estar bien definido o estar establecido sin ambigüedades. Se

considera que el origen es la entrada de un individuo al estado de la naturaleza

inicial. Por ejemplo, el momento en que pierde el trabajo, cuando la huelga se

inicia o cuando el pobre comienza a recibir ayuda estatal. Esta representado por

un punto específico en el calendario. No es necesario que el origen o entrada de

cada individuo sea el mismo, pero para cada uno de ellos debe estar identificado

precisamente.

b) La escala temporal debe ser precisa y común para todos los individuos.

Normalmente se utiliza tiempo real: minutos, horas, días, semanas, meses, años,

décadas. Sin embargo existen otras opciones (algún vector dimensión quereemplace al tiempo) dependiendo de la aplicación. En estadística aplicada, por

ejemplo, una escala podría ser el número de re-muestreos necesarios para que un

determinado parámetro converja o en la industria automovilística se ha utilizado

los kilómetros que recorre un auto antes que una pieza falle. En economía

normalmente es el tiempo real y el investigador solo debe tener cuidado en que

sea la misma escala para cada individuo y que no cambie a lo largo de todo el

experimento.

c)

El concepto de falla debe estar claramente establecido. Al igual que en el caso

del origen o entrada, las condiciones de falla o salida deben ser precisas, claras y

factibles para todo individuo en el estado de la naturaleza original. Por ejemplo,en el caso de duración del desempleo, la salida puede darse porque el individuo


3/6

encontró trabajo, porque inicio estudios, porque falleció, porque se desanimó y

se retiró del mercado de trabajo. El investigador debe ser claro en que categorías

incluirá en su análisis de modo que sus resultados sean interpretables.

Gráficamente lo que nos interesa establecer es

A B

Origen o entrada Falla o salida

Tiempo de falla

mes 1 mes n…

3. Censura

Los datos económicos utilizados en los modelos de duración por naturaleza están

censurados. De este modo, en la modelación y en las estimaciones resultantes estarán

presentes las consecuencias econométricas de este problema (sesgo) si es que no se

resuelve adecuadamente. El problema surge porque la observación en este tipo de

aplicaciones es la duración de un evento y típicamente la data es recogida en un

momento en el tiempo cuando para algunos individuos el proceso estará completo

(observaciones no censuradas), pero para otros individuos no (observaciones

censuradas).

Por ejemplo, en el caso de desempleo imaginemos que se dispone de una encuesta en

Lima Metropolitana que ha recogido información acerca de la participación en elmercado laboral de 100 individuos desempleados durante el año 2008. Luego,

supongamos que 10 de estos individuos logran encontrar empleo en marzo, 40 de ellos

en julio y 20 en noviembre. Los 30 restantes continúan desempleados en diciembre

cuando la encuesta dejó de ser aplicada. De este modo, para 70 individuos el proceso

completo puede observarse (datos no censurados), pero para 30 de ellos no (datos

censurados). Analizar la duración de desempleo para los 100 individuos bajo estas

condiciones dará como resultado, estimadores sesgado; problema que debe resolverse

durante la estimación. Más adelante en el curso se discute la corrección, la cual como ya

intuyó el alumno es mediante un procedimiento similar a los modelos Tobit o Heckman.

T1

C

t1

T2t

2

Individuo 1

Individuo 2


4/6

Se puede definir la censura de modo más formal con ayuda del gráfico anterior. En la

ausencia de censura, el individuo i presenta un tiempo de fallai

T , la cual es una

variable aleatoria. Luego, definimos un momentoi

C que es el momento en que los

datos para i dejan de ser observados. Si es que para ese momento el proceso se ha

completado (caso de individuo 2) el dato no está censurado. Si es que el proceso no ha

sido completado (caso del individuo 1), la observación presenta censura eni

C . De este

modo, las observaciones son realmente de la forma ],[nmi iii C T X donde i X es lo

que realmente observa el investigador junto con la variable 1i y si es que ii C T (el

set de observaciones no censuradas; el caso del individuo 2) e 0i y cuando ii C T (el

set de observaciones censuradas, el caso del individuo 1).

4. La función de riesgo (hazard)

En base a la discusión anterior, se define como duración a la variable aleatoria continuaT (se han eliminado los subíndices por conveniencia). Así, un determinado individuo

“entra” a un estado inicial en el momento 0T siendo T el tiempo en que el individuose mantiene en dicho estado. Luego, es posible definir a una persona que ha venido

perteneciendo al estado inicial por un lapso de tiempo t y que cambiará de estado en un

periodo de tiempo muy pequeño definido como t , luego de t . De este modo interesainvestigar la siguiente probabilidad:

]|[Pr t T t t T t ob (1)

Es decir interesa investigar la probabilidad que el tiempo de falla sea entre t y t t ( t t T t ) condicionado a que el individuo continua en el estado inicial almomento t ( t T ). En simple, la condición implica que el individuo no ha “salido”antes de t . Es posible dividir esta probabilidad entre t para obtener la probabilidad

promedio de salida por unidad de tiempo luego de t . Además interesa que esta unidad

de tiempo sea muy pequeña para introducir el concepto “instantáneo”. Así, se calcula

t

t T t t T t obt

t

]|[Pr lim)(

0 (2)

donde )(t se conoce como la función de riesgo (hazard function) o ratio de riesgo

(hazard rate) y se define como el ratio instantáneo de salida por unidad de tiempo en elmomento t . Luego, t t )( (o lo que es lo mismo dt t )( , para intervalos muy cercanos

a cero) es la probabilidad de salida del estado inicial en un intervalo de tiempo corto t luego de t condicionado a que en t , el individuo continua en el estado inicial. Nótese

que es posible definir también una probabilidad no condicionada, si es que se deja de

lado la condición t T . Este concepto es claramente diferente a la función de riesgodefinida previamente.

5. La función de supervivencia (survivor)

Definamos la probabilidad )(][Pr t F t T ob , donde )(t F representa una probabilidadacumulada, y )(1][Pr t F t T ob . Esta última es conocida como la función de


5/6

supervivencia e indica la probabilidad de que un determinado individuo se mantiene en

el estado inicial al menos t periodos o en términos de frecuencias (y utilizando el

ejemplo médico anterior) indica la proporción de individuos que “sobreviven” al menos

t periodos o que para el periodo t continúan “vivos”. Por su significado, conviene darle

una notación especial. Así, se define

)(1)( t F t S (3)

6. Relación entre la función de supervivencia y la función de riesgo

Recordemos que la derivada de la acumulada es la densidad, por lo tanto

)(/)( t f t t F , donde )(t f es la densidad y estableciendo la nomenclatura de la

probabilidad condicional )(/),()|( y f y x f y x f , podemos establecer

][Pr

],[Pr ]|[Pr

t T ob

t T t t T t obt T t t T t ob

(4)

El numerador de (4) es la probabilidad conjunta de “la salida del estado inicial en el

intervalo de tiempo determinado” y de que “la duración sea t T ”. Para operarconviene tomar en cuenta las siguientes propiedades probabilísticas:

)(Pr /),(Pr )|(Pr Bob B Aob B Aob

)(Pr /),(Pr )|(Pr Aob B Aob A Bob

)(Pr *)|(Pr ),(Pr Aob A Bob B Aob ,

En el caso planteado esto implica que

][Pr *]|[Pr ],[Pr t t T t obt t T t t T obt T t t T t ob (5)

Nótese que el primer múltiplo del lado derecho de la expresión (5) es necesariamente

igual a 1, de modo que dicha expresión queda expresada como

][Pr ],[Pr t t T t obt T t t T t ob (6)

Esto permite reescribir (4) de la siguiente forma

][Pr

][Pr ]|[Pr

t T ob

t t T t obt T t t T t ob

(7)

que en términos de las distribuciones acumuladas es

)(1

)()(]|[Pr

t F

t F t t F t T t t T t ob

(8)

la cual conviene dividirla entre t y tomar el límite de modo que se obtiene


6/6

)(1

1)()(lim

]|[Pr lim)(

00 t F t

t F t t F

t

t T t t T t obt

t t

(9)

Nótese que la primera expresión del lado derecho de la expresión (9) es la derivada de

)(t F con respecto a t que es igual a )(t f . De este modo,

)(

)(

)(1

)()(

t S

t f

t F

t f t

(10)

De modo que (10) es una versión más corta de la función de riesgo.

7. La función de riesgo acumulado

Podemos definir el logaritmo de la función de supervivencia )](log[ t S y hallar su

derivada con respecto al argumento t . Así, )()]([)(1

1)](1log[

t t f t F dt

t F d

;

lo que conlleva a la expresión general

dt

t S d t

)](log[)( (11)

Por lo tanto se puede definir una función )(t como la integral de )(t en (11), que

evidentemente dará como resultado:

)](log[)()(0

t S dt t t

t

(12)

Es importante establecer que la función )(t sigue una distribución de valor extremo,

propiedad que resultará de importancia más adelante en el curso.

Notas de Clase (Modelos de Duración)

Documents

Transcript of Notas de Clase (Modelos de Duración)