Notas de Clase (Modelos de Duración)

download Notas de Clase (Modelos de Duración)

of 6

Transcript of Notas de Clase (Modelos de Duración)

  • 8/18/2019 Notas de Clase (Modelos de Duración)

    1/6

    Nota de Clase 1

    Modelos de Duración: Generalidades

    1. 

    ¿Por qué modelos de duración?

    Los modelos de duración utilizados en economía tienen su origen en las ciencias

     biomédicas y en la ingeniería. De ahí adoptan su nombre original: modelos de

    sobrevivencia (survival models). El objetivo general de estos modelos es estudiar el

    tiempo que tarda un determinado fenómeno en ocurrir o el tiempo en que un

    determinado individuo permanece en un determinado estado. Para ello, debe definirse

    un grupo de individuos en un estado inicial para quienes un determinado evento

    claramente definido puede ocurrir en el futuro. Dicho evento se conoce como falla

    (failure), el cual ocurre luego de un tiempo (failure time) y puede darse una sola vez por

    individuo. El ejemplo típico en esta tradición es el fallecimiento de un paciente luego de

    una determinada intervención quirúrgica o procedimiento médico. Así, la falla sería la

    muerte del individuo y se trata de estudiar el tiempo que sobrevivió desde laintervención realizada (duración). Este tipo de información resulta sumamente valiosa

     para la medicina ya que permite predecir la esperanza de vida de los pacientes o las

    consecuencias de ciertos procedimientos médicos.

    En economía también estamos interesados en estudiar los fenómenos en términos de su

    duración. Por ejemplo, nos interesa saber el tiempo en que dura el desempleo. Así, el

    estado inicial de los individuos es estar sin trabajo, la falla sería el momento en que

    encuentran empleo (cambia de estado) y el tiempo de falla los meses o semanas en que

    el individuo se encuentra desempleado (duración en un mismo estado). Las

    conclusiones que ofrece un análisis sobre la duración del desempleo (y sus

    determinantes) tiene importantes implicancias en la ciencia económica en la medida que permitiría diseñar políticas orientadas a reducir el periodo de inactividad, calcular tasas

    óptimas de seguro de desempleo o identificar cuanto tarda un individuo en cambiarse de

    un empleo a otro. Este último factor asociado a políticas de reconversión laboral, por

    ejemplo.

    Es posible pensar en otros fenómenos que pueden ser estudiados mediante modelos de

    duración. Así, por ejemplo, aquellos interesados en gestión de programas sociales

    estarían interesados en analizar el tiempo en que un pobre deja de utilizar un

    determinado programa. De modo similar, existen aplicaciones en el mundo de los

    negocios para predecir el momento de quiebra de una empresa o en el mundo bancario

     para estudiar demoras en el pago de crédito o cuanto demora un deudor en entrar endefault. En economía de la regulación podría utilizarse para estudiar el tiempo que

    demora que las tarifas locales (por ejemplo, precios locales de los derivados del

     petróleo) se ajustan ante un cambio en el precio de referencia internacional (WTI, por

    ejemplo). Incluso, recientemente las ciencias políticas han adoptado este tipo de

    modelos para predecir reelecciones o duración de conflictos sociales y el marketing para

    estudiar el tiempo que le toma a un comprador decidir su compra. Finalmente, en

    macroeconomía recientes aplicaciones han demostrado que son muy útiles para analizar

    la efectividad de los esquemas de metas explícitas de inflación. En tal contexto, se

    intenta estudiar cuanto tiempo tarda la inflación en converger al rango meta dado que un

     país adopta tal esquema.

  • 8/18/2019 Notas de Clase (Modelos de Duración)

    2/6

    En resumen, los modelos de duración tienen una amplia aplicabilidad en economía ya

    que pueden considerarse una forma alternativa (y ciertamente complementaria) de

    analizar los fenómenos sociales frente a lo que ofrecen los modelos de corte transversal

    tradicionales o aquellos de series de tiempo. Así, en un modelo de corte transversal el

    investigador está interesado en estudiar los determinantes de “estar” en un determinado

    estado. Su naturaleza estática permite estudiar los eventos tal y como aparecen en larealidad en un momento determinado en el tiempo a partir de las diferencias “entre”

    individuos en diferentes estados. Mientras tanto, los modelos de series de tiempo

    analizan los determinantes de los “cambios” de estado que presenta  un determinado

    individuo a lo largo del tiempo. Su naturaleza dinámica le permite estudiar individuos

    en continuo movimiento. Por contraste, un modelo de duración estudia el tiempo en que

    un individuo “ permanece” en un determinado  estado o dicho de otro modo la

     probabilidad de que cambie de estado, condicionado a que ha permanecido cierto

    tiempo en un estado diferente.

    En las siguientes secciones de estas notas de clase se definirán los conceptos asociados a

    los modelos de duración. El entendimiento de tales conceptos y su ámbito de aplicaciónen el presente contexto permitirá guiar la discusión de las próximas notas de clase. Así,

    interesa definir: tiempo de falla (failure time), censura, función de superviviencia

    (survivor), función de riesgo (hazard) y función de riesgo acumulado.

    2. 

    Tiempo de falla (failure time)

    El tiempo de falla es el tiempo en que un individuo se mantiene en un determinado

    estado o lapso de tiempo en que un fenómeno toma lugar. Existen tres requisitos para

    definirlo de manera precisa:

    a) 

    El origen debe estar bien definido o estar establecido sin ambigüedades. Se

    considera que el origen es la entrada de un individuo al estado de la naturaleza

    inicial. Por ejemplo, el momento en que pierde el trabajo, cuando la huelga se

    inicia o cuando el pobre comienza a recibir ayuda estatal. Esta representado por

    un punto específico en el calendario. No es necesario que el origen o entrada de

    cada individuo sea el mismo, pero para cada uno de ellos debe estar identificado

     precisamente.

     b)  La escala temporal debe ser precisa y común para todos los individuos.

     Normalmente se utiliza tiempo real: minutos, horas, días, semanas, meses, años,

    décadas. Sin embargo existen otras opciones (algún vector dimensión quereemplace al tiempo) dependiendo de la aplicación. En estadística aplicada, por

    ejemplo, una escala podría ser el número de re-muestreos necesarios para que un

    determinado parámetro converja o en la industria automovilística se ha utilizado

    los kilómetros que recorre un auto antes que una pieza falle. En economía

    normalmente es el tiempo real y el investigador solo debe tener cuidado en que

    sea la misma escala para cada individuo y que no cambie a lo largo de todo el

    experimento.

    c) 

    El concepto de falla debe estar claramente establecido. Al igual que en el caso

    del origen o entrada, las condiciones de falla o salida deben ser precisas, claras y

    factibles para todo individuo en el estado de la naturaleza original. Por ejemplo,en el caso de duración del desempleo, la salida puede darse porque el individuo

  • 8/18/2019 Notas de Clase (Modelos de Duración)

    3/6

    encontró trabajo, porque inicio estudios, porque falleció, porque se desanimó y

    se retiró del mercado de trabajo. El investigador debe ser claro en que categorías

    incluirá en su análisis de modo que sus resultados sean interpretables.

    Gráficamente lo que nos interesa establecer es

     A B

    Origen o entrada Falla o salida

    Tiempo de falla

    mes 1 mes n…

     

    3.  Censura

    Los datos económicos utilizados en los modelos de duración por naturaleza están

    censurados. De este modo, en la modelación y en las estimaciones resultantes estarán

     presentes las consecuencias econométricas de este problema (sesgo) si es que no se

    resuelve adecuadamente. El problema surge porque la observación en este tipo de

    aplicaciones es la duración de un evento y típicamente la data es recogida en un

    momento en el tiempo cuando para algunos individuos el proceso estará completo

    (observaciones no censuradas), pero para otros individuos no (observaciones

    censuradas).

    Por ejemplo, en el caso de desempleo imaginemos que se dispone de una encuesta en

    Lima Metropolitana que ha recogido información acerca de la participación en elmercado laboral de 100 individuos desempleados durante el año 2008. Luego,

    supongamos que 10 de estos individuos logran encontrar empleo en marzo, 40 de ellos

    en julio y 20 en noviembre. Los 30 restantes continúan desempleados en diciembre

    cuando la encuesta dejó de ser aplicada. De este modo, para 70 individuos el proceso

    completo puede observarse (datos no censurados), pero para 30 de ellos no (datos

    censurados). Analizar la duración de desempleo para los 100 individuos bajo estas

    condiciones dará como resultado, estimadores sesgado; problema que debe resolverse

    durante la estimación. Más adelante en el curso se discute la corrección, la cual como ya

    intuyó el alumno es mediante un procedimiento similar a los modelos Tobit o Heckman.

    T1

    C

    t1

    T2t

    2

    Individuo 1

    Individuo 2

     

  • 8/18/2019 Notas de Clase (Modelos de Duración)

    4/6

     

    Se puede definir la censura de modo más formal con ayuda del gráfico anterior. En la

    ausencia de censura, el individuo i   presenta un tiempo de fallai

    T  , la cual es una

    variable aleatoria. Luego, definimos un momentoi

    C    que es el momento en que los

    datos para i   dejan de ser observados. Si es que para ese momento el proceso se ha

    completado (caso de individuo 2) el dato no está censurado. Si es que el proceso no ha

    sido completado (caso del individuo 1), la observación presenta censura eni

    C  . De este

    modo, las observaciones son realmente de la forma ],[nmi iii   C T  X     donde i X   es lo

    que realmente observa el investigador junto con la variable 1i y  si es que ii   C T    (el

    set de observaciones no censuradas; el caso del individuo 2) e 0i y  cuando ii   C T    (el

    set de observaciones censuradas, el caso del individuo 1).

    4.  La función de riesgo (hazard)

    En base a la discusión anterior, se define como duración a la variable aleatoria continuaT    (se han eliminado los subíndices por conveniencia). Así, un determinado individuo

    “entra” a un estado inicial en el momento 0T  siendo T   el tiempo en que el individuose mantiene en dicho estado. Luego, es posible definir a una persona que ha venido

     perteneciendo al estado inicial por un lapso de tiempo t  y que cambiará de estado en un

     periodo de tiempo muy pequeño definido como t  , luego de t . De este modo interesainvestigar la siguiente probabilidad:

    ]|[Pr    t T t t T t ob     (1)

    Es decir interesa investigar la probabilidad que el tiempo de falla sea entre t  y t t     (   t t T t    ) condicionado a que el individuo continua en el estado inicial almomento t   (   t T   ). En simple, la condición implica que el individuo no ha “salido”antes de t . Es posible dividir esta probabilidad entre t   para obtener la probabilidad

     promedio de salida por unidad de tiempo luego de t . Además interesa que esta unidad

    de tiempo sea muy pequeña para introducir el concepto “instantáneo”. Así, se calcula  

    t T t t T t obt 

    ]|[Pr lim)(

    0    (2)

    donde )(t   se conoce como la función de riesgo (hazard function) o ratio de riesgo

    (hazard rate) y se define como el ratio instantáneo de salida por unidad de tiempo en elmomento t . Luego, t t  )(   (o lo que es lo mismo dt t )(  , para intervalos muy cercanos

    a cero) es la probabilidad de salida del estado inicial en un intervalo de tiempo corto t   luego de t  condicionado a que en t , el individuo continua en el estado inicial. Nótese

    que es posible definir también una probabilidad no condicionada, si es que se deja de

    lado la condición t T   . Este concepto es claramente diferente a la función de riesgodefinida previamente.

    5.  La función de supervivencia (survivor)

    Definamos la probabilidad )(][Pr    t  F t T ob   , donde )(t  F   representa una probabilidadacumulada, y )(1][Pr    t  F t T ob   . Esta última es conocida como la función de

  • 8/18/2019 Notas de Clase (Modelos de Duración)

    5/6

    supervivencia e indica la probabilidad de que un determinado individuo se mantiene en

    el estado inicial al menos t   periodos o en términos de frecuencias (y utilizando el

    ejemplo médico anterior) indica la proporción de individuos que “sobreviven” al menos

    t  periodos o que para el periodo t  continúan “vivos”. Por su significado, conviene darle

    una notación especial. Así, se define

    )(1)(   t  F t S      (3)

    6.  Relación entre la función de supervivencia y la función de riesgo

    Recordemos que la derivada de la acumulada es la densidad, por lo tanto

    )(/)(   t   f  t t  F    , donde )(t   f   es la densidad y estableciendo la nomenclatura de la

     probabilidad condicional )(/),()|(   y  f   y x  f   y x  f     , podemos establecer

    ][Pr 

    ],[Pr ]|[Pr 

    t T ob

    t T t t T t obt T t t T t ob

      (4)

    El numerador de (4) es la probabilidad conjunta de “la salida del estado inicial en el

    intervalo de tiempo determinado” y de que “la duración sea t T   ”. Para operarconviene tomar en cuenta las siguientes propiedades probabilísticas:

    )(Pr /),(Pr )|(Pr    Bob B Aob B Aob    

    )(Pr /),(Pr )|(Pr    Aob B Aob A Bob    

    )(Pr *)|(Pr ),(Pr    Aob A Bob B Aob   ,

    En el caso planteado esto implica que

    ][Pr *]|[Pr ],[Pr    t t T t obt t T t t T obt T t t T t ob     (5)

     Nótese que el primer múltiplo del lado derecho de la expresión (5) es necesariamente

    igual a 1, de modo que dicha expresión queda expresada como

    ][Pr ],[Pr    t t T t obt T t t T t ob     (6)

    Esto permite reescribir (4) de la siguiente forma

    ][Pr 

    ][Pr ]|[Pr 

    t T ob

    t t T t obt T t t T t ob

      (7)

    que en términos de las distribuciones acumuladas es

    )(1

    )()(]|[Pr 

    t  F 

    t  F t t  F t T t t T t ob

      (8)

    la cual conviene dividirla entre t   y tomar el límite de modo que se obtiene

  • 8/18/2019 Notas de Clase (Modelos de Duración)

    6/6

    )(1

    1)()(lim

    ]|[Pr lim)(

    00 t  F t 

    t  F t t  F 

    t T t t T t obt 

    t t 

        (9)

     Nótese que la primera expresión del lado derecho de la expresión (9) es la derivada de

    )(t  F   con respecto a t  que es igual a )(t   f   . De este modo,

    )(

    )(

    )(1

    )()(

    t S 

    t   f  

    t  F 

    t   f  t   

        (10)

    De modo que (10) es una versión más corta de la función de riesgo.

    7.  La función de riesgo acumulado

    Podemos definir el logaritmo de la función de supervivencia )](log[   t S    y hallar su

    derivada con respecto al argumento t . Así, )()]([)(1

    1)](1log[

    t t   f  t  F dt 

    t  F d 

     

    ;

    lo que conlleva a la expresión general

    dt 

    t S d t 

      )](log[)(       (11)

    Por lo tanto se puede definir una función )(t  como la integral de )(t   en (11), que

    evidentemente dará como resultado:

    )](log[)()(0

    t S dt t t 

        (12)

    Es importante establecer que la función )(t  sigue una distribución de valor extremo,

     propiedad que resultará de importancia más adelante en el curso.