Post on 28-May-2018
Decid cuando yo muera L (¡y el día esté lejano!1):
Soberbio y desdeñoso, pródigo y turbulento,
en el vital deliquio por siempre insaciado,
era una llama al viento L.
DEFINICIONES BASICAS
Un proceso estocástico: es una sucesión de variables aleatorias
{Zt/t I∈ ⊆ ZZ }. El subíndice que indica como varía t es el índice2 es del
proceso.
Una serie de tiempo es una sucesión zt, generada al obtener una y solo una
observación de cada una de las variables aleatorias que definen un proceso
estocástico. Las observaciones son tomadas a intervalos de tiempo o de
distancia iguales, según lo indica el índice t que genera la sucesión. En
este sentido, la serie es una realización de un proceso estocástico.
Notación:
Zt: Variable aleatoria definida en el tiempo t.
zt: Valor tomado por la variable aleatoria Zt en el tiempo t o realización
de Zt en el período t.
z1, z2, z3, LL, zn: Serie de tiempo que tiene n observaciones o una
realización del proceso { Zt } cuando t varía entre 1 y n.
n: Origen de los pronósticos. Entero que indica la posición de la última
observación disponible, el presente, o el punto a partir del cual se empieza
a pronosticar.
l: Número entero que indica la posición con respecto a n (número de períodos
contados a partir de n).
Como zt es un valor que toma la variable aleatoria Zt en el tiempo t, si
t < n, zt es una observación del pasado; si t = n, zt es la observación
presente; y si t > n, zt es un valor que tomará la variable Zt. Es claro que
los valores de zt para t > n son desconocidos, uno de los objetivos es
estudiar métodos para estimarlos.
1 Lejanía, que origina la posibilidad de predecir la evolución de una llama alviento.2 El índice puede variar en un subconjunto de los reales, generando asíprocesos continuos. Aquí solo se considerarán procesos estocásticos discretos,cuando el índice varía en los enteros.
página 2
Pronóstico. Predicción de un valor una variable aleatoria, Zn+l, de un
proceso estocástico. n es el origen del pronóstico y l la posición relativa
de la variable a pronosticar con respecto a n.
Generalmente se está interesado en pronósticos de variables aleatorias
futuras, esto es, en predecir valores que toma Zt cuando t > n. (o cuando
l > 0, si se considera n como origen o como valor presente).
Para estimar un pronóstico de la variable Zn + l
, conocida una realización de
Z1, Z2, Z3, LL, Zn, se define un estimador, $ $ ()z o zn n+l l , como:
$ $ $z = z () = En+ nl l [Z n + l |Z1, Z2, LL, Zn] EI-6
$zn + l
es, entonces, una estimación de la esperanza condicional de la
variable aleatoria Zn + l
dado que una realización de Z1, Z2, Z3, LL, Zn es
conocida u ocurrió.
$ $ ()z o zn n+l l denota el pronóstico de Zn + l
calculado con la información
recolectada hasta n. Si l < 0, el pronóstico es una estimación de una
observación pasada; si l = 0 es la estimación de la observación presente; y
si l > 0 representa la estimación de un valor futuro.
$ $ ()z o zn n+l l también es llamado pronóstico calculado en n de una variable
ubicada l períodos adelante.
EJEMPLOS
zz Ejemplo I-1. 3
Sea zt una serie que representa los miles de pasajes internacionales
mensualmente vendidos por una empresa aérea entre enero de 1949 y diciembre
3 Serie tomada del texto Time Series Analysis. Box-Jenkins. Serie estudiada enmuchos textos de series de tiempo para explicar los modelos ARIMA estacionalesmultiplicativos.
página 3
de 1960. Defina claramente el proceso estocástico que genera la serie,
grafique las observaciones y haga un análisis descriptivo de ella.
Solución:
Zt: Miles de pasajes internacionales vendidos en el mes t. Zt es una
variable aleatoria. Al variar t entre 1 y 144, se genera un proceso
estocástico discreto. Las observaciones de este proceso en el período
comprendido entre enero de 1949 y diciembre de 1960, gráfica GI-1a, forman
una serie de tiempo que tiene 144 datos. El período de esta serie es un mes.
Del análisis de la gráfica se concluye que la serie presenta: 1. una
tendencia lineal creciente (note que las observaciones parecen oscilar
alrededor de la recta trazada ); 2. un patrón estacional de período
estacional 12, porque cada año en los meses 7 y 8 se venden más pasajes y en
los meses 11 y 12 se venden menos; este comportamiento repetido a lo largo
de los años produce (cada 12 meses) una periodicidad anual claramente
observada en la gráfica, las porciones de gráfica dentro de las cuadrículas
que definen un año tienen aproximadamente la misma forma. Además se observa
que la amplitud del patrón estacional aumenta con el tiempo y por ello la
estacionalidad es multiplicativa; y 3. una componente aleatoria que altera
la forma determinística de la serie.
Gráfica GI-1a
Del análisis descriptivo se concluye: Zt = Tt * St * εt o Zt = Tt * St + εt
donde Tt = βo + β1t; St tiene una periodicidad 12 (s = 12) y por lo tanto está
página 4
definida por 12 valores; y εt es la componente aleatoria, luego
Zt = (βo + β1t )*St * εt. o Zt = (βo + β1t )*St + εt.
Es mas simple modelar una serie con estacionalidad aditiva que una con
estacionalidad multiplicativa porque en la primera puede suponerse varianza
constante. Por esta razón la mayoría de las series multiplicativas se
transforman en aditivas, éstas se modelan y al final se estima la
transformada inversa de los pronósticos, se corrige el sesgo en los
intervalos de predicción y así se obtienen los pronósticos y los intervalos
de predicción de la serie original.
Con este ejemplo también se quiere comprobar que una serie con
estacionalidad multiplicativa, cuando se ajusta a la primera ecuación, puede
transformarse mediante la función logaritmo en una serie con estacionalidad
aditiva porque ln(Zt) = ln(Tt) + ln(St ) + ln(εt); luego la serie ln(Zt) debe
presentar una serie con estacionalidad aditiva. La gráfica GI-1b de ln(Zt)
vs t confirma la existencia de una tendencia lineal y una estacionalidad
aditiva. Además con la serie aditiva se ilustrará numérica y gráficamente
como una serie (lnzt) puede expresarse en términos de su tendencia,
componente estacional y componente aleatoria.
Gráfica GI-1b
En la tabla TI-1 aparecen las primeras 72 observaciones de Zt, su logaritmo
natural de Zt (lnzt), la tendencia estimada (tend), la componente estacional
(est) y la componente aleatoria (aleat) para la serie lnzt. Esta
información se organizó en grupos de 12 para resaltar el aspecto estacional
página 5
de la serie. En esta tabla puede comprobarse la igualdad planteada para una
serie estacional aditiva (lnzt) y además puede observarse que los valores de
la componente estacional se repiten cada 12 períodos.
Tabla TI-1OBS ZT LNZT TEND EST ALEAT OBS ZT LNZT TEND EST ALEAT
1 112 4.72 4.82 -0.09 -0.02 37 171 5.14 5.18 -0.09 0.04 2 118 4.77 4.83 -0.11 0.05 38 180 5.19 5.19 -0.11 0.11 3 132 4.88 4.84 0.02 0.02 39 193 5.26 5.20 0.02 0.04 4 129 4.86 4.85 -0.01 0.02 40 181 5.20 5.21 -0.01 -0.01 5 121 4.80 4.86 -0.01 -0.06 41 183 5.21 5.23 -0.01 0.00 6 135 4.91 4.87 0.11 -0.08 42 218 5.38 5.24 0.11 0.04 7 148 5.00 4.88 0.22 -0.10 43 230 5.44 5.25 0.22 -0.02 8 148 5.00 4.89 0.21 -0.10 44 242 5.49 5.26 0.21 0.03 9 136 4.91 4.90 0.06 -0.05 45 209 5.34 5.27 0.06 0.02 10 119 4.78 4.91 -0.08 -0.06 46 191 5.25 5.28 -0.08 0.05 11 104 4.64 4.92 -0.22 -0.06 47 172 5.15 5.29 -0.22 0.08 12 118 4.77 4.93 -0.11 -0.06 48 194 5.27 5.30 -0.11 0.08 13 115 4.74 4.94 -0.09 -0.11 49 196 5.28 5.31 -0.09 0.06 14 126 4.84 4.95 -0.11 -0.01 50 196 5.28 5.32 -0.11 0.07 15 141 4.95 4.96 0.02 -0.04 51 236 5.46 5.33 0.02 0.12 16 135 4.91 4.97 -0.01 -0.06 52 235 5.46 5.34 -0.01 0.13 17 125 4.83 4.98 -0.01 -0.14 53 229 5.43 5.35 -0.01 0.10 18 149 5.00 4.99 0.11 -0.10 54 243 5.49 5.36 0.11 0.03 19 170 5.14 5.00 0.22 -0.08 55 264 5.58 5.37 0.22 -0.01 20 170 5.14 5.01 0.21 -0.08 56 272 5.61 5.38 0.21 0.02 21 158 5.06 5.02 0.06 -0.02 57 237 5.47 5.39 0.06 0.02 22 133 4.89 5.03 -0.08 -0.07 58 211 5.35 5.40 -0.08 0.03 23 114 4.74 5.04 -0.22 -0.09 59 180 5.19 5.41 -0.22 0.01 24 140 4.94 5.05 -0.11 -0.01 60 201 5.30 5.42 -0.11 -0.01 25 145 4.98 5.06 -0.09 0.00 61 204 5.32 5.43 -0.09 -0.02 26 150 5.01 5.07 -0.11 0.04 62 188 5.24 5.44 -0.11 -0.09 27 178 5.18 5.08 0.02 0.07 63 235 5.46 5.45 0.02 -0.01 28 163 5.09 5.09 -0.01 0.01 64 227 5.42 5.46 -0.01 -0.02 29 172 5.15 5.10 -0.01 0.05 65 234 5.46 5.47 -0.01 0.00 30 178 5.18 5.11 0.11 -0.04 66 264 5.58 5.48 0.11 -0.01 31 199 5.29 5.12 0.22 -0.05 67 302 5.71 5.49 0.22 0.01 32 199 5.29 5.13 0.21 -0.05 68 293 5.68 5.50 0.21 -0.02 33 184 5.21 5.14 0.06 0.01 69 259 5.56 5.51 0.06 -0.01 34 162 5.09 5.15 -0.08 0.01 70 229 5.43 5.52 -0.08 -0.01 35 146 4.98 5.16 -0.22 0.04 71 203 5.31 5.53 -0.22 0.01 36 166 5.11 5.17 -0.11 0.04 72 229 5.43 5.54 -0.11 0.00
Las gráficas GI-1c, GI-1d y GI-1e representan las componentes de la serie
lnzt: la tendencia lineal, la componente estacional, y la componente
aleatoria respectivamente, estimadas con un modelo de regresión con
variables indicadoras, es explicado en el capítulo 5. Sin embargo, es
conveniente observar que la componente aleatoria obtenida con este modelo
posiblemente contiene la parte correspondiente a la estructura de
correlación existente entre las observaciones.
página 6
Gráfica GI-1c
Gráfica GI-1d
Gráfica GI-1e
z
página 7
zz Ejemplo I-24
Las observaciones prod, del apéndice, representan la producción mensual de
mesas para computador en un taller de una empresa manufacturera desde enero
de 1994 hasta febrero de 1998. Defina un proceso estocástico que genere la
serie, grafique las observaciones y haga un análisis descriptivo de ellas.
Solución:
prodt: La producción de mesas para computador en el mes t es una variable
aleatoria que depende de t. Al variar t entre 1 y 50 se genera un proceso
estocástico.
Gráfica GI-2
Producción de mesas de computador
La sucesión prodt formada al observar la producción mensual desde enero de
1994 hasta febrero de 1998 es una serie de tiempo que tiene 50 datos
(gráfica GI-2). El período de la serie es un mes.
El análisis descriptivo muestra la existencia de una tendencia creciente
cuadrática o cúbica, y de una componente aleatoria que altera la forma
determinística de la serie; no se aprecia un patrón estacional. Por lo tanto
las formas funcionales para modelar la parte estructural de la serie:
Zt = βo + β1t + β2t2 + εt o Zt = βo + β1t + β2t
2 + β3t3 + εt.z
4 Serie simulada.
página 8
zz Ejemplo I-35
Haga el análisis descriptivo del proceso Zt: Indice de precios al consumidor
a nivel nacional en México, en el mes t. Año base 1970.
Solución:
La serie generada por este proceso en el período comprendido entre enero de
1969 y agosto de 1976 consta de 92 observaciones mensuales (gráfica GI-3a).
Gráfica GI-3a
Indice de precios al consumidor. México
Base: 1970 - 100
Origen: Enero 1969
El análisis de la gráfica GI-3a indica la existencia: 1. de una tendencia
creciente, exponencial o lineal con cambio de pendiente alrededor del mes
48; y 2. de una componente aleatoria que altera la forma determinística de
la serie. No se observa un patrón o componente estacional.
Cuando una serie económica presenta una variabilidad alta, generalmente se
modela el porcentaje o la tasa de cambio de Zt (tasa = 100*(Zt - Zt-1)/Zt ) y
esta última serie se modela y pronostica.
5 Ejemplo del texto. Análisis Estadístico de Series de Tiempo Económicas.Víctor Guerrero.
página 9
Gráfica GI-3b
La gráfica GI-3b representa la tasa de cambio mensual del índice de precios
al consumidor en México. El análisis descriptivo muestra una serie de
tendencia constante, con un posible en el nivel de la serie a partir de 48;
también se observa que después de 48 la varianza de la serie aumenta.z
zz Ejemplo I-4
La ficha técnica siguiente corresponde a la serie que representa el
porcentaje trimestral de desempleo en siete ciudades colombianas en el
período comprendido entre el primer trimestre del 84 y el cuarto trimestre
del 96. La información procede de la librería Cedebase de la Universidad de
los Andes.
DEMOGRAFIA Y FUERZA LABORAL TASA DE DESEMPLEO PARA SIETE CIUDADES Bogotá, Cali, Medellín, Barranquilla, Bucaramanga, Manizales yPasto.
Datos comprendidos entre : Marzo 1984 - Diciembre 1996Período : TrimestralUnidades : PorcentajeFuente : Veinte años Encuesta de Hogares 1970 - 1990. Colombia
Estadística 1991, 1992. Encuesta Nacional de Hogares: cuadro No.4,diciembre 1996. Indicadores de Coyuntura Económica, Resultados Preliminaresde 1996, Volumen 2, Numero 1.
Entidad Productora :DANENota Metodológica : A partir del año 1984, se agregaron las ciudades
de Bucaramanga, Manizales y Pasto.
página 10
TRIMESTREAÑO I II III IV1984 13.7 13.6 13.2 13.11985 14.1 14.5 13.9 12.81986 13.9 14.7 13.0 12.21987 13.5 12.2 11.2 10.31988 12.8 11.9 10.2 10.41989 11.0 10.4 9.0 9.41990 10.1 10.9 10.2 10.61991 10.7 10.7 9.8 9.41992 10.6 10.7 10.7 9.81993 9.4 10.8 11.1 9.11994 9.8 9.6 9.1 7.81995 7.8 10.2 9.8 9.51996 10.2 11.4 11.9 11.5
Realice un análisis descriptivo de esta serie.
Solución:
Gráfica GI-4
La serie, t_desem,( gráfica GI-4) presenta: una tendencia decreciente que
puede ser exponencial o lineal en tramos; una componente estacional de
período 4, posiblemente aditiva; una componente aleatoria; y cambios en su
tendencia a partir segundo trimestre del 89 y segundo trimestre del 93,
aproximadamente. zz
página 11
zz Ejemplo I-5 6
Problema. La ciudad de Los Angeles presenta un problema de contaminación en
el aire generado por reacciones químicas entre algunos contaminantes
primarios tales como óxidos de nitrógeno e hidrocarburos reactivos a la luz
solar. Estas reacciones químicas son las responsables de un tipo polución
que produce irritación en los ojos y daños en los pulmones.
Una medida del grado de contaminación fotoquímica es la cantidad de
partículas por millón (ppm) de ozono en la atmósfera. La serie zt representa
el promedio mensual de las lecturas diarias de las ppm de ozono en el centro
de los Angeles, en el período comprendido entre enero de 1955 y diciembre de
1972. La gráfica GI-5 indica su evolución en el intervalo indicado.
Para controlar este problema, la municipalidad de Los Angeles adoptó las
siguientes medidas: 1. En enero de 1960, entró en funcionamiento un
sistema vial alterno, que evita la circulación innecesaria de tráfico por el
centro de la ciudad y empezó la vigencia de una ley que controla el
porcentaje de hidrocarburos reactivos en la gasolina vendida en la ciudad.
2. En enero de 1966 empezó a regir una nueva reglamentación que exigía un
tipo especial de filtro en el carburador de los carros.
El estudio del impacto de estas medidas fue estudiado por Box y Tiao por
medio de un modelo de intervención Arima; aquí se analizará este impacto con
modelos autorregresivos.
Realice un análisis descriptivo del proceso Zt en el período comprendido
entre enero de 1955 y diciembre de 1972 y observe los cambios generados por
estas políticas.
Solución:
1. Análisis descriptivo de la serie, sin tener en cuenta las
intervenciones. En la gráfica GI-5a se observa presencia de una tendencia
decreciente lineal y de una componente estacional posiblemente
multiplicativa de período estacional 12, que alcanza los valores más altos
en los meses 7, 8 y 9 (meses de días más largos y de más sol) y los mas
bajos en los meses 12, 1 y 2 (meses de días más cortos), y de una componente
aleatoria.
6 Box, G. E. P. and Tiao, G. C.(1975) Intervention analysis withapplications to economic and environmental problems. J. Amer.Statis.Assoc.,70, 70-79.
página 12
Gráfica GI-5aPromedio mensual de las partes por millón de ozono
en el centro de los Angeles
POZONO
Mes
2. Para tener en cuenta las intervenciones, se consideran tres secciones: 1a
Sección: Período comprendido entre enero 1955 y diciembre 1959 no hay
regulaciones para controlar la contaminación; 2a Sección. Inicia en enero de
1960, con la apertura del nuevo sistema vial y la regulación sobre el tipo
de gasolina y termina en enero de 1966, con la puesta en marcha de la
segunda medida de control y 3a Sección. Empieza en enero de 1966 con la
regulación sobre las medidas sobre especificaciones en el tipo de carburador
en los motores.
De la gráfica GI-5b se podría concluir que la acción de las políticas
implementadas sólo afectó la amplitud del período estacional. Observe que
el promedio mensual de las ppm de ozono disminuyó en los meses 7, 8 y 9. Un
efecto similar parece ser el resultado producido por la segunda
intervención. Cambios en la tendencia y en el nivel medio de la serie o en
la estructura de la serie no se aprecian (esto no significa que no existan).
En conclusión, la efectividad de las intervenciones se aprecia en los meses
de verano. Observe el cambio en la amplitud de la onda anual.
3. La gráfica GI-5c, muestra las tendencias significativas obtenidas al
modelar las intervenciones sufridas por la serie. De ella se puede
concluir: la primera sección de la serie presenta una tendencia constante, Zt
oscila periódicamente alrededor de un valor promedio, y no lineal
decreciente, como la gráfica total lo sugiere. La puesta en marcha de las
primeras medidas (2a sección) causó una disminución en el nivel promedio
mensual de las ppm de ozono y en la amplitud de la onda estacional, pero no
cambió la tendencia de la serie constante. Y finalmente se observa que la
página 13
segunda intervención (3a sección) produjo en la serie una tendencia lineal
decreciente y quizás un cambio en la amplitud de la onda anual.
Gráfica GI-5bModelación de la tendencia sin considerar las
intervenciones
POZONO
Mes
Gráfica GI-5cCambios en la tendencia producidas por las
intervenciones
POZONO
Mes
Con este ejemplo se quiere mostrar que si existe una información adicional
sobre factores externos que afectan el proceso bajo estudio, el manejo de la
serie es más objetivo y además tiene más aplicación práctica.z