Post on 23-Jul-2015
Ver. 14/04/2023, Pag. # 1
Econometría IIAnálisis de series temporales (I): Procesos estacionarios
Miguel Jerez y Sonia Sotoca
Universidad Complutense de Madrid
Marzo 2010
Ver. 14/04/2023, Pag. # 2
• Introducción
• Conceptos básicos
• Procesos elementales
• Identificación
• Anexo: Estudio de los procesos más comunes
Índice:
Ver. 14/04/2023, Pag. # 3
Introducción (I)
El análisis de series temporales es distinto de la Econometría estudiada anteriormente
Hay tres diferencias principales:
1) No consideramos, de momento, variables exógenas
2) Se trata de construir un modelo sencillo que aproveche la inercia de los datos pasados para predecir los valores futuros de la serie
3) Los datos están ordenados, desde el pasado hasta el futuro
¿Por qué es tan importante el orden de los datos?
Ver. 14/04/2023, Pag. # 4
Introducción (II)
Relación entre edad y estatura de un conjunto de individuos:
• Los datos no se distribuyen en el tiempo (es una “sección cruzada” o “corte transversal”)
• No hay un orden natural de la muestra
• No es razonable suponer que la estatura de un individuo depende de la estatura (o la edad) del individuo anterior (¿cuál es?)
• La dirección de causalidad es natural, pero arbitraria
Relación entre ventas y publicidad de una empresa:
• El orden natural de los datos es el cronológico
• Es razonable que las ventas de hoy dependan de las ventas de ayer
• Es razonable que las ventas de hoy dependan de la publicidad de hoy y de la de ayer
• La mala noticia es que las relaciones son más complejas, la buena es que hay un fundamento objetivo para la causalidad: X causa a Y si el pasado de X ayuda a predecir (o está correlado con) Y
El que los datos de una serie temporal estén ordenados determina qué relaciones son posibles y cuáles no:
Ver. 14/04/2023, Pag. # 5
Introducción (III): Dos series de datos reales
0
100
200
300
400
500
600
700
1950 1952 1954 1956 1958 1960
Pasajeros de líneas aéreas, total mensual
Mile
s d
e p
ers
on
as
Rendimientos diarios del índice NIKKEI de la Bolsa de Tokio. Estos datos:• fluctúan establemente en torno a una
media nula,• muestran períodos de alta y baja
volatilidad
Número de pasajeros de líneas aéreas. Esta serie mensual muestra:• un perfil creciente (tendencia),• fluctuaciones estacionales y• una variabilidad que crece a medida que
aumenta el nivel de la serie.
-15
-10
-5
0
5
10
15
1986 1988 1990 1992 1994 1996
Rendimientos (logx100) del índice NIKKEI
Pu
nto
s lo
g x
10
0
Los primeros y segundos momentos (media y varianza) de distintas series temporales pueden comportarse de formas muy diferentesLas series temporales de naturaleza similar (p. ej., financieras) a menudo presentan rasgos comunes que son de gran utilidad para analizarlas
Ver. 14/04/2023, Pag. # 6
Conceptos básicos (I): Definiciones
Serie temporal, es un conjunto de observaciones o medidas realizadas secuencialmente en intervalos predeterminados y de igual, o aproximadamente igual, duraciónProceso estocástico es un conjunto de variables aleatorias asociadas a distintos instantes de tiempo
• La relación entre una serie temporal y el proceso estocástico que la genera es la misma que hay entre una muestra y la variable aleatoria de la que procede
• Las características peculiares de una serie temporal (frente a una muestra) y de un proceso estocástico (frente a una variable aleatoria) son:– las series temporales y los procesos estocásticos están referidos a instantes de tiempo
concretos, y
– los datos están ordenados desde el pasado hasta el presente
• El objetivo del análisis de series temporales es inferir la forma del proceso estocástico a partir de las series temporales que genera
Ver. 14/04/2023, Pag. # 7
Conceptos básicos (II): Hipótesis simplificatorias
• En ciencias sociales suele ser imposible obtener varias muestras de una serie temporal, por lo que es necesario realizar una serie de supuestos simplificatorios.
• Los supuestos más comunes son:
– Linealidad: El valor que toma hoy la serie (o el proceso) depende linealmente de: a) sus valores pasados y b) los valores presentes y pasados de otras series.
– Estacionariedad (débil): La media y varianza incondicional de una serie (o proceso) son constantes, las autocovarianzas entre dos valores sólo dependen de la distancia temporal que los separa. Formalmente:
– Normalidad: El proceso estocástico generador sigue un modelo normal de distribución de probabilidad (proceso “gaussiano”).
,
, : ( )
[( ) ]
[( )( )]
t t z
t t t z
t t t k t k t k k
t k E z
E z
E z z
m m
m s s
m m g g- -
" = =
- = =
- - = =
2 2 2
Ver. 14/04/2023, Pag. # 8
Un proceso de ruido blanco representa una variable que:• oscila en torno a una media constante,• con una volatilidad constante y• cuyo pasado no contiene información útil para predecir valores futuros.
Podemos representar esta variable como con:
Procesos elementales (I): Ruido blanco.
t tzz am= +
[ ]( ) ( )t z tE z E am= =0 ( )t z aE z s g s= = =2 2 2
0% ;k
k kg
rg
= = ³0
0 1
-.4
-.3
-.2
-.1
.0
.1
.2
.3
.4
100 200 300 400 500
Ruido blanco
La figura muestra el perfil de 500 observaciones simuladas del proceso de ruido blanco:
; iid N(0,.01)t t tz a a= :
Ver. 14/04/2023, Pag. # 9
Un proceso autorregresivo de primer orden, AR(1), representa una variable cuyo valor actual está relacionado con su valor anterior mediante un modelo de regresión. Esto es:
con:
Procesos elementales (II): AR(1).
;t t tz c z aff -= + + <1 1
( )t z
cE z m
f= =
-1( ) a
t zE zs
s gf
= = =-
22 2
0 21% ;k
k kr f= ³ 0
-.4
-.3
-.2
-.1
.0
.1
.2
.3
.4
100 200 300 400 500
AR(1) phi=.5
-.6
-.4
-.2
.0
.2
.4
.6
100 200 300 400 500
AR(1), phi=.9
(estacionariedad)
La figura muestra el perfil de dos series generadas por un AR(1) sin constante, con distintos valores del parámetro :
Ver. 14/04/2023, Pag. # 10
Un proceso de medias móviles de primer orden, MA(1), representa una variable cuyo valor actual está correlado con su valor anterior . Esto es:
Con:
Procesos elementales (III): MA(1).
;t z t tz a am q q-= + - <1 1
( )t zE z m= ( ) ( )t z aE z s g q s= = = +2 2 2 2
0 1%k
si k
si k
qr q
ì -ïï =ïï= +íïï >ïïî
2 11
0 1
-.4
-.3
-.2
-.1
.0
.1
.2
.3
.4
100 200 300 400 500
MA(1), theta=.5
-.4
-.3
-.2
-.1
.0
.1
.2
.3
.4
100 200 300 400 500
ma(1), theta=.9
(invertibilidad)
La figura muestra el perfil de dos series generadas por un proceso MA(1) sin constante, con distintos valores de :
Ver. 14/04/2023, Pag. # 11
Procesos elementales (IV): Paseo aleatorio.
-4
-3
-2
-1
0
1
100 200 300 400 500
Paseo aleatorio sin deriva
Un paseo aleatorio representa una variable cuyos cambios son ruido blanco y, por tanto, imprevisibles. Esto es:
t t ty c y a-+ += 1
La figura muestra el perfil de dos series generadas por paseos aleatorios con y sin deriva. Como puede observarse, la característica fundamental de este proceso es la falta de afinidad de las series a una media estable:
0
10
20
30
40
50
10 20 30 40 50 60 70 80 90 100
Paseo aleatorio con deriva
Ver. 14/04/2023, Pag. # 12
Para contrastar puede usarse el estadístico:
Coeficientes muestrales de asimetría y kurtosis:
La hipótesis de normalidad puede contrastarse mediante el test de Jarque-Bera:
Identificación (I): Estadística descriptiva
0
10
20
30
40
50
60
-0.25 0.00 0.25
Series: WNOISESample 1 500Observations 500
Mean 0.002643Median 0.006559Maximum 0.386147Minimum -0.304903Std. Dev. 0.102973Skewness -0.046988Kurtosis 3.393006
Jarque-Bera 3.401768Probability 0.182522
: XH m =0 0ˆ
/ˆx
n
x
t tn
m
s-= 1:
H0
ˆˆˆ
ni x
i x
XCA
n
ms=
æ ö- ÷ç ÷= ç ÷ç ÷çè øå
3
1
1 ˆˆˆ
ni x
i x
XCK
n
ms=
æ ö- ÷ç ÷= ç ÷ç ÷çè øå
4
1
1
ˆ ˆ( )CA CKJB n c
æ ö- ÷ç ÷= +ç ÷ç ÷÷çè ø
2 222
36 24
:H0
El histograma muestra el perfil de una muestra del proceso:
Obsérvese que los momentos muestrales son muy parecidos a los poblacionales y el test de Jarque-Bera no rechaza normalidad.
; iid N(0,.01)t t tz a a= :
Ver. 14/04/2023, Pag. # 13
El coeficiente muestral de autocorrelación simple de orden k ( ) se define como:
con:
Para hacer inferencia sobre la función de autocorrelación simple (FAS o ACF) pueden usarse los siguientes resultados:• Para muestras suficientemente grandes• Si es cierto entoncesen donde: K es el número de retardos de la ACF
p es el número de parámetros estimados, si la serie es de residuos.
Identificación (II): Función de autocorrelación simple
: KH r r r r= = = = =0 1 2 3 0K
gr
g=
0
$´
ˆ
ˆk
k ; , , ,ˆn
k t t k t tt k
z z z z z kn
g -= +
= = - =å1
112%% % K
r$k
En la figura se muestra la función de autocorrelación simple de una muestra del proceso:
... como puede observarse su configuración se parece, sin coincidir exactamente, a la FAS teórica de un proceso MA(1)
. ; iid N(0,.01)t t t tz a a a-= - 15 :
( ) ( )K
k K pk
Q K n nn k H
r c -=
= +-å
22
10
12 $ :
. .( ) /ks e nr 1$ ;
Ver. 14/04/2023, Pag. # 14
Identificación (III): Función de autocorrelación parcial
Los procesos MA tienen una FAS finita. Por tanto en este caso la FAS resulta muy útil, tanto para detectar una estructura MA como para identificar su orden.
Un instrumento con propiedades análogas para procesos AR es el coeficiente muestral de autocorrelación parcial de orden k ( ), que se define como el k-ésimo coeficiente de una autorregresión de orden k estimada por MCO:
al gráfico de barras de los coeficientes frente a su correspondiente retardo se le llama función de autocorrelación parcial (abreviadamente, FAP o PACF).
f$kk
ˆ ˆ ˆ ˆ ; , ,t k t k t kk t k ktz z z z kff f e- - -= + + + + =1 1 2 2 12% % % %K K
En la figura se muestran las funciones de autocorrelación de una muestra del proceso:
como puede observarse, la FAP identifica con claridad la naturaleza y el orden del proceso generador de los datos.
. ; iid N(0,.01)t t t tz z a a-= +15 :
f$kk
Ver. 14/04/2023, Pag. # 15
Identificación (IV)
Ruido blanco:
AR(1):
-.4
-.3
-.2
-.1
.0
.1
.2
.3
.4
100 200 300 400 500
Ruido blanco
-.4
-.3
-.2
-.1
.0
.1
.2
.3
.4
100 200 300 400 500
AR(1) phi=.5
Combinando instrumentos gráficos y estadísticos pueden reconocerse de forma aproximada las pautas de autocorrelación características de los distintos procesos.
En análisis de series temporales, a este proceso de especificación empírica se le llama “identificación”
; iid N(0,.01)t t tz a a= :
. ; iid N(0,.01)t t t tz z a a-= +15 :
Ver. 14/04/2023, Pag. # 16
MA(1):
Paseo aleatorio:
La identificación puede estructurarse como una secuencia de preguntas:• ¿Es estacionaria la
serie?• ¿Tiene una media
significativa?• ¿Es finita o infinita
la ACF?• ¿Es finita o infinita
la PACF?
-4
-3
-2
-1
0
1
100 200 300 400 500
Paseo aleatorio sin deriva
-.4
-.3
-.2
-.1
.0
.1
.2
.3
.4
100 200 300 400 500
MA(1), theta=.5
Identificación (V)
. ; iid N(0,.01)t t t tz a a a-= - 15 :
; iid N(0,.01)t t t ty y a a-= +1 :
Ver. 14/04/2023, Pag. # 17
Combinando el análisis de la ACF y la PACF, la identificación de los procesos estacionarios puede reducirse a decidir:• ¿Cuál de las dos funciones es finita? para determinar la naturaleza del proceso
generador:
• ¿A partir de qué retardo muere la ACF o PACF? para determinar el orden del proceso.
Estas técnicas requieren usar estadísticos como la media, la varianza o la covarianza muestrales, que sólo tienen sentido si el proceso es estacionario, esto es, si los datos tienen una media y una varianza finitas y aproximadamente constantes.
Identificación (VI)
ACF
Finita Infinita
PACF Finita Ruido blanco AR
Infinita MA ARMA
Ver. 14/04/2023, Pag. # 18
;t t tz c z aff -= + + <1 1
( )t z
cE z m
f= =
-1
( ) at zE z
ss g
f= = =
-
22 2
0 21%
;kkk k
gr f
g= = ³
0
0
f< <0 1
f- < <1 0
A.1. Estudio de los procesos más comunes: AR(1)
ACF PACF
Los procesos AR(1) se reconocen por una ACF infinita y una PACF que se anula a partir del segundo retardo. Si los datos tienen media, es necesario especificar un término constante.
Retardo
+1
-1
Retardo
+1
-1
Retardo
+1
-1
Retardo
+1
-1
Ver. 14/04/2023, Pag. # 19
;t z t tz a am q q-= + - <1 1
( )t zE z m=
( ) ( )t z aE z s g q s= = = +2 2 2 2
0 1%
kk
si k
si k
qg
r qg
ì -ïï =ïï= = +íïï >ïïî
2
0
11
0 1
q< <0 1
q- < <1 0
ACF PACF
Los procesos MA(1) se reconocen por una PACF infinita y una ACF que se anula a partir del segundo retardo.Si los datos tienen media, es necesario especificar un término constante.
A.2. Estudio de los procesos más comunes: MA(1)
Retardo
+1
-1
Retardo
+1
-1
Retardo
+1
-1
Retardo
+1
-1
Ver. 14/04/2023, Pag. # 20
t t t tz c z z aff - -= + + +1 1 2 2
( )t z
cE z m
ff= =
- -1 21
;
con :k k k kr f r f r- -= + ³1 1 2 2 1
;ff > >1 20 0; ;ff ff f+ < - < <2 1 2 1 21 1 1
;ff
r r fff
= = +- -
21 1
1 2 22 21 1
;ff < >1 20 0
ACF PACF
Los procesos AR(2) se reconocen por una ACF infinita y una PACF que se anula a partir del tercer retardo.Si los datos tienen media, es necesario especificar un término constante.
A.3. Estudio de los procesos más comunes: AR(2)
Retardo
+1
-1
Retardo
+1
-1
Retardo
+1
-1
Retardo
+1
-1
Ver. 14/04/2023, Pag. # 21
;ff < <1 20 0
;ff > <1 20 0ACF PACF
A.4. Estudio de los procesos más comunes: AR(2)
Retardo
+1
-1
Retardo
+1
-1
Retardo
+1
-1
Retardo
+1
-1
Ver. 14/04/2023, Pag. # 22
t z t t tz a a am q q- -= + - -1 1 2 2
( )t zE z m=
( ) ( )t z aE z s g q q s= = = + +2 2 2 2 2
0 1 21%
( )
kk
si k
si k
si k
q qq q
g qr
g q q
ì - -ïï =ïï + +ïïï -ïïï= = =íï + +ïïï >ïïïïïîï
1 22 21 2
22 2
0 1 2
11
1
21
0 2
; ;q q q q q+ < - < <2 1 2 1 21 1 1 ;q q> >1 20 0
;q q< >1 20 0
;q q< <1 20 0
;q q> <1 20 0
ACF ACF
Los procesos MA(2) se reconocen por una PACF infinita (no se muestra aquí) y una ACF que se anula a partir del tercer retardo.Si los datos tienen media, es necesario especificar un término constante.
A.5. Estudio de los procesos más comunes: MA(2)
Retardo
+1
-1
Retardo
+1
-1
Retardo
+1
-1
Retardo
+1
-1