Zmiany strukturalne i/a zjawisko długiej pamięci w szeregach czasowych Robert Kozarski SGH Zjawisko długiej pamięci (long memory) lub zależności długookresowej (long range dependance) oznacza, że funkcja.

Download Report

Transcript Zmiany strukturalne i/a zjawisko długiej pamięci w szeregach czasowych Robert Kozarski SGH Zjawisko długiej pamięci (long memory) lub zależności długookresowej (long range dependance) oznacza, że funkcja.

Zmiany strukturalne i/a zjawisko
długiej pamięci w szeregach
czasowych
Robert Kozarski SGH
Zjawisko długiej pamięci (long memory)
lub zależności długookresowej (long range dependance)
oznacza, że funkcja autokorelacyjna szeregu czasowego
wygasa w tempie hiperbolicznym,
a nie wykładniczo jak to jest w przypadku procesów mających
reprezentację w postaci procesu ARMA.
Tym samym pojawiające się zaburzenia są długo oddziałują na
zachowanie się badanego zjawiska,
lub inaczej
obserwacje odległe w czasie są nadal od siebie zależne
(skorelowane).
Zjawisko długiej pamięci zostało zaobserwowane
po raz pierwszy przez
hydrologa i konstruktora tam na Nilu
Harolda Hursta (Hurst [1951]),
który zauważył, że tradycyjne metody
zawodzą w przypadku prognozowania
poziomu Nilu. Wprowadził wykładnik Hursta H
(pierwotnie oznaczył to jako k) będący miarą
zmienności poziomu zmienności wody
Własność długiej pamięci można zdefiniować (por. Baillie [1996]):
1) Jeśli proces dyskretny proces xt ma funkcje autokorelacyjną  j dla opóźnień j.
n
lim   j  
n
j  n
2) Funkcja gęstości spektralnej jest nieograniczona dla częstotliwości
lim f (  )  ,   2j ,
 0
n
j  1,2,, n.
3) Bardziej ogólna definicja (Heyde, Yang [1997]):
( x1    xn ) 2
lim

2
2
n 
x1   xn

Jedną klase dla procesów długiej pamięci procesy samopodobne (self similar processes) z paramerem d
wprowadził Madelbrot i Ness (Mandelbrot, Ness [1968]).
Są one uogólnieniem
ułamkowego ruchu Browna (fractional brownian motion), gdzie:
d  (0,5;0,5) lub d  (0;1)
Drugą klasą modeli są modele ARFIMA jako pewna generalizacja
modeli ARIMA wprowadzone przez Grangera i Joeux
(Granger, Joeux [1981]).
(L)(1  L)d xt  (L) t ,
( j  d ) Lk
(1  L)  
j 1 (d ) j  1

d
 t ~ IID(0; 2 )
Wprowadzając pojęcie
współczynnika Hursta H i współczynnika integracji ułamkowej d
mamy do czynienia ze zjawiskiem długiej pamięci, gdy:
lim
j 
j
cj
2 ( H 1)
1
d  H  0,5
lim
j 
j
cj
2 ( d 0,5)
1
Czyli, funkcja autokorelacyjna zbiega wraz ze wzrostem opóźnienia zbiega do
funkcji autokorelacyjnej ułamkowego procesu Gaussowskiego (pierwsze
przyrosty ułamkowego ruchu Browna).
Analogicznie używając funkcji gęstości spektralnej
możemy stwierdzić, że:
lim
 0
f ( )
c
1 2 H
1
Własności procesu w zależności od parametrów H, d
0<d<0,5
0,5<H<1
Długa pamięć, stacjonarność, persystencja**
-0,5<d<0
0<H<0,5
Krótka pamięć, stacjonarność, antypersystentny
d=0
H=0,5
Niezależność, brak pamięci*, biały szum
0,5<=d<1
.
Proces niestacjonarny, I(1), persystentny,
*-standard short memory
** persistency – trwałość, trwałe utrzymywanie kierunków zmian
Tak więc wartość współczynnika d lub H może
świadczyć o występowaniu lub braku
w szeregu czasowym długiej pamięci.
Wśród ekonometryków jest duże zainteresowanie estymacją
parametrów d i H (Baillie [1996]) wskazujących na
istnienie lub nie zjawiska długiej pamięci w szeregu.
Pomija się jednak często dwie ważne kwestie:
1) Testowanie zajścia zmian strukturalnych w szeregach
z długą pamięcią
(Hidalgo, Robinson [1996] (Lobato, Savin [1997], Engle, Smith [1999],
Granger, Hyung [1999], Diebold, Inoue [1999]).
1) Estymacja d lub H bez zwracania uwagi na pojawianie się
zmian strukturalnych
(Teverovsky, Taqqu [1997], Kramer, Sibbertsen [2000], Wright [1998]).
Zmiany strukturalne vs długa pamięć
1. Zjawisko pozornej długiej pamięci (spurious long memory)
procesu może często być generowane przez zachodzące
zmiany strukturalne lub trendy występujące w badanych danych
Typowe dla procesów z długa pamięcią hiperboliczne zanikanie funkcji
autokorelacyjnej, może być również generowane dla szeregów z
krótka pamięcią, w których występują zmiany strukturalne.
2. Własność długiej pamięci może powodować występowanie
pozornych zmian strukturalnych
(Kramer, Siebbertsen [2000], Siebbertsen [2003]).
Niektóre testy na występowanie zmian strukturalnych, mogą dawać mylne wyniki
wskazując na występowanie zmian strukturalnych tam gdzie ich nie ma.
Testy CUSUM na występowanie zmian strukturalnych
w szeregach z długą pamięcią
Test MNK–CUSUM zaproponowany przez Ploberger, Kramer [1992].
Rozważamy równanie regresji (estymowane MNK): yt  xt   t ,
2
gdzie: t  1,2,, n  t ~ IID(0; )
Weryfikujemy hipotezę alternatywną, że zaszła nieoczekiwana zmiana
strukturalna parametru regresji. Statystyka testująca ma postać:
1
TS  sup Cn ( ) gdzie Cn (  ) 
0 1
nˆ 
n

t 1
t
W przypadku, gdy odchylenia resztowe są białym szumem rozkład
Statystyki Cn ( ) zbiega do standardowego ruchu Browna. Natomiast
Cn ( )
 Bd ( ) czyli ułamkowego ruchu Browna z parametrem d.
n
Test standardowy CUSUM zaproponowany przez Brown, Durbin,
Evans [1975].
Wykorzystuje rekursywne reszty z modelu regresji:
yt  xt   t ,
Statystyka testowa ma postać:
Wn (  )
S n (  )  sup
0  1 1  2 
n
1

Wn (  ) 
t

nˆ  t k 1
' ˆ ( t 1)
y

x


t
t
t 
ft
Podobnie jak w przypadku
MNK-CUSUM rozkład statystyki
Wn ( )
 Bd ( )
d
n
czyli ułamkowego ruchu Browna.
f t  1  xt' ( X '( t 1) X ( t 1) ) 1 xt )
t  k  1,, n
Sibbertsen [2000] udowodnił, że dla dużych prób
w przypadku ułamkowego zintegrowania reszt modelu,
rozkład statystyk testowych w przypadku braku zmian
strukturalnych zbiega do nieskończoności.
Czyli w efekcie odrzucamy hipotezę o braku
zmian strukturalnych w procesie.
Tym samym testy nie są odporne na zjawisko długiej pamięci.
Aby to zbadać wygenerowano proces mający reprezentacje ARFIMA (0,d,0)
(algorytm Davies-Harte’a (Davis, Harte [1987]))
dla d = 0; 0,1; 0,2; 0,3; 0,4,
czyli w przypadkach kiedy reszty wykazują własność długiej pamięci.
Dla testu
MNK-CUSUM
Dla testu
standardowego CUSUM
O istnieniu zmian strukturalnych może również świadczyć
zachowanie się estymatora parametru d.
Wybrane estymatory parametru d mające
znaczenie w wykrywaniu zmian strukturalnych
Metoda wariancyjna
Metoda GPH
Metoda TGPH
Metoda falkowa
Metoda wariancyjna
Zaproponowana przez Teverowsky, Taqqu [1997] i Giraitis [2000].
1 km
x 
xt ,

m t ( k 1) m1
k  1,2,, n / m
1 n / m (m)
(m)
xk 
xk

n / m k 1
2
1 n / m (m)
(m)


V
x

x

k
k
n / m k 1
(m)
k
Estymator d jest uzyskiwany graficzne
poprzez wykres ln(V) w zależności
od różnych wartości i ln(m).
Jeśli szereg wykazuje długą pamięć
wykres powinien być linia prostą
ze współczynnikiem
b = 2d-1
Wyniki estymacji metodą wariancyjną w przypadku
zachodzących zmian strukturalnych
Teverovsky i Taqqu [1997] pokazali, że w przypadku pozornej
długiej pamięci wykres ln (V) w zależności od ln(m) nie jest
linią prostą tylko ma przebieg wykładniczy z ujemnym
współczynnikiem kierunkowym. Takie zachowanie może
wskazywać na zachodzące zmiany strukturalne, które generują
pozorne zjawisko długiej pamięci.
Metoda GPH – log periodogramu
Zaproponowana przez Geweke, Porter-Hudak [1983]
1
Niech I x (  j ) 
2n
n
 xt e
(  it 2  j )
2
będzie periodogramem procesu
t 1
xt
Estymator parametru d wyznaczany jest MNK
z równania regresji postaci:
ln I x ( j )  ln c  2d ln( j )  ln  j ,
4
5
Gdzie: j  1,2,, n ,  j 
2j
oznacza j-ta częstotliwość Fouriera
n
Jednak GPH jest wrażliwy na zmiany strukturalne
występujące w badanym procesie
Metoda tapered GPH – zawężonego periodogramu
Zaproponowany przez Velsaco [1999] oraz Hurvitch,Ray [1995]
Rozważamy periodogram procesu: wt xt
I n , x ( j ) 
1
n
2  wt2
n 1
 wt xt e
i j t
2
t 0
t 1
Gdzie:
wj 
1
 2 (t  0,5) 
1

cos


2 
n


Oznacza tzw. taper-zawężacz, czyli czynnik, który redukuje
w pewnym stopniu wpływ niskich i niestacjonarnych częstotliwości,
jak również zmian strukturalnych i występujących trendów.
Wykrywanie istnienia zmian strukturalnych z wykorzystaniem
Estymatorów GPH i TGPH
Sibbertsen [2002] wykazał, że różnica powstała z porównania
wartości estymatorów GPH i TGPH jest wyznacznikiem tego
czy w badanym szeregu występuje długa pamięć lub zmiany
strukturalne.
GPH<<TGPH
Zmiany strukturalne
lub trend
GPH  TGPH
Długa pamięć
Estymatory falkowe w estymacji d
Estymator falkowy (wavelet) (Jensen [1999]), są odporne na
zaburzenia ze strony zmian strukturalnych, jednak odporność zależy
od wyboru rodzaju falki.
Sibbertsen [2002] i Abry, Vietch [1998], proponują falkę Daubechies
rzędu czwartego gdyż estymator d zbudowany na jej podstawie
chrakteryzuje największą odpornością na występujące zmiany
strukturalne.
Bootstrapowe wersje testów Bartlett’a i Cramera von Misses’a
Zarys metody
Rozważamy równanie regresji: yt  xt   t
Interesuje nas, czy parametr regresji pozostaje stały w czasie. Testem, który
będzie weryfikować hipotezę o stałości parametru będzie:
- test Bartlett’a (test supremum);
- Cramera von Misses’a (test odległości).
Powyższe dwa testy maja zastosowanie w przypadku szeregów z krótką pamięcią.
Rozszerzenie ich na modele z długą pamięcią powoduje, że ich postać zależy od
nieznanych wartości estymatorów, których rozkład jest określony w sposób
przybliżony.
Wykorzystując metody boostrapowe możemy wyznaczyć rozkład
empiryczny i na jego podstawie zweryfikować hipotezę o zmianie wartości
parametru modelu regresji.
Hidalgo i Lazarova [2003] proponują, aby równanie regresji rozszerzyć do postaci:
yt  xt  zt  t
 xt n  t  1  n
zt  
wpp
0
gdzie (0  n  n)
okres zajścia (ewentualnej) zmiany strukturalnej.
Wyznaczamy estymatory MNK parametrów regresji

i
.
Przekształcając równanie regresji na dziedzinę częstościową otrzymujemy:
wy (  j )  wx (  j )  wz (  j )  wu (  j )
j  1,2,, n  1
1 n
it
wd ( ) 
d
e

t
2n t 1
gdzie:
Dyskretna transformata Fouriera
Estymatory w dziedzinie częstościowej wyznacza się z:
 n 1 I (  )
xx
j
 ˆ ( )   
j 1


 ˆ( )    n 1

   I zx (  j )
 j 1
I xz (  j ) 

j 1

n 1
I zz (  j ) 

j 1

n 1
1
 n 1 I (  ) 
  xy j 
 nj 11

  I zy (  j ) 
 j 1

Dziedzina częstościowa jest stosowana, gdyż bootstrapowanie nie wymaga
wyznaczania różnych parametrów (tuning parameters) np. długości okna
w metodzie blokowej, należącej do metod bootstrapowych dla szeregów czasowych
W wyniku dalszych analiz okazuje się, że rozkład statystyki: ˆ zależy od
nieznanych parametrów
 i .
2 n 1
4

ˆ 

I xx (  j ) I uˆuˆ (  j )

n j 1
n
ˆ  1  xt xt'
n t 1
Których zgodne estymatory mają postać:
ˆ  ( ) ~ B( )  B(1)
 ( ) 
~
ˆ
 (1   )


W szczególnych przypadkach funkcjonały ruchu Browna są znane i kwantyle
Rozkładu można łatwo wyznaczyć. W innych przypadkach należy te funkcjonały
wyznaczać symulacyjnie. Alternatywną metodą obliczenia wartości krytycznych
Rozkładu statystyki jest metoda bootstrap. Zasadniczym celem tej metody jest
zastąpienie nieznanego rozkładu rozkładem empirycznym wyznaczonym na
podstawie badanej próby (szeregu czasowego).
1. Obliczamy wartości estymatorów parametrów modelu regresji
yt  xt  zt  t
oraz wyznaczamy reszty teoretyczne uˆt  yt  ˆxt  ˆzt
1 n
it
uˆt e
2. Obliczamy wartość dyskretnej transformaty Fouriera: wuˆ ( j ) 

2n t 1
3. Wyznaczamy jej postać znormalizowaną
1 n1
wuˆ (  j ) 
wuˆ ( j )


n  1 j 1
wuˆ (  j ) 
2 , j  1,2,, n  1
n 1
n 1
1
1
wuˆ ( j ) 
wuˆ ( j )


n  1 j 1
n  1 j 1
i spośród otrzymanych elementów dla kolejnych j, losujemy niezależnie n-1
*
*
*
elementów 1 ,2 ,,n1 .


4. Generujemy próbę boostrapową składającą się z następujących elementów
w*y ( j )  ˆ0 wx ( j )  wuˆ ( j )  *j
j
5. Wyznaczamy wartości bootstrapowe szukanych estymatorów parametrów
 I ( )
*
xx
j
 ˆ ( )   
j 1


 ˆ * ( )    n 1

   I zx (  j )
 j 1
n 1
I xz (  j ) 

j 1

n 1
I zz (  j ) 

j 1

n 1
1
 n 1 I (  ) 
  xy j 
 nj 11

  I (  j ) 
zy
 j 1

*
*
6. Wyznaczamy poziomy bootstrapowe statystyk testujących
KS  sup
*
n  j (1 ) n
1
CvM 
n
*
(1 ) n

j n
* j 
ˆ
n   ,
n
2
n

* j 
ˆ
 n ( ) 
n  j(n  j )

7. Porównujemy poziomy statystyk testowych otrzymanych z metody
Bootstrapowej z poziomem nominalnym dla określonego α
(z dystrybuanty rozkładu normalnego). Wyznaczamy frakcję p
przypadków kiedy hipoteza o braku zmian strukturalnych została odrzucona.
Wyniki testów bootstrapowych
Hipoteza o braku zmian
strukturalnych była w większości
przypadków przyjmowana tak więc
rozkład empiryczny wyznaczony za
pomocą procedury bootstrapowej
dobrze „imituje” rozkład
asymptotyczny.
dx
n=32
0
0
0,2
0,2
n=64
0
0
0,2
0,2
n=128
0
0
0,2
0,2
n=256
0
0
0,2
0,2
du
KS KS CvM
5% 10% 5%
CvM
10%
0
0,2
0
0,2
4,7 9,7
5,8 11,3
4,9 9,5
6,3 11,6
6,6
7
6,3
6,8
13,2
12,3
11,9
12,7
0
0,2
0
0,2
4,9 11,3
6,8 13
5,5 10,9
6,5 11,9
6,3
6,5
6
6,6
12,6
12,7
12,3
12,6
0
0,2
0
0,2
4,7
5,8
4,8
5,7
10,8
11,9
10,4
10,7
5
5,7
5,4
5,5
10,5
10,2
11,1
10,9
0
0,2
0
0,2
5,3
5,8
5,1
5,4
10,4
10,7
10,2
10,7
5,1
5
4,9
4,3
10,6
10,8
10
10,4