Transcript prednaska4

LINEÁRNE MODELY STACIONÁRNYCH
STOCHASTICKÝCH PROCESOV
Dekompozičné metódy kladú dôraz na prácu so systematickými
zložkami časovej rady (trend, sezónna a cyklická zložka). Základným
matematickým nástrojom je regresná analýza.
Každý stacionárny stochastický proces, ktorý neobsahuje žiadnu
systematickú zložku môže byť vyjadrený ako lineárna kombinácia
nekorelovaných rovnako rozdelených náhodných premenných s
nulovou strednou hodnotou a konštantným rozptylom 2 - Woldova
reprezentácia (lineárny proces)
Lineárny proces môžeme teda vyjadriť v tvare:

Xt -  = Zt + 1 Zt-1 + 2 Zt-2 + … =
kde 0 = 1
 i Zt i ,
i0

Lineárny proces je stacionárny, ak
 i  
i 0
Základné charakteristiky lineárneho procesu:
Stredná hodnota E(Xt) = 
Rozptyl D(Xt) = 
2

 2
i0
i
Autokovariančná funkcia (k) =

2

 i  k  i
i0

Autokorelačná funkcia (k) =
 k 

 0
 i ik
i0

 i2
i0
Lineárne stacionárne procesy môžeme modelovať triedou
lineárnych modelov známych ako ARMA(p, q) modely. Aparát, ktorý
sa pritom používa je známy ako Box - Jenkinsova metodológia
(popísaná prvý raz v roku 1976).
Box – Jenkinsova metodológia:
berie za základný prvok analýzy reziduálnu zložku, tvorenú
korelovanými alebo závislými náhodnými veličinami.
Výhody:
 Box – Jenkinsove modely sú veľmi flexibilné a rýchlo sa
adaptujú na zmeny v charaktere modelovaného procesu
 Analýza sa vykonáva systematicky podľa vopred
daného kľúča: identifikácia modelu, odhad parametrov,
overovanie modelu
Nevýhody:
 Minimálna dĺžka časového radu - 50 pozorovaní
 Ťažká interpretácia výsledného modelu
LINEÁRNE MODELY STACIONÁRNYCH
ČASOVÝCH RADOV - ARMA (p, q)
Vo všeobecnosti môžeme ľubovoľný časový rad xt napísať ako súčet
dvoch častí: čo môže a čo nemôže byť predpovedané s použitím
vedomostí z minulosti, ktoré sú sústredené v množine t-1. Teda xt
môže byť vyjadrené:
xt = E[xt | t-1] + t
kde t sa nazýva nepredikovateľná (chybová) časť s E[t | t-1] = 0.
predpoklad:časť xt je založený na
Často používaný modelZákladný
pre predpovedateľnú
je lineárnou
kombináciou
xt-p a q len
hodnôt
1.predpoklade,
Hodnota že
náhodnej
premennej
Xtp hodnôt
v časext-1,t ...,závisí
na
i.i.d.predchádzajúcich
zt s nulovou strednou
hodnotou posunutých
v čase:
náhodných
premenných
(deterministická časť)
a na náhodných fluktuáciách (stochastická časť)
2. Závislosť Xt na predchádzajúcich p náhodných premenných Xt-1,
…, Xt-p je lineárna
LINEÁRNE MODELY STACIONÁRNYCH
ČASOVÝCH RADOV - ARMA (p, q)
~
Xt = 1 Xt-1 + ... + p Xt-p + Z
t
~
Z t = Zt + 1 Zt-1 + ... + q Zt-q
Xt = 1 Xt-1 + ... + p Xt-p + Zt + 1 Zt-1 + ... + q Zt-q
Xt –
náhodné premenné generujúce skúmaný časový rad
Zt –
proces bieleho šumu (väčšinou gaussovský s nulovou
strednou hodnotou)
1, ..., p - tzv. autoregresné koeficienty
1, ..., q – tzv. koeficienty kĺzavých priemerov
q = 0  autoregresný proces AR (p)
p = 0  proces kĺzavých priemerov MA (q)
Operátor spätného posunu B:
Bj Xt = Xt-j
Autoregresný polynóm:
(x) = 1 - 1 x - 2 x2 - ... - p xp
MA polynóm:
(x) = 1 + 1 x + 2 x2 + ... + q xq
ARMA(p, q):
V systéme Mathematica:
(B) X1t, = 2(B)
Ztp}, {1, 2, … , q}, σ2]
ARMAModel[{
,…,
V systéme
Mathematica:
Ak je q = 0  AR(p):
(B)
Xt = Zt
2]
ARModel[{

,

,
…
,

},
σ
1
2
p
Ak je p = 0  MA(q): Xt = (B) Zt
MAModel[{1, 2, … , q}, σ2]
Proces ARMA(p, q) je stacionárny  ak ani jeden koreň
autoregresného polynómu (x) neleží vo vnútri jednotkovej
kružnice v komplexnej rovine

1




BMathematica:
 BZ tq) 

B
X


B
Z

X


 jZ t  j formálne
t
t
t
V systéme
Stacionárny proces
ARMA(p,
môžeme
j 0
StationaryQ[model]
aleboako
StationaryQ[{
rozšíriť
MA() 1, 2, … , p}]
kde ψ j sú koeficienty ekvivalent ného modelu MA() : ψ váhy
Proces ARMA(p, q) je invertibilný (t. j. môžeme ho vyjadriť
ako lineárnu kombináciu jeho minulých hodnôt a súčasnej
hodnoty)  ak ani jeden koreň MA polynómu (x) neleží vo
vnútri jednotkovej kružnice v komplexnej rovine

1
Mathematica:
BZVt systéme
B q)
BX t  proces
Z


BXmôžeme
Invertibilný
ARMA(p,
t
t    jX t formálne
j
InvertibleQ[model]
aleboako
InvertibleQ[{
rozšíriť
AR() j0 1, 2, … , q}]
kde  j sú koeficienty ekvivalent ného modelu AR().
Autoregresný proces prvého rádu AR(1)
Xt = 1 Xt – 1 + Zt

(1 - 1 B) Xt = Zt
AR(1) je stacionárny, ak koreň (x) = 1 - 1 x leží mimo jednotkového kruhu:
x 
1
1 
1
1  1
Vtedy existuje -1(x):


X t  1  1B1Z t  1  1B  12 B2   Z t  Z t  1Z t 1  12Z t  2  
t.j. AR(1|) môžeme vyjadriť v tvare stacionárneho lineárneho
procesu
Stredná hodnota E(Xt) = 0
Autokovariančná funkcia (k) = E(Xt . Xt-k) = 1 (k-1) + E(Zt . Xt-k)
Pre k = 0: Rozptyl D(Xt) =
Pre k > 0:
2z
1  12
(k) = 1 (k-1)
Autokorelačná funkcia
k   1k
Parciálna autokorelačná funkcia:
k,k
1 k  1

0 k  2
Pre 1 > 0 (ale | 1 | < 1) (k) exponenciálne klesá k 0
k
1 = 0,8
1.0
0.8
0.6
0.4
0.2
5
10
15
20
25
30
k
Pre 1 < 0 (ale | 1 | < 1) (k) klesá k 0 oscilačne
1 = - 0,8
Autoregresný proces rádu p AR(p)
Xt = 1 Xt – 1 + 2 Xt – 2 + ... + p Xt – p + Zt
AR(p) je vždy invertibilný, ale stacionárny je len vtedy, ak všetky
korene (x) ležia mimo jednotkového kruhu.
Stredná hodnota E(Xt) = 0
2z
Rozptyl D(Xt) = 1   1     p
1
p
Autokorelačná funkcia k   1k  1  2k  2    pk  p
Parciálna autokorelačná funkcia k,k = 0 pre k > p.
Podmienená stredná hodnota
E(Xt|Xt-1,Xt-2, …, Xt-p) = 1 Xt-1 + … + p Xt-p
je premenlivá v čase.
Podmienený rozptyl D(Xt|Xt-1,Xt-2, …, Xt-p) = 2z je konštantný v čase
Pre reálne korene rovnice (x) = 0 je ACF zložená z
exponenciálne klesajúcich kriviek
Pre komplexné korene rovnice (x) = 0 je ACF zložená z
exponenciálne klesajúcich sínusoviek
Proces kĺzavých priemerov rádu q MA(q)
Xt = Zt + 1 Zt – 1 + 2 Zt – 2 + ... + p Zt – p
MA(q) je vždy stacionárny. Invertibilný je, len ak všetky korene (x)
ležia mimo jednotkového kruhu.
Autokorelačná funkcia
  k  1 k 1    qk q

k   
1  12    q2

0

Parciálna autokorelačná funkcia k,k  0 pre všetky k.
kq
kq
Pre reálne korene rovnice (x) = 0 je PACF zložená z
exponenciálne klesajúcich kriviek
Pre komplexné korene rovnice (x) = 0 je PACF zložená z
exponenciálne klesajúcich sínusoviek
Určenie rádu AR a MA procesov
AR(p):
MA(q):
 kk = 0
k>p
(k)  0
k
 kk  0
k
(k) = 0
k>q
AR(1):
Xt = 0.7 Xt-1 + Zt
AR(1):
Xt = -0.7 Xt-1 + Zt
MA(1):
Xt = Zt + 0.7 Zt-1
MA(1):
Xt = Zt - 0.7 Zt-1
AR(2):
MA(2):
Xt = 0.9 Xt-1 – 0.8 Xt-2 + Zt
Xt = Zt + 0.2 Zt-1 – 1.2 Zt-2
ARMA(2, 2):
Xt – 0.9 Xt-1 + 0.3 Xt-2 = Zt + 0.2 Zt-1 – 1.2 Zt-2
ARMA(1, 2):
Xt – 0.9 Xt-1 = Zt + 0.2 Zt-1 – 1.2 Zt-2
Označme symbolom U krivku v tvare lineárnych
kombinácií:
a) exponenciálne klesajúcich geometrických postupností
b) sínusoid s geometricky klesajúcimi amplitúdami
Tvar autokorelačnej a parciálnej autokorelačnej
funkcie procesov AR(p), MA(q), ARMA(p, q)
AR(p)
(k)
Neexistuje
k k
k0 = p
MA(q)
k0,
k0 = q
(k) je v tvare U
ARMA(p,q)
Neexistuje k0, (k) je v
tvare U po prvých q – p
hodnotách
Neexistuje k0, k k je
k k je ohraničená ohraničená krivkou U po
prvých p – q hodnotách
krivkou U
Neexistuje k0,
Odhad autokovariančnej a autokorelačnej funkcie
Odhad autokovariančnej funkcie sa počíta podľa vzorca:
ck 
n k

x t  x x t k  x ,
k  0, 1, ..., n - 1
n
t 1
Odhad autokorelačnej funkcie sa počíta podľa vzorca:
n k
ck
rk 

c0
 x t  x x t k  x 
t 1
n
2


x

x
 t
,
k  0, 1, ..., n - 1
t 1
Aby tieto odhady mali zmysel, požaduje sa n > 50 a k < n/4. Pre n
  platí: E(ck)  (k) a E(rk)  (k), teda ide o asymptoticky
nevychýlené odhady.
Test nulovosti autokorelačnej funkcie
H0: (k) = 0
 k > k0
H1: (k)  0
 k > k0
Bartlettova aproximácia:
Ak (k) = 0
k > k0, potom
k0

1
2
 1  2  rj 
rk  

n 
j1

k  k0
Porovnávame hodnotu |rk| s číslom 2 (rk), pričom
využívame asymptotickú normalitu odhadu rk s
asymptotickou strednou hodnotou (k) a pravidlo,
že náhodná premenná s normálnym rozdelením s
nulovou strednou hodnotou prekročí v absolútnej
hodnote dvojnásobok svojej smerodajnej odchýlky
s pravdepodobnosťou približne len 0.05
Príklad: Uvažujme časový rad s dĺžkou n = 119, pre ktorú sú
odhady rk prvých 10 hodnôt autokorelačnej funkcie (k)
nasledovné:
k 1
Predpokladajme
2
3 najprv,
4 že5(k) =
6 0 pre
7 k > 80 (časový
9
rad
10 je
tvorený nekorelovanými náhodnými premennými a k0 = 0).
rk 0.31 -0.06 -0.07 0.10 0.08 0.02 -0.13 -0.12 -0.17 -0.12
1
1
rk  

 0.09 pre k  0
n
119
Z grafu vidíme, že r1 = 0.31 je omnoho väčšia hodnota než
dvojnásobok vypočítanej hodnoty, teda hypotézu k0 = 0
zamietame na hladine významnosti 0.05
Predpokladajme teraz, že k0 = 1.
1  2 * 0.312
rk  
 0.10 pre k  1
119
V tomto prípade už odhady vyhovujú našej hypotéze. Teda:
(1)  0,
(k) = 0 pre k > 1.
Odhad parciálnej korelačnej funkcie
Odhady parciálnej korelačnej funkcie sa počítajú rekurentne
podľa vzorcov:
r11  r1
k 1
rk k 
rk   rk 1, j rk  j
j1
k 1
1   rk 1, j rj
pre k  1,
j1
kde
rk,j  rk 1, j  rk k rk 1,k  j
pre j  1, 2, ..., k - 1.
Test nulovosti hodnôt parciálnej autokorelačnej
funkcie
Ak je k k = 0 pre k > k0, potom pre smerodajnú odchýlku odhadu
rk k platí:
rk k  
1
n
pre k  k 0 .
Porovnávame hodnotu |rkk| s číslom 2 (rkk), pričom využívame
asymptotickú normalitu odhadu rkk s asymptotickou strednou
hodnotou kk a pravidlo, že náhodná premenná s normálnym
rozdelením s nulovou strednou hodnotou prekročí v absolútnej
hodnote dvojnásobok svojej smerodajnej odchýlky s pravdepodobnosťou približne len 0.05
Príklad: Uvažujme časový rad s dĺžkou n = 119, pre ktorú sú
odhady rkk prvých 10 hodnôt parciálnej korelačnej funkcie
kk nasledovné:
k
1
2
3
rkk 0.31 -0.18 0.01
4
5
6
7
8
9
10
0.13
-0.01
0.02
-0.14
-0.04
-0.18
-0.05
1
1
2 rk k   2
2
 0.18
n
119
Z grafu vidíme, že r11 = 0.31 je omnoho väčšia hodnota než
dvojnásobok vypočítanej hodnoty, ale |rkk|  0.18, k > 1. Teda
11  0,
kk = 0,
k > 1.