Transcript prednaska4
LINEÁRNE MODELY STACIONÁRNYCH
STOCHASTICKÝCH PROCESOV
Dekompozičné metódy kladú dôraz na prácu so systematickými
zložkami časovej rady (trend, sezónna a cyklická zložka). Základným
matematickým nástrojom je regresná analýza.
Každý stacionárny stochastický proces, ktorý neobsahuje žiadnu
systematickú zložku môže byť vyjadrený ako lineárna kombinácia
nekorelovaných rovnako rozdelených náhodných premenných s
nulovou strednou hodnotou a konštantným rozptylom 2 - Woldova
reprezentácia (lineárny proces)
Lineárny proces môžeme teda vyjadriť v tvare:
Xt - = Zt + 1 Zt-1 + 2 Zt-2 + … =
kde 0 = 1
i Zt i ,
i0
Lineárny proces je stacionárny, ak
i
i 0
Základné charakteristiky lineárneho procesu:
Stredná hodnota E(Xt) =
Rozptyl D(Xt) =
2
2
i0
i
Autokovariančná funkcia (k) =
2
i k i
i0
Autokorelačná funkcia (k) =
k
0
i ik
i0
i2
i0
Lineárne stacionárne procesy môžeme modelovať triedou
lineárnych modelov známych ako ARMA(p, q) modely. Aparát, ktorý
sa pritom používa je známy ako Box - Jenkinsova metodológia
(popísaná prvý raz v roku 1976).
Box – Jenkinsova metodológia:
berie za základný prvok analýzy reziduálnu zložku, tvorenú
korelovanými alebo závislými náhodnými veličinami.
Výhody:
Box – Jenkinsove modely sú veľmi flexibilné a rýchlo sa
adaptujú na zmeny v charaktere modelovaného procesu
Analýza sa vykonáva systematicky podľa vopred
daného kľúča: identifikácia modelu, odhad parametrov,
overovanie modelu
Nevýhody:
Minimálna dĺžka časového radu - 50 pozorovaní
Ťažká interpretácia výsledného modelu
LINEÁRNE MODELY STACIONÁRNYCH
ČASOVÝCH RADOV - ARMA (p, q)
Vo všeobecnosti môžeme ľubovoľný časový rad xt napísať ako súčet
dvoch častí: čo môže a čo nemôže byť predpovedané s použitím
vedomostí z minulosti, ktoré sú sústredené v množine t-1. Teda xt
môže byť vyjadrené:
xt = E[xt | t-1] + t
kde t sa nazýva nepredikovateľná (chybová) časť s E[t | t-1] = 0.
predpoklad:časť xt je založený na
Často používaný modelZákladný
pre predpovedateľnú
je lineárnou
kombináciou
xt-p a q len
hodnôt
1.predpoklade,
Hodnota že
náhodnej
premennej
Xtp hodnôt
v časext-1,t ...,závisí
na
i.i.d.predchádzajúcich
zt s nulovou strednou
hodnotou posunutých
v čase:
náhodných
premenných
(deterministická časť)
a na náhodných fluktuáciách (stochastická časť)
2. Závislosť Xt na predchádzajúcich p náhodných premenných Xt-1,
…, Xt-p je lineárna
LINEÁRNE MODELY STACIONÁRNYCH
ČASOVÝCH RADOV - ARMA (p, q)
~
Xt = 1 Xt-1 + ... + p Xt-p + Z
t
~
Z t = Zt + 1 Zt-1 + ... + q Zt-q
Xt = 1 Xt-1 + ... + p Xt-p + Zt + 1 Zt-1 + ... + q Zt-q
Xt –
náhodné premenné generujúce skúmaný časový rad
Zt –
proces bieleho šumu (väčšinou gaussovský s nulovou
strednou hodnotou)
1, ..., p - tzv. autoregresné koeficienty
1, ..., q – tzv. koeficienty kĺzavých priemerov
q = 0 autoregresný proces AR (p)
p = 0 proces kĺzavých priemerov MA (q)
Operátor spätného posunu B:
Bj Xt = Xt-j
Autoregresný polynóm:
(x) = 1 - 1 x - 2 x2 - ... - p xp
MA polynóm:
(x) = 1 + 1 x + 2 x2 + ... + q xq
ARMA(p, q):
V systéme Mathematica:
(B) X1t, = 2(B)
Ztp}, {1, 2, … , q}, σ2]
ARMAModel[{
,…,
V systéme
Mathematica:
Ak je q = 0 AR(p):
(B)
Xt = Zt
2]
ARModel[{
,
,
…
,
},
σ
1
2
p
Ak je p = 0 MA(q): Xt = (B) Zt
MAModel[{1, 2, … , q}, σ2]
Proces ARMA(p, q) je stacionárny ak ani jeden koreň
autoregresného polynómu (x) neleží vo vnútri jednotkovej
kružnice v komplexnej rovine
1
BMathematica:
BZ tq)
B
X
B
Z
X
jZ t j formálne
t
t
t
V systéme
Stacionárny proces
ARMA(p,
môžeme
j 0
StationaryQ[model]
aleboako
StationaryQ[{
rozšíriť
MA() 1, 2, … , p}]
kde ψ j sú koeficienty ekvivalent ného modelu MA() : ψ váhy
Proces ARMA(p, q) je invertibilný (t. j. môžeme ho vyjadriť
ako lineárnu kombináciu jeho minulých hodnôt a súčasnej
hodnoty) ak ani jeden koreň MA polynómu (x) neleží vo
vnútri jednotkovej kružnice v komplexnej rovine
1
Mathematica:
BZVt systéme
B q)
BX t proces
Z
BXmôžeme
Invertibilný
ARMA(p,
t
t jX t formálne
j
InvertibleQ[model]
aleboako
InvertibleQ[{
rozšíriť
AR() j0 1, 2, … , q}]
kde j sú koeficienty ekvivalent ného modelu AR().
Autoregresný proces prvého rádu AR(1)
Xt = 1 Xt – 1 + Zt
(1 - 1 B) Xt = Zt
AR(1) je stacionárny, ak koreň (x) = 1 - 1 x leží mimo jednotkového kruhu:
x
1
1
1
1 1
Vtedy existuje -1(x):
X t 1 1B1Z t 1 1B 12 B2 Z t Z t 1Z t 1 12Z t 2
t.j. AR(1|) môžeme vyjadriť v tvare stacionárneho lineárneho
procesu
Stredná hodnota E(Xt) = 0
Autokovariančná funkcia (k) = E(Xt . Xt-k) = 1 (k-1) + E(Zt . Xt-k)
Pre k = 0: Rozptyl D(Xt) =
Pre k > 0:
2z
1 12
(k) = 1 (k-1)
Autokorelačná funkcia
k 1k
Parciálna autokorelačná funkcia:
k,k
1 k 1
0 k 2
Pre 1 > 0 (ale | 1 | < 1) (k) exponenciálne klesá k 0
k
1 = 0,8
1.0
0.8
0.6
0.4
0.2
5
10
15
20
25
30
k
Pre 1 < 0 (ale | 1 | < 1) (k) klesá k 0 oscilačne
1 = - 0,8
Autoregresný proces rádu p AR(p)
Xt = 1 Xt – 1 + 2 Xt – 2 + ... + p Xt – p + Zt
AR(p) je vždy invertibilný, ale stacionárny je len vtedy, ak všetky
korene (x) ležia mimo jednotkového kruhu.
Stredná hodnota E(Xt) = 0
2z
Rozptyl D(Xt) = 1 1 p
1
p
Autokorelačná funkcia k 1k 1 2k 2 pk p
Parciálna autokorelačná funkcia k,k = 0 pre k > p.
Podmienená stredná hodnota
E(Xt|Xt-1,Xt-2, …, Xt-p) = 1 Xt-1 + … + p Xt-p
je premenlivá v čase.
Podmienený rozptyl D(Xt|Xt-1,Xt-2, …, Xt-p) = 2z je konštantný v čase
Pre reálne korene rovnice (x) = 0 je ACF zložená z
exponenciálne klesajúcich kriviek
Pre komplexné korene rovnice (x) = 0 je ACF zložená z
exponenciálne klesajúcich sínusoviek
Proces kĺzavých priemerov rádu q MA(q)
Xt = Zt + 1 Zt – 1 + 2 Zt – 2 + ... + p Zt – p
MA(q) je vždy stacionárny. Invertibilný je, len ak všetky korene (x)
ležia mimo jednotkového kruhu.
Autokorelačná funkcia
k 1 k 1 qk q
k
1 12 q2
0
Parciálna autokorelačná funkcia k,k 0 pre všetky k.
kq
kq
Pre reálne korene rovnice (x) = 0 je PACF zložená z
exponenciálne klesajúcich kriviek
Pre komplexné korene rovnice (x) = 0 je PACF zložená z
exponenciálne klesajúcich sínusoviek
Určenie rádu AR a MA procesov
AR(p):
MA(q):
kk = 0
k>p
(k) 0
k
kk 0
k
(k) = 0
k>q
AR(1):
Xt = 0.7 Xt-1 + Zt
AR(1):
Xt = -0.7 Xt-1 + Zt
MA(1):
Xt = Zt + 0.7 Zt-1
MA(1):
Xt = Zt - 0.7 Zt-1
AR(2):
MA(2):
Xt = 0.9 Xt-1 – 0.8 Xt-2 + Zt
Xt = Zt + 0.2 Zt-1 – 1.2 Zt-2
ARMA(2, 2):
Xt – 0.9 Xt-1 + 0.3 Xt-2 = Zt + 0.2 Zt-1 – 1.2 Zt-2
ARMA(1, 2):
Xt – 0.9 Xt-1 = Zt + 0.2 Zt-1 – 1.2 Zt-2
Označme symbolom U krivku v tvare lineárnych
kombinácií:
a) exponenciálne klesajúcich geometrických postupností
b) sínusoid s geometricky klesajúcimi amplitúdami
Tvar autokorelačnej a parciálnej autokorelačnej
funkcie procesov AR(p), MA(q), ARMA(p, q)
AR(p)
(k)
Neexistuje
k k
k0 = p
MA(q)
k0,
k0 = q
(k) je v tvare U
ARMA(p,q)
Neexistuje k0, (k) je v
tvare U po prvých q – p
hodnotách
Neexistuje k0, k k je
k k je ohraničená ohraničená krivkou U po
prvých p – q hodnotách
krivkou U
Neexistuje k0,
Odhad autokovariančnej a autokorelačnej funkcie
Odhad autokovariančnej funkcie sa počíta podľa vzorca:
ck
n k
x t x x t k x ,
k 0, 1, ..., n - 1
n
t 1
Odhad autokorelačnej funkcie sa počíta podľa vzorca:
n k
ck
rk
c0
x t x x t k x
t 1
n
2
x
x
t
,
k 0, 1, ..., n - 1
t 1
Aby tieto odhady mali zmysel, požaduje sa n > 50 a k < n/4. Pre n
platí: E(ck) (k) a E(rk) (k), teda ide o asymptoticky
nevychýlené odhady.
Test nulovosti autokorelačnej funkcie
H0: (k) = 0
k > k0
H1: (k) 0
k > k0
Bartlettova aproximácia:
Ak (k) = 0
k > k0, potom
k0
1
2
1 2 rj
rk
n
j1
k k0
Porovnávame hodnotu |rk| s číslom 2 (rk), pričom
využívame asymptotickú normalitu odhadu rk s
asymptotickou strednou hodnotou (k) a pravidlo,
že náhodná premenná s normálnym rozdelením s
nulovou strednou hodnotou prekročí v absolútnej
hodnote dvojnásobok svojej smerodajnej odchýlky
s pravdepodobnosťou približne len 0.05
Príklad: Uvažujme časový rad s dĺžkou n = 119, pre ktorú sú
odhady rk prvých 10 hodnôt autokorelačnej funkcie (k)
nasledovné:
k 1
Predpokladajme
2
3 najprv,
4 že5(k) =
6 0 pre
7 k > 80 (časový
9
rad
10 je
tvorený nekorelovanými náhodnými premennými a k0 = 0).
rk 0.31 -0.06 -0.07 0.10 0.08 0.02 -0.13 -0.12 -0.17 -0.12
1
1
rk
0.09 pre k 0
n
119
Z grafu vidíme, že r1 = 0.31 je omnoho väčšia hodnota než
dvojnásobok vypočítanej hodnoty, teda hypotézu k0 = 0
zamietame na hladine významnosti 0.05
Predpokladajme teraz, že k0 = 1.
1 2 * 0.312
rk
0.10 pre k 1
119
V tomto prípade už odhady vyhovujú našej hypotéze. Teda:
(1) 0,
(k) = 0 pre k > 1.
Odhad parciálnej korelačnej funkcie
Odhady parciálnej korelačnej funkcie sa počítajú rekurentne
podľa vzorcov:
r11 r1
k 1
rk k
rk rk 1, j rk j
j1
k 1
1 rk 1, j rj
pre k 1,
j1
kde
rk,j rk 1, j rk k rk 1,k j
pre j 1, 2, ..., k - 1.
Test nulovosti hodnôt parciálnej autokorelačnej
funkcie
Ak je k k = 0 pre k > k0, potom pre smerodajnú odchýlku odhadu
rk k platí:
rk k
1
n
pre k k 0 .
Porovnávame hodnotu |rkk| s číslom 2 (rkk), pričom využívame
asymptotickú normalitu odhadu rkk s asymptotickou strednou
hodnotou kk a pravidlo, že náhodná premenná s normálnym
rozdelením s nulovou strednou hodnotou prekročí v absolútnej
hodnote dvojnásobok svojej smerodajnej odchýlky s pravdepodobnosťou približne len 0.05
Príklad: Uvažujme časový rad s dĺžkou n = 119, pre ktorú sú
odhady rkk prvých 10 hodnôt parciálnej korelačnej funkcie
kk nasledovné:
k
1
2
3
rkk 0.31 -0.18 0.01
4
5
6
7
8
9
10
0.13
-0.01
0.02
-0.14
-0.04
-0.18
-0.05
1
1
2 rk k 2
2
0.18
n
119
Z grafu vidíme, že r11 = 0.31 je omnoho väčšia hodnota než
dvojnásobok vypočítanej hodnoty, ale |rkk| 0.18, k > 1. Teda
11 0,
kk = 0,
k > 1.