Transcript prednaska1

ANALÝZA ČASOVÝCH RADOV
Hydrológia
Financie a ekonómia
Nezamestnanosť
Inflácia Slovensko
Slovensko
Geodézia
30
25
%
%
25
20
20
15
15
10
10
5
5
00
. 933
I.I9
II..9955
II..9977
II..9999
I.0011
mesiac
mesiac
I. 033
II..05
II..007
Množinu náhodných premenných
Mnohorozmerný stochastický proces
{X(, t),   , t  T }
vektorov
je
množina
náhodných
kde  je výberový
a Tt 
R+}.je indexová množina nazývame
{X(,priestor
t),   ,
T
stochastický proces.
Pre každé t  T je X(., t) náhodná premenná definovaná na
výberovom priestore . Pre každé    je X(, .) jedna realizácia
49
stochastického procesu 44definovaná
na indexovej množine T, t. j.
20
usporiadaná postupnosť393418
čísiel, z ktorých každé odpovedá jednej
16
2914
hodnote indexovej množiny.
Miera inflácie
Miera
nezamestnanosti
HDP v milónoch Euro
90000
80000
70000
60000
50000
241240000
191030000
V prípade, že T obsahuje
len konečne, resp. spočitateľne veľa
14 8
96
hodnôt, hovoríme o stochastickom
procese s diskrétnym časom.
44
20000
10000
19
95
q
19 1
95
q
19 4
96
q
19 3
97
q
19 2
98
q
19 1
98
q
19 4
99
q
20 3
00
q
20 2
01
q
20 1
01
q
20 4
02
q
20 3
03
q
20 2
04
q
20 1
04
q
20 4
05
q
20 3
06
q
20 2
07
q1
0
-1 2
6 00 70 7
9939 3 9949 4 9959 5 19996 6 1999977 1999988 1999999 2 0000 0 2 000011 2 0000222 0000332 0000442 00050 52 000602
1 91 1 91 1 91 Česko
1
1
1
1
2 Poľsko
2
2 Slovensko
2
2
2
2 1rok
20 2
Maďarsko
Diskrétny časový rad tvorí množina pozorovaní {x Rok
,x ,…,xn},
Rok
Česko
Maďarsko
Poľsko
získaných v rovnakých časových
intervaloch.
Je toSlovensko
jedna realizácia
stochastického procesu {X1, X2, …, Xt, ...}. Počet pozorovaní sa
nazýva dĺžka časového radu n.
Česko
Maďarsko
Poľsko
Slovensko
Hlavnou úlohou analýzy časových radov je nájsť model dostatočne
priliehavo aproximujúci pozorované údaje a potom (podľa možnosti)
predpovedať budúce hodnoty.
Charakteristiky stochastického procesu {Xt, t  0}
Stredná hodnota:
Rozptyl (druhý centrálny moment):
Šikmosť (tretí centrálny moment):
 t  EX t 
2t  DX t   EX t   t 
2
(t3)  EX t   t 
3
Špicatosť (štvrtý centrálny moment): (t 4)  EX t   t 
4
Kovariančná funkcia (r, s):
cov( Xr , X s )  EXr  r X s   s 
Korelačná funkcia (r, s):
corrXr , X s  
cov( Xr , X s )
DXr  DX s 
STACIONÁRNE STOCHASTICKÉ PROCESY
Stochastický proces Xt t 1 je striktne stacionárny, ak pre každú
podmnožinu
tn) nindexovej
množiny T a každé reálne
Stochastický (tproces
1, t2, ..., X
t t 1 je striktne stacionárny, ak sa jeho
číslo
h  R také,
že tj +vhčase
 T, j =nemenia
1, 2, ..., n (t.
sú j.združené
distribučné
štatistické
vlastnosti
rozdelenia
pravdefunkcie
vektorov
podobnosti
sú invariantné v čase).
n
 
X t1 , X t2 ,, X tn  a X t1h , X t2 h ,, X tn h 
rovnaké.
Stochastický proces
X 
n
t t 1
je slabo (kovariančne) stacionárny,
ak:
1.t = E(Xt) = , 2t = D(Xt) =E(Xt - t )2 = 2
pre t = 1, ..., n
2. (s, r) = cov(Xs, Xr) = E[(Xs - s)(Xr - r)] je len funkciou (s – r),
t. j. ako sú od seba Xs, Xr v čase vzdialené a nie od toho, na
akom úseku časovej osi sa nachádzajú.
Rozdiel s – r nazývame posunutie a budeme ho označovať k
Stacionárny proces s  = 0 nazývame centrovaný.
Výberové charakteristiky stacionárneho
stochastického procesu {Xt, t  0}
Výberový priemer (odhad strednej hodnoty):
1 n
x
xt
n t 1

Výberový rozptyl (odhad disperzie 2):
3
Výberová šikmosť (odhad šikmosti (3)):
1 n  xt  x 



n t 1  sˆ 
Výberová špicatosť (odhad špicatosti (4)):
1 n  xt  x 



ˆ
n t 1  s 


4
Príkazy na výpočet výberových charakteristík
v systéme Mathematica
Ako prvé nahráme súbory na analýzu časových radov:
<<timeseri\\datasmoo.m
<<timeseri\\timeseri.m
<<timeseri\\userfunc.m
Výberový priemer (odhad strednej hodnoty):
Mean[rad]
Výberový rozptyl (odhad disperzie 2):
Variance[rad]
Štandardná odchýlka (odhad ):
StandardDeviation[rad]
Výberová šikmosť (odhad šikmosti (3)):
Skewness[rad]
Výberová špicatosť (odhad špicatosti (4)):
Kurtosis[rad]
nk
V
systéme
Mathematica funkcia
počítame
Výberová
autokovariančná
(k)autokovariančnú
  x t  x x t k funkciu
 x
až do k-teho stupňa príkazom: CovarianceFunction
[rad,
k]
t 1
n k
x t  x x t k  x 

 k  t 1
V
systéme
Mathematica
počítame
autokorelačnú
funkciu až

Výberová autokorelačná funkcia r =

n
CorrelationFunction[rad,
k] 2
0
k
do k-teho stupňa príkazom:
 x t  x 
t 1
Vlastnosti (k) a rk
1. r0 = 1
2. | (k) |  (0);
3. (k) = (-k);
| rk |  1
rk = r-k
kZ
Graf autokorelačnej funkcie pre k ≥ 0 sa nazýva korelogram.
Tvar autokorelačnej funkcie je veľmi dôležitý, pretože
identifikuje
príslušný
lineárny
model.
Významná
je
predovšetkým hodnota k0, po ktorej už môžeme autokorelačnú
funkciu považovať za nulovú. Ak existuje také k0, že pre všetky
k > k0 je (k) = 0, potom je rozptyl výberovej autokorelačnej
funkcie rk pre k > k0 daný Bartlettovou aproximáciou (za
predpokladu normality uvažovaného procesu):
D(rk) =
1  2r12    2rk20
n
Rozptyly autokorelácií r1, r2, ..., rk, ...

1
1  2r12
1  2 r12  rk21
Dr1  , Dr2  
,,Drk  
n
n
n

Parciálna autokorelačná funkcia
Koreláciu premenných Xt a Xt-k očistenú o vplyv premenných
medzi nimi Xt-1, …, Xt-k+1 nazývame parciálna autokorelačná
funkcia. Počítame ju ako podmienenú strednú hodnotu :
k, k = E[ (Xt - ) (Xt-k - ) | Xt-1, …, Xt-k+1 ]
Výberová parciálna autokorelačná funkcia rk,k s posunutím k
vyjadruje parciálny regresný koeficient k, k v autoregresii kteho rádu:
Xt = k, 1 Xt-1 + … + k, k Xt-k + et
kde et je premenná nekorelovaná s náhodnými premennými Xt-j,
j  1.
V systéme Mathematica počítame parciálnu autokorelačnú
funkciu až do k-teho stupňa príkazom:
PartialCorrelationFunction[rad, k]
Proces bieleho šumu (White Noise)
Náhodný proces {Zt, t  Z} tvorený nekorelovanými
náhodnými premennými rovnakého pravdepodobnostného
rozdelenia s konštantnou strednou hodnotou E(Zt) = 
(obyčajne  = 0) a konštantným rozptylom D(Zt) = 2 sa nazýva
proces bieleho šumu.
Z definície vyplýva, že proces bieleho šumu je stacionárny s
autokorelačnou funkciou
Poznámka: Často budeme používať pojem postupnosť nezávislých
rovnako rozdelených náhodných premenných (i. i. d), čo nie je
1 k  0
ekvivalentné
bieleho šumu.
k  procesu

0 k  0
a parciálnou autokorelačnou funkciou
 k, k
1 k  0

0 k  0
Proces bieleho šumu sa nazýva Gaussovský, ak je jeho združené
rozdelenie pravdepodobnosti normálne rozdelenie. Pokiaľ nepovieme
ináč, budeme vždy uvažovať gaussovský biely šum.
Nech Zt je proces bieleho šumu s nulovou strednou hodnotou, t. j.
(k) = 0, k  0. Potom sú rozptyly výberovej autokorelácie
aproximované hodnotami 1 .
n
Ak chceme rozhodnúť, či je (k) = 0, k  0, porovnáme hodnotu |rk| s
2
číslom
. Využíva sa pritom asymptotická normalita odhadu rk a
n
pravidlo, že normálna náhodná premenná s nulovou strednou
hodnotou
prekročí
v
absolútnej
hodnote
dvojnásobok
svojej
smerodajnej odchýlky s približne 5%-nou pravdepodobnosťou. .
DEKOMPOZÍCIA ČASOVÉHO
RADU

Trend Tt

Sezónna zložka St

Cyklická zložka Ct

Reziduálna zložka et
Trend
Trend zachycuje dlhodobé zmeny v priemernom správaní sa
časového radu (napr. dlhodobý rast alebo dlhodobý pokles). Vzniká
ako dôsledok síl, ktoré systematicky pôsobia v rovnakom smere.
a) Izolovanie trendu - vyrovnávanie (smoothing) časového radu
1) Subjektívne metódy:
pre dlhé časové rady môžeme tvar trendu určiť z grafického znázornenia časového radu. Tieto metódy sú nedostačujúce, pretože
nedávajú postačujúci základ pre konštrukciu predpovedí. Mali by sa
však použiť pri predbežnej analýze časového radu, kedy je nutné
rozhodnúť o výbere nejakej inej, objektívnejšej metódy
2) opis trendu matematickými funkciami (analytický popis trendu) :
Pri takto odhadnutom trende môžeme ľahko vypočítať jeho budúce
hodnoty (t. j. konštruovať predpovede budúcich hodnôt trendovej zložky,
ak sa jej charakter v čase nezmení). Výber vhodnej funkcie závisí
predovšetkým od grafického priebehu pôvodných empirických hodnôt
časového radu a od výsledkov rozboru prvých, druhých, resp. ďalších
diferencií v časovom rade.
Trend- pokračovanie
b) Mechanické vyrovnávanie časových radov:
Používame adaptívny prístup k trendovej zložke. Vo všeobecnosti ho
používame pri takých trendoch, ktoré menia v čase globálne svoj
charakter, takže pre ich opis nemôžeme použiť žiadnu matematickú
funkciu s nemennými parametrami. Na druhej strane sa však
predpokladá, že v krátkych časových úsekoch časového radu je
vyrovnanie pomocou matematických kriviek možné, aj keď tieto
krivky majú obyčajne v rôznych časových úsekoch odlišné
parametre.
Výhodou adaptívnych metód je, že proces eliminácie trendovej zložky sa
adaptuje na okamžitý lokálny priebeh radu, konštrukcia predpovede
pružne reaguje na časové zmeny v charaktere radu a v
neposlednom rade je výhodou adaptívnych metód aj výpočtová
jednoduchosť.
Trend- pokračovanie
1) Metóda kĺzavých priemerov
12 prvkov
5
prvkov
3 prvkypriemery, čo sú priemery počítané vždy z
Využívajú sa pri nej kĺzavé
obdobia určitej dĺžky (z určitého počtu hodnôt), pričom toto obdobie
sa posunuje (“kĺže”). Pri vhodnej voľbe dĺžky kĺzavého obdobia sa
dá ich aplikáciou odstrániť sezónnosť. Použitím kĺzavých priemerov
strácame časť hodnôt na začiatku a na konci časového radu,
pretože pre krajné pozorovania nemáme z čoho počítať priemery.
Pri voľbe dĺžky kĺzavého obdobia treba brať do úvahy periódu
sezónnych alebo cyklických fluktuácií, ktoré chceme z radu
vyhladiť. Teda pri mesačných pozorovaniach sa odporúča dĺžka
kĺzavého obdobia 12, pri kvartálnych 4 a pod.
Trend- pokračovanie
2) Exponenciálne vyrovnávanie
Dĺžka kĺzavých priemerov podstatne ovplyvňuje trendovú zložku,
Postup pre výpočet
exponenciálneho vyrovnania je nasledovný:
W = 0,2 väčšinou
určuje sa však
subjektívne. Metóda exponenciálneho
Zvolíme váhu w  (0, 1). Táto voľba je veľmi dôležitá. Obyčajne sa
vyrovnávania tento problém odstraňuje - výpočet každej vyrovnanej
volí w  0.7, 1). Pri menšom w metóda rýchlo reaguje na zmeny v
hodnoty je založený na všetkých dostupných minulých
charaktere časového radu, pri väčšom w sa zosilní vyrovnávacia
pozorovaniach časového radu. Každá staršia hodnota sa pritom
schopnosť metódy.
berie s menšou váhou, pričom hodnoty váh smerom do minulosti
Exponenciálne vyrovnaný časový rad Ft vypočítame z pôvodného
exponenciálne klesajú.
časového Yt nasledovne:
F1 = Y1;
F2 = (1 - w) * Y2 + w * F1;
W = 0,8
.
.
.
Ft = (1 - w) * Yt + w * Ft-1.
Trend- pokračovanie
Budeme používa analytický popis trendu (t. j. matematickými
funkciami).
Pri tomto prístupe sa obyčajne predpokladá, že analyzovaný časový
má tvar
Xt = Tt + et
alebo bol na tento tvar upravený (predovšetkým sezónnym
očistením). Tento predpoklad nám umožní použiť na odhad
parametrov trendovej krivky lineárnu, resp. nelineárnu regresiu.
V ďalšom nech n je dĺžka časového radu.
Trend - pokračovanie
a) Konštantný trend:
Pre tento trend typu
Tt =  0,
t = 1, …, n
dostávame jednoduchý odhad b0 parametra 0 pomocou vzťahu:
n
xt
t 1 n
b0  x 
Konštantný trend používame, ak xt+1 - xt  0.
.
Trend - pokračovanie
b) Lineárny trend:
Tt = 0 + 1 t,
t = 1, …, n
kde odhady koeficientov 0, 1 dostaneme použitím lineárnej
regresie. Lineárny trend používame, ak sú prvé diferencie xt+1 - xt
približne konštantné.
.
suradnica sever juh n
mm
15
10
5
100
5
10
15
200
300
400
500
600
700
time Day
Trend - pokračovanie
c) Kvadratický trend:
T t =  0 +  1 t +  2 t2 ,
t = 1, …, n
Odhady koeficientov 0, 1, 2 dostaneme opäť použitím lineárnej
regresie. Kvadratický trend používame, ak sú druhé diferencie, t. j.
xt+2 - 2 xt+1 + xt
približne konštantné.
.
Trend - pokračovanie
d) Exponenciálny trend:
Tento typ trendu sa používa na opísanie modelu rastu nových
produktov, spoločností alebo priemyslu. Model trendu je rozdelený
0.08
 = 0.1,  = 0.8
do troch častí: začiatok, rast, stav nasýtenia. Čas je reprezentovaný
0.06
od dní cez mesiace až do rokov, v závislosti od stavu trhu. Je
zrejmé, že tento model nemôžeme opísať ani lineárnym ani
0.04
kvadratickým trendom. Vtedy používame exponenciálny trend, ktorý
0.02
je opísaný funkciou:
0.10
.
5
10
Tt   t ,
15
20
t  1, , n,   0.
25
1.0
0.8
 = 0.1,  = 1.1
Ak je   0, potom pre   1 dochádza
k rastu, zatiaľ čo pre 0    1
0.6
nastáva pokles. Parametre  a  odhadneme
pomocou nelineárnej
0.4
regresie. Exponenciálny trend používame, ak sú podiely po sebe
0.2
idúcich členov časového radu xt+1 / xt približne konštantné.
5
10
15
20
25
Trend - pokračovanie
e) Logistický trend:
Tento trojparametrový trend je opísaný funkciou:
Tt 

1  α βt
, t  1, , n, β  0
Logistický
trend
má inflexný(pre
bod
priebehu
Schematicky
je znázornený
 =(t.1,j.zmenu
= 30, konvexného
= 0.95)
na konkávny) v bode
.
t = - log  / log 
a je asymptoticky ohraničený hodnotou .
počet 1000
Kritérium pre jeho použitie je, aby podiely
1000
800
(1/xt+2 - 1/xt+1) / (1/xt+1 - 1/xt)
600
boli približne konštantné.
400
200
1983
1984
1985
1986
1987
1988
time Year
Sezónna zložka
Sezónna zložka opisuje periodické zmeny v časovom rade, ktorých
perióda sa rovná určitej štandardnej jednotke času alebo jej
konštantnému násobku (zachycuje zmeny, ktoré sa pravidelne
opakujú). Dĺžka periódy sa určuje z korelogramu.
Rozbor eliminovanej sezónnej zložky môže podstatne rozšíriť naše
KORELOGRAM
vedomosti o zákonitostiach správania sa určitého javu a prispieť ku
konštrukcii dokonalejších predpovedí u uvažovaného časového
radu. Ďalším dôležitým cieľom je tiež získanie sezónne očisteného
časového radu, z ktorého bola sezónna zložka odstránená alebo
aspoň potlačená na maximálne možnú mieru. Sezónne očistený
časový rad zbavený sezónnych a náhodných fluktuácií umožňuje
efektívnejšie štúdium dlhodobých tendencií, ktorým je priebeh
časového radu podriadený.
Sezónna zložka - pokračovanie
Na určenie sezónnej zložky budeme používať regresné metódy
založené na teórii lineárneho regresného modelu.
1. Metóda kvalitatívnych premenných. Ak na každý rok pripadne L
pozorovaní (sezón) príslušného časového radu (napr. pri
mesačných časových radoch L = 12, pri kvartálnych L = 4), potom
pri tejto metóde vyjadrujeme sezónnu zložku v tvare:
St = 2 Y2t + 3 Y3t + … + L YL t
kde Y2t, Y3t, …, YL t sú kvalitatívne premenné, ktoré sú definované
nasledujúcim spôsobom:
 1 ak čas t odpovedá (i - 1) - vému obdobiu v roku
Yt  
v inom období v roku
0
pre i = 2, 3, …, L.
Sezónna zložka - pokračovanie
V systéme Mathematica realizujeme model sezónnej zložky s
periódou L (a počtom opakovaní M) metódou kvalitatívnych
premenných nasledujúcou postupnosťou príkazov:
f[i_, k_, t_] := If [(i – 1 + k*L) t < (i + k*L), 1, 0]
x[i_, t_] := Sum[f[i, k, t], {k, 0, M - 1}]
funkcie = Table[ x[i, t], {i, 2, L}];
regkp = Regress[dáta, funkcie, t]
Sezónna zložka - pokračovanie
2. Pomocou vhodne zvolenej matematickej funkcie. Najčastejšie sa
používajú goniometrické funkcie s dĺžkou periódy L : sin(2  t/L),
cos(2  t/L). Sezónna zložka môže byť napr. vyjadrená v tvare:
St = 0 + 1 sin(2  t/L) + 2 cos(2  t/L).
3
flow m s
Kvalitatívne premenné
15
3
flow m s
Goniometrické funkcie
10
15
5
10
1985
1990
5
1995
2000
1985
2005
time Month
1990
1995
2000
2005
time Month
Cyklická zložka
Cyklická zložka je periodická zložka, ktorej perióda
nezodpovedá kalendárnym jednotkám. Je to nepravidelná
fluktuácia okolo trendu, v ktorej sa strieda fáza rastu s fázou
poklesu. Odhaduje sa metódami spektrálnej analýzy. .
f
10000
8000
6000
4000
2000
2
6
3
PERIODOGRAM
Reziduálna zložka ostane v časovom rade po odstránení
systematických zložiek. Je tvorená fluktuáciami v priebehu
časového radu, ktoré nemajú rozpoznateľný systematický
charakter.
Aditívna dekompozícia:
Xt = Tt + St + Ct + et
Multiplikatívna dekompozícia:
Xt = Tt . St . Ct . et
Časové rady spravidla obsahujú reziduálnu zložku. Okrem
nej môžu (ale nemusia) obsahovať aj jednu, dve alebo
všetky tri systematické zložky.
Postup pri analýze časových radov
Vykreslíme dáta, tvoriace časový rad. Takto získame základnú predstavu o charaktere časového radu. V prípade nejasných časových radov testami náhodnosti určíme, či časový
rad obsahuje trend, resp. periodické zložky.
V prípade, že časový rad obsahuje trend, určíme ho
regresnou analýzou.
Z reziduí vypočítame autokorelačnú funkciu a z nej odčítame
periódu sezónnej zložky (ak existuje). Sezónnu zložku potom
určíme regresnou analýzou.
Spektrálnou analýzou určíme významné frekvencie pre
cyklickú zložku, ktorú potom vypočítame regresnou analýzou
ako súčet sínusov a cosínusov.
Postup pri analýze časových radov
Testovaním nulovosti autokorelačnej funkcie rk overíme, či
môžeme reziduálnu zložku považovať za proces bieleho
šumu.
Ak reziduálnu zložku tvoria navzájom korelované náhodné
premenné, použijeme na jej modelovanie Box – Jenkinsovu
metodológiu (lineárne modely ARMA v stacionárnom
prípade), integrované modely ARIMA, resp. modely s dlhou
pamäťou ARFIMA (v nestacionárnom prípade) alebo moderné
nelineárne modely (modely s premenlivými režimami a pod.).
Výsledný model môžeme použiť na popisné účely, resp. na
predpovedanie budúcich hodnôt časového radu - prognózovanie.
LITERATÚRA
HIPEL, K. W. - McLEOD A. I. (1992) Time Series Modelling of Water
Resources and Enviromental Systems. In: Handbook of Hydrology
(D. R. Maidment, editor), Elsevier
SALAS, J. D. - DELLEUR, J. W. - YEVJEVICH, V. - W. L. LANE (1980)
Applied modelling of hydrological time series. Water Resources
Publications, Littleton, Colorado
CIPRA, T. (1986) Analýza časových řad s aplikacemi v ekonomii.
SNTL, ALFA Praha
ARTL, J. (1999) Moderní metody modelování ekonomických
časových řad. GRADA Publ.
ARTL, J. – ARTLOVÁ, M. (2003) Finanční časové řady – Vlastnosti,
metody modelování, příklady a aplikace, GRADA Publ.
FRANSES, P. H. (1998) Time series models for business and
economic forecasting. Cambridge University Press.
FRANSES, P. H. – VAN DIJK, D. (2000) Non – linear time series
models in empirical finance. Cambridge Univ. Press