Szeregi czasowe

Download Report

Transcript Szeregi czasowe

Szeregi czasowe
dr Małgorzata Radziukiewicz
Motto: …Zdobywanie wiedzy polega na przyzwyczajaniu się do pewnych pojęć oraz
faktów….
Szeregi czasowe
Szeregi czasowe
Szeregi czasowe
Szeregi czasowe

Zmienna czasowa t

Czas wprowadza w zbiorze zdarzeń relację porządku

lata
t
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
1
2
3
4
5
6
7
8
9
10
Szeregi czasowe


Przyjmujemy, że n-elementowy szereg czasowy
zapisujemy jako zbiór {(t,yt), gdzie: t= 1, 2, …, n},
czyli uporządkowany zbiór n par wartości
zmiennych t i Y, który można przedstawić
graficznie jako zbiór n punktów w układzie
współrzędnych.
Do tego zbioru punktów można dopasować linię o
ogólnej postaci:
yˆ t  f ( t )
opisującej tendencję rozwojową zjawiska w
czasie.
Szeregi czasowe

Funkcję:
yˆ t  f ( t )
nazywa się modelem trendu.
■ Przy jej wyznaczaniu postępuje się
identycznie jak przy budowie modelu regresji
z jedną zmienną niezależną.
■ Postać dopasowywanej funkcji trendu
wybiera się najczęściej na podstawie wykresu
szeregu czasowego.
Szeregi czasowe


Zakładamy, iż w szeregu stanowiącym podstawę
analizy nie ma wahań sezonowych (wahań takich
nie ma nigdy w danych rocznych).
Model tendencji rozwojowej z liniową funkcją
trendu przyjmuje postać:
y t   0   1t   t

gdzie : yt – poziom zjawiska w okresie t,
 0   1t  liniowa funkcja trendu,
 εt – składnik losowy dla okresu t
Szeregi czasowe


Przyjmując odnośnie do rozkładu εt takie same założenia
jak w klasycznym modelu regresji, uzyskujemy podstawę
do szacowania parametrów funkcji trendu za pomocą
MNK.
Są to następujące założenia:
E ( t )  0
D ( t )  
2
2
Szeregi czasowe
n

Estymatory
parametrów α0 i α1
liniowej funkcji
trendu są
następujące:
 ty
a1 
t
 nt y
t 1
n
t
2
t 1
a 0  y  a1t
 nt
2
Liniowy model trendu – szacowanie parametrów


Przykład 1.
Na podstawie poniższych danych o nakładach książek i broszur
(w mln. egzemplarzy) wydanych w Polsce w latach 1990-1997:
lata
1990
nakład 176
1991 1992 1993
1994
1995
1996
1997
126
99
116
80
94
126
103
a) zinterpretuj parametry modelu i wypowiedz się na jego temat;
b) wyjaśnij, jak przebiegały kolejne etapy obliczeń;
c) podaj prognozę wraz z błędem standardowym nakładu książek
i broszur w 1999 roku
Liniowy model trendu – wyznaczanie parametrów

obliczenia pomocnicze
lata
Nakład (Y)
t
Y· t
t2
1990
176
1
176
1
1991
126
2
252
4
1992
126
3
378
9
1993
103
4
412
16
1994
99
5
495
25
1995
116
6
696
36
1996
80
7
560
49
1997
94
8
752
64
∑
920
36
3721
204
Estymatory parametrów modelu trendu liniowego
n
t
n
 ty
a1 
t
 nt y
t 
t 1
n
t
n
2
 nt
2
n

t 1
a 0  y  a1t
a1 
t 1
yt 
3721  8  4 ,5  115
204  8  ( 4 ,5 )
2

3721  4140
204  162
a 0  115  (  9 ,9762 )  4 ,5  159 ,893

 419
42
yt
t 1
n
  9 ,9762
Postać funkcji trendu i interpretacja oszacowanych parametrów

Wyznaczona liniowa funkcja trendu ma postać:
Yˆt  159 ,893  9 , 976 t



interpretacja:
ocena parametru 0 ustalona na poziomie a0 = 159,893
informuje o wielkości nakładów książek i broszur w Polsce w
roku 1989.
ocena parametru 1 ustalona na poziomie a1 = -9,976 informuje,
wielkość nakładów książek i broszur w Polsce w latach 19901997 malała średniorocznie o 9,976 mln. egzemplarzy
(nazywany współczynnikiem trendu liniowego).
interpretacja c.d.


współczynnik trendu liniowego a1 możemy interpretować jako
przeciętny przyrost zmiennej Y na jednostkę czasu;
dlatego z funkcji liniowej korzysta się, gdy można przyjąć, iż
przyrosty absolutne zjawiska w kolejnych okresach są w
przybliżeniu stałe.
weryfikacja modelu
wyznaczony z otrzymanej funkcji trendu „teoretyczny” nakład
książek i broszur:
obliczenia pomocnicze:


t
Yt
Yˆt
Y2t
et
e2t
1
176
149,92
30976
26,08
680,1664
2
126
139,94
15876
-13,94 194,3236
3
126
129,96
15876
-3,96
15,6816
4
103
119,99
10609
-16,99
288,6601
5
99
110,01
9801
-11,01
121,2201
6
116
100,04
13456
15,96
254,7216
7
80
90,06
6400
-10,06
101,2036
8
94
80,08
8836
13,92
193,7664
∑36
920
x
111830
0,0
1849,743
Rysunek 1
Rys.1. Szereg czasowy nakładu książek i broszur i dopasowana do
niego prosta
Nakład książek i broszur w latach 1990-1997
w mln egzemplarzy

200
wartości rzeczywiste
180
wartości teoretyczne
160
140
120
100
80
60
1990
1991
1992
1993
1994
1995
1996
1997
ocena składnika losowego modelu
n

2
S (e) 
2
( y t  yˆ t )
t 1
n2
n

S (e) 
e
2
t 1
n2
S (e) 
1849 , 743
82

308 , 29  17 ,559
ocena składnika losowego modelu


interpretacja błędu estymacji S(e):
odchylenie reszt, będące miarą przypadkowych
odchyleń nakładu książek i broszur od liniowego
trendu wynosi 17,559 mln egzemplarzy
współczynnik zmienności


interpretacja współczynnika
zmienności V:
odchylenia losowe (odchylenia
obserwacji teoretycznych od
rzeczywistych) nakładu książek
i broszur stanowią 15,27%
średniego nakładu książek i
broszur
V 
S (e)
 100 %
y
V 
17 , 559
115
 100 %  15 , 27 %
współczynnik zbieżności
interpretacja φ2 :
liniowy model
trendu nie
wyjaśnia około
30,7% całkowitej
zmienności
nakładu książek i
broszur w
rozpatrywanym
okresie
n

 
2
n
2
( y t  yˆ t )
t 1
n


( yt  yt )
n  ( k  1) S ( e )
2
t 1
 
2
n

y ny

1849 , 743
2
t
t 1
1849 , 743
111830  8  (115 )
2
2

2

2
t 1
n

t 1
6030
e
 0 ,307
2
yt  n  y
2
współczynnik determinacji
interpretacja R2 :
liniowy trend
wyjaśnia 69,7%
całkowitego
zróżnicowania
nakładu książek i
broszur w
rozpatrywanym
okresie
n

R
2
 1
2
 1
e
2
t 1
n

2
yt  n  y
2
t 1
R
2
 1
1849 , 743
111830  8  (115 )
2
 1
1849 , 743
6030
 0 , 693
Weryfikacja modelu c.d.



czy czas istotnie
objaśnia nakład książek
i broszur?
czy reszty są losowe?
czy występuje
autokorelacja reszt?

test t-Studenta

test serii

test Durbina-Watsona
Prognoza punktowa



Model tendencji z dobrze dobraną funkcją trendu można
wykorzystać do prognozowania zjawiska na przyszłe okresy.
Prognoza ma charakter ekstrapolacji tzn. przeniesienia
zaobserwowanej tendencji rozwojowej na przyszłe okresy.
Oznaczając przez T okres, którego dotyczy prognoza, jej wartość
obliczymy z otrzymanej funkcji trendu:
YˆT  159 ,893  9 , 976 T

Wyznaczony model wykorzystamy do określenia progozy
nakładu książek i broszur w 1999 roku.
W przyjętym systemie numeracji rok ten ma numer T=10.

Prognoza wielkości nakładu książek i broszur w 1999 roku

wyniesie:
Yˆ10  159 ,893  9 , 976 10  60 ,133

mln egzemplarzy
Standardowy błąd prognozy

obliczanie standardowego
błędu prognozy VT:
VT  S (e )
1
1
(T  t )

n
2
n

(t  t )
2
t 1
n
gdzie :

n
(t  t )
t 1
V10  17 ,559
1
1
8

(10  4 ,5 )
2


t 1
2
204  8  ( 4 ,5 )
2
 23 ,85
t
2
 n  (t )
2
Standardowy błąd prognozy




Interpretacja standardowego błędu prognozy VT:
Przeciętnie biorąc, prawdziwe wartości zmiennej Y
będą się odchylać od wyznaczonej prognozy średnio
o wartość ± VT .
Przykład:
Przeciętnie biorąc, nakład książek i broszur w 1999
roku będzie się odchylał od prognozy nakładu
książek i broszur (60,133 mln egzemplarzy) średnio o
± 26,83 mln egzemplarzy.
Względny standardowy błąd prognozy

Względny błąd prognozy ex ante:
T 
Obliczenia:
T 



VT
P
yT
VT
P
yT
 100
 100 
23 ,85
 100  39 , 66 %  40 %
60 ,133
Interpretacja:
W 1999 roku przeciętne oczekiwane odchylenie nakładu
książek i broszur od prognozowanej wielkości nakładu
książek i broszur stanowić będzie około 40% wartości
prognozy.
Procentowy rząd odchyleń prognozy od rzeczywistej
wielkości nakładu książek i broszur jest bardzo duży i
wynosi około 40%.
Prognoza przedziałowa





Z tablicy t-Studenta dla n-(k+1) stopni swobody (8(1+1)=6 ) oraz poziomu ufności 1- (0,95)
odczytujemy t = 2,447 .
Wyznaczamy granice przedziału prognozy:
dolna granica
60,133 - 2,447· 23,85=1,772
górna granica
60,133 + 2,447· 23,85=118,49
Przedział prognozy jest więc następujący:


[1,772 ; 118,49]
Z prawdopodobieństwem równym 0,95 można
przypuszczać, że w 1999 roku nakład książek i broszur
będzie się zawierać w tym przedziale