Wykład 1 - Monika Chuchro

Download Report

Transcript Wykład 1 - Monika Chuchro

ANALIZA SZEREGÓW
CZASOWYCH
Wykład 1
Informacje podstawowe
dr inż. Monika Chuchro
konsultacje: wtorek 11.30-12.30 pokój 383,
Email: [email protected]
Informacje podstawowe
Wykład 30h
• Obecność nieobowiązkowa,
Ćwiczenia 30h
• Obecność obowiązkowa, max. 1 nieobecność
nieusprawiedliwiona,
• Na zajęciach sprawdzane będzie przygotowanie do zajęć,
• Ocena końcowa= projekt + oceny z przygotowań do zajęć
+ kolokwium,
Informacje podstawowe
W trakcie zajęć będziemy korzystać głównie z programu
Statistica 10.0.
Można korzystać też z R
Tematyka zajęć
1. Wstęp do analizy szeregów czasowych i teorii
2.
3.
4.
5.
6.
7.
8.
9.
10.
prognozowania
Pełna analiza danych, model i ocena modelu
Analiza w dziedzinie częstotliwości i modele Fouriera
Ocena jakości modeli- rozszerzona
Modele z interwencją
Analiza reszt, modele składnika resztowego
Anova
Dekompozycja sezonowa, Census
Census II, Tramo Seat
Modele niestandardowe, model na podstawie analogii
Tematyka zajęć
11. Garch, MARS
12. Analiza przeżycia
13. Sieci neuronowe- projektowanie użytkownika
14. Kolokwium końcowe
15. Wpisy
Literatura
• Chris Chatfield, The analysis of time series. An
introduction, Chapman & Hall/CRC, 2004
• Rafał Klóska, Marcin Hundert, Rafał Czyżycki, Wybrane
zagadnienia z prognozowania, Economicus, 2007
• G.S. Maddala, Ekonometria, PWN, 2006
• Paweł Tatarzycki, Statystyka po ludzku, Złote myśli, 2007
Definicje szeregu czasowego
• ciąg obserwacji pokazujący kształtowanie się badanego
zjawiska w kolejnych okresach czasu (sekundach, dniach,
latach, itp.),
• uporządkowany chronologicznie zbiór wartości badanej cechy
lub określonego zjawiska zaobserwowanych w różnych
momentach (przedziałach) czasu,
• ciąg obserwacji xt zapisywanych w ściśle określonym czasie,
• realizacja procesu stochastycznego, którego dziedziną jest
czas - pojedyncze obserwacje yt są realizacją zmiennych
losowych Yt. Proces stochastyczny definiowany jest wtedy jako
ów ciąg zmiennych losowych indeksowanych przez czas t, a
szereg czasowy jest wtedy jego pojedynczą realizacją.
Przykładowe szeregi czasowe
• Opady na przestrzeni lat,
• Zarobki,
• Produkcja wełny,
• Ilość wypijanej wody mineralnej,
Przykład szeregu czasowego
Produkcja energii elektrycznej w Polsce w latach 1991-1994
(dane miesięczne w mld kWh)
Miesiące
Lata
1991
1992
1993
1994
I
II
III
IV
V
VI
VII
VIII
IX
X
XI
XII
14,0
13,4
13,4
12,9
12,9
12,2
12,2
12,3
12,8
12,5
12,8
12,7
11,3
11,0
10,7
10,9
10,6
9,6
9,3
9,9
9,2
9,0
8,9
9,4
9,0
9,0
8,7
9,3
9,0
9,0
9,1
9,5
9,3
9,7
9,8
9,8
11,2
12,0
11,5
12,3
12,1
12,3
13,0
12,3
13,3
13,2
13,5
13,6
Graficzne przedstawienie szeregu
czasowego
Produkcja energii elektrycznej w Polsce w latach 1991-1994
(dane miesięczne w mld kWh)
Rodzaje szeregów czasowych
Szereg czasowy momentów: Ludność
w wieku produkcyjnym, stan w dniu 31
grudnia w latach 1990-1995
Lata
1990
1991
1992
1993
1994
1995
Liczba ludności w wieku produkcyjnym w
mln (stan w dn. 31.12)
21,9
21,5
21,9
22,0
22,0
22,2
Szereg czasowy okresów: Roczne
wydobycie węgla w Polsce w latach 19901995
Lata
1990
1991
1992
1993
1994
1995
Wielkość produkcji w mln ton
193,0
193,0
178,0
148,0
140,0
190,0
Analiza szeregów czasowych
Analiza szeregów czasowych (ASC) jest działem statystyki
matematycznej. Podstawowe zadanie polega na
identyfikacji parametrów stacjonarnego procesu
stochastycznego z czasem dyskretnym (szeregu
czasowego).
1. analiza opisowa szeregu czasowego (tj. obliczanie
średniej arytmetycznej lub chronologicznej, wariancji,
odchylenia standardowego),
2. porównanie poziomów zjawiska w czasie (tj. analiza
dynamiki zjawisk z wykorzystaniem miar dynamiki),
3. dekompozycja szeregu czasowego (tj. wyodrębnianie
tendencji rozwojowej, wahań okresowych i wahań
przypadkowych).
Składniki szeregu czasowego
• tendencja rozwojowa
(trend) - ogólny kierunek
zmian zjawiska w czasie
będący wynikiem
systematycznych,
jednokierunkowych zmian
(spadek lub wzrost)
poziomu badanego
zjawiska
• przeciętny poziom
zjawiska
Składniki szeregu czasowego
 wahania
okresowe rytmiczne
wahania
poziomu
badanego
zjawiska o określonym
cyklu
(okresie
przebiegu)
 wahania
cykliczne
(koniunkturalne)
systemowe
wahania
poziomu
badanego
zjawiska obserwowane
w dłuższych od roku
okresach
Składniki szeregu czasowego
 wahania
przypadkowe
(losowe)
nieregularne,
nieprzewidywalne
zarówno co do
kierunku jak i siły
zmiany
poziomu
badanego
zjawiska
Szereg czasowy
Ze względu na stosunek poszczególnych składowych
szeregu czasowego do siebie wyróżniamy szeregi:
• Addytywne,
• Multiplikatywne,
• Mieszane.
Cel analizy szeregów czasowych
 zbudowanie modelu
pewnego zjawiska/ procesu w
oparciu o obserwowane zmiany w czasie pewnych
mierzalnych wielkości opisujących ten proces,
 wyodrębnienie
i
pomiar
składowych
szeregu
(dekompozycja),
 przy użyciu otrzymanego modelu można dokonywać
predykcji (eksploracji) przebiegu szeregu lub jego
składowych.
Analizę szeregów czasowych stosuje się:
 analiza danych giełdowych,
 opracowanie danych GUS,
 wspomaganie decyzji marketingowych,
 analiza
danych
diagnostycznych
i
postepowania w medycynie,
 analiza wyników eksperymentów naukowych.
prognozy
Etapy analizy szeregów czasowych
1) Sformułowanie problemu
2) Zbieranie informacji o zjawisku,
3) Zbieranie danych,
4) Sformułowanie modelu,
5) Przygotowanie danych do analizy,
6) Analiza opisowa danych,
7) Selekcja zmiennych,
8) Estymacja parametrów modelu,
9) Weryfikacja modelu!!!!!,
10) Interpretacja modelu.
Matematyczne modele dynamiczne
• Model deterministyczny to model matematyczny, który
danemu na wejściu zdarzeniu jednoznacznie przypisuje
konkretny stan. Opis modelu nie zawiera żadnego
elementu losowości. Oznacza to, że ewolucja układu w
modelu deterministycznym jest z góry przesądzona i
zależy wyłącznie od parametrów początkowych lub ich
wartości poprzednich.
Matematyczne modele dynamiczne
• Proces stochastyczny - rodzina zmiennych losowych
określonych na pewnej przestrzeni probabilistycznej o
wartościach w pewnej przestrzeni mierzalnej.
Najprostszym przykładem procesu stochastycznego jest
wielokrotny rzut monetą: dziedziną funkcji jest zbiór liczb
naturalnych (liczba rzutów), natomiast wartością funkcji
dla danej liczby jest jeden z dwóch możliwych stanów
losowania (zdarzenie), orzeł lub reszka. Nie należy mylić
procesu losowego, którego wartości są zdarzeniami
losowymi, z funkcją, która zdarzeniom przypisuje wartość
prawdopodobieństwa ich wystąpienia (mamy wówczas do
czynienia z rozkładem gęstości prawdopodobieństwa).
Matematyczne modele dynamiczne
Większość zjawisk nie jest całkowicie deterministyczna,
mogą na nie wpływać inne nieznane czynniki natury
losowej. Owe czynniki powodują niemożliwość znalezienia
modelu deterministycznego, pozwalającego na dokładne
obliczenie przyszłego przebiegu zjawiska. Niemniej jednak
można zbudować model, który pozwala wyznaczyć
przyszłe wartości z prawdopodobieństwami. Model taki
nazywamy modelem probabilistycznym lub
stochastycznym. W modelach stochastycznych, w
odróżnieniu od modeli deterministycznych przyszłe
wartości szeregu czasowego możemy oszacować z
pewnym błędem, natomiast nie potrafimy określić
dokładnie ich wartości.
Prognozowanie
• Prognozowanie jest
to przewidywanie
przyszłości.
Przewidywanie jest
więc wnioskowaniem
o zdarzeniach, które
zajdą w czasie
późniejszym niż
czynność
przewidywania, na
podstawie informacji
z przeszłości.
dirtyit.blogspot.com
Prognoza statystyczna
• Prognozą statystyczną nazywać będziemy każdy sąd,
którego prawdziwość jest zdarzeniem losowym, przy
czym prawdopodobieństwo tego zdarzenia jest znane i
wystarczająco duże dla celów praktycznych.
Prognoza
Prognozę można definiować za pomocą stwierdzeń:
• Jest formułowana z wykorzystaniem dorobku nauki.
• Jest stwierdzeniem odnoszącym się do określonej przyszłości.
• Jest twierdzeniem weryfikowanym empirycznie.
• Nie jest stwierdzeniem stanowczym, ale jest stwierdzeniem
akceptowalnym.
• Prognoza odnosi się do obiektu, którym może być: kraj, region,
przedsiębiorstwo, człowiek, Układ Słoneczny, Kosmos itd.
• W obiektach zachodzą zjawiska: gospodarcze, psychiczne,
fizyczne, chemiczne, biologiczne i inne.
• Zjawiska dają się opisać za pomocą zmiennych.
Horyzont prognozy
Prognozowanie odnosi się do przyszłości. Okres dla
którego sporządzana jest prognoza nazywa się okresem
prognozowanym. Liczba jednostek czasu, jaka upływa od
teraźniejszości do okresu prognozowania nazywa się
wyprzedzeniem czasowym prognozy lub wyprzedzeniem
prognozy.
Długość tego okresu zależy od dwóch czynników:
• Charakteru zjawiska prognozowanego
• Praktycznych potrzeb prognozowania.
Funkcje i klasyfikacje prognoz
Koniec wykładu 1