A FEHÉRZAJ Statisztika II. VEGTGAM22S Az idősormodellek maradéktagja •A fehérzaj (white noise) vagy más néven véletlen zaj: olyan tetszőleges eloszlású - additív modellek esetén zérus, multiplikatív.

Download Report

Transcript A FEHÉRZAJ Statisztika II. VEGTGAM22S Az idősormodellek maradéktagja •A fehérzaj (white noise) vagy más néven véletlen zaj: olyan tetszőleges eloszlású - additív modellek esetén zérus, multiplikatív.

A FEHÉRZAJ
Statisztika II.
VEGTGAM22S
Az idősormodellek maradéktagja
•A fehérzaj (white noise) vagy más néven véletlen zaj: olyan
tetszőleges eloszlású - additív modellek esetén zérus,
multiplikatív modellek esetén pedig egységnyi várható értékű nem periodikus zaj (folyamat), melynek spektruma egy adott
frekvenciasávban közel azonos teljesítmény-sűrűségű (azaz
spektrális energia-eloszlása független a frekvenciától).
•Az elnevezés a fényre utal, mert a fehér fény teljesítményeloszlása is egyenletes a frekvencia mentén.
•A zaj több eltérő frekvenciájú és intenzitású jel zavaró
összessége, amely a hasznos jelre szuperponálódik és elfedi
annak információ-tartalmát.
Az idősormodellek maradéktagja
•„Valódi" – a teljes végtelen frekvenciatartományban
értelmezett – fehérzaj nem létezik, csak valamilyen véges
frekvenciatartományban teljesülhetnek az előbbi feltételek.
•A fehérzaj gyakran – de nem feltétlenül – normális
eloszlású. Ha a normalitás feltételezhető, a folyamat leírása
egyszerűbb.
Példa: egy normális eloszlású fehérzajra
.
Példa: egy 768 lépéses fehérzaj időfüggvénye
2,00
1,00
Normal(0,1)
Amplitudó 
3,00
0,00
-1,00
.
-2,00
-3,00
-4,00
749
727
705
683
661
639
617
595
573
551
529
507
485
463
441
419
397
375
353
331
309
287
265
243
221
199
177
155
133
111
89
67
45
23
1
Sequence number
Idő (sorszám) 
Példa: az előbbi 768 lépéses fehérzaj periodogramja
Periodogram of white_noise by Frequency
Power 
Periodogram
2,009E1
7,389E0
.
0
-1,353E-1
0,0
0,1
0,2
0,3
0,4
Frequency
Frekvencia (nullától a mintavételi frekvencia feléig) 
0,5
Példa: egy 768 lépéses fehérzaj periodogramjának
„simított” változata
Density Power 
Spectral Density of white_noise by Frequency
1,484E2
5,46E1
2,009E1
.
7,389E0
2,718E0
0,0
0,1
0,2
0,3
0,4
Frequency
Window: Tukey-Hamming (5)
Frekvencia (nullától a mintavételi frekvencia feléig) 
0,5
Az idősor hibatagja, a fehérzaj
Példa generált fehér zajra
N=100
N=1000
N=11041
Példa generált fehér zajra
A P-P diagrammok, grafikus tesztek a normalitás ellenőrzésére
N=100
N=1000
N=11041
Próbák a fehérzaj felismerésére
Az idősorok matematikai tárgyalását a nem változó idősorok
kimutatására kidolgozott statisztikai próbák ismertetésével
kezdjük. Ezek azért fontosak, hogy eldönthessük, hogy érdemes-e
egyáltalán foglalkozni az elemzendő idősorral. Ha ugyanis az
idősorunk korrelálatlan azonos eloszlású változók sorozata, nincs
benne sem trend, sem ciklikusság, akkor nincs mit tennünk. A
semmiből nem lehet kimutatni a valamit.
Másrészt, ha már túl vagyunk egy bonyolult elemzésen és
előállítottuk a becslést, a maradék idősorra elvégezve a fent
említett próbákat bebizonyíthatjuk, hogy modellünk tartalmaz
minden lényeges információt amit tudni lehet. A modell
érvényességének elemzésekor ezt fontos elvégezni.
Váltakozáselemzés
Váltakozáselemzés
Váltakozáselemzés
Váltakozáselemzés
Váltakozáselemzés
Próbastatisztika
Az előző példában a próbastatisztika számított értékei a szignifikanciával
Csúcsmódszer
Csúcsmódszer
i=1, ha
i=0, ha
vagy
vagy
Csúcsmódszer
Csúcsmódszer
A leírásban szereplő  idősor számolását végző szintaxis-program:
Csúcsmódszer
Csúcsmódszer
Csúcsmódszer
A nullhipotézist, hogy a generált adatsor fehérzaj,
minden mintaszámnál el lehet fogadni:
Előjelmódszer
Előjelmódszer
A portmentau-próba
Ha fehérzajról van szó, akkor
A hibatag értékei korrelálatlanok
• Egyszerű véletlen mintavétel esetében ez a feltétel
automatikusan teljesül.
• Ha a modell idősoros adatokra épül, gyakran előfordul a
hibatagok autokorreláltsága.
• Autokorreláció oka:
– Nem megfelelő függvénytípus.
– Nem véletlen jellegű mérési hiba.
– A modellben nem szerepel valamennyi lényeges magyarázó
változó (nem tudjuk, hogy kell / túl rövid idősor / nincs
adat).
Autokorreláció grafikus tesztelése
e
e
A reziduumok nem
véletlenszerűek,
hanem az egymást
követő értékek között
t jelentős
korreláció
van.
t
e
Az autokorreláció a
függvénytípus
t
helytelen
megválasztásának
következménye.
a
Autokorreláció tesztelése DurbinWatson próbával
H0: ρ = 0 korrelálatlan
n
d 
H1: ρ ≠ 0 autokorreláció
 (e
t 2
t
 e t 1 ) 2
n
e
t 1
Határai:0
2
t
d 4
Pozitív autokorreláció:
0d 2
Negatív autokorreláció:
- zavaró
autokorreláció
2d 4
+ zavaró
autokorreláció
0
dl du
2
4-du 4-dl
Elfogadási tartomány
4
Bizonytalansági
tartomány: nem tudunk
dönteni
• Növelni
kell
a
megfigyelések számát
• Új változót kell bevonni
a modellbe
A Durbin-Watson próba döntési
táblázata
H1
p>0
Pozitív
autokorreláció
p<0
Negatív
autokorreláció
H0:p=0
Elfogadjuk
Elvetjük
d > du
d < 4-du
d < dl
d > 4-dl
Nincs
döntés
dl< d <du
4-dl < d <4-du
du illetve dl értékét a Durbin-Watson táblázatból
határozzuk meg
Forrás: Kerékgyártó-Mundruczó
[1999]
Durbin-Watson statisztika
(5%-os szignifikanciaszint mellett)
N
Forrás:
Statisztikai
képletgyűjtem
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
50
60
70
80
90
100
dL
1,08
1,10
1,13
1,16
1,18
1,20
1,22
1,24
1,26
1,27
1,29
1,30
1,32
1,33
1,34
1,35
1,36
1,37
1,38
1,39
1,40
1,41
1,42
1,43
1,43
1,44
1,50
1,55
1,58
1,61
1,63
1,65
dU
1,36
1,37
1,38
1,39
1,40
1,41
1,42
1,43
1,44
1,45
1,45
1,46
1,47
1,48
1,48
1,49
1,50
1,50
1,51
1,51
1,52
1,52
1,53
1,54
1,54
1,54
1,59
1,62
1,64
1,66
1,68
1,69
Autokorreláció tesztelése Durbin-Watson próbával
0
dl
0,95
du
1,54
2
4-du
2,46
4-dl
3,05
4
1,381
dl<d<du → nincs döntés
→ Növelni kell a megfigyelések számát!
Durbin-Watson próba - SPSS
Analyze / Regression /
Linear… - Statistics
Grafikus normalitásvizsgálat
A lehetséges eloszlások: béta, Chi-négyzet , exponenciális, gamma,
fél-normális, Laplace, Logisztikus, Lognormál, normális, pareto,
Student-féle t,, Weibull, és egyenletes.
A P-P ábrán az elméleti eloszlásfüggvény és az empirikus
eloszlásfüggvény van összehasonlítva.
A Q-Q ábrán látható pontok vízszintes tengelyhez tartozó
koordinátái a változó tapasztalati kvantilisei, a függőleges
tengelyen pedig a tesztelt eloszlás kvantilisei állnak.
A jó illeszkedés esetén a pontok közel szóródnak az ábrán
meghúzott egyenes körül!
Grafikus normalitásvizsgálat
Hisztogramm a normális sűrűségfüggvénnyel
Grafikus illeszkedésvizsgálat
Grafikus illeszkedésvizsgálat
Grafikus illeszkedésvizsgálat
Grafikus illeszkedésvizsgálat
Grafikus illeszkedésvizsgálat
Grafikus illeszkedésvizsgálat
Illeszkedésvizsgálat próbával
Illeszkedésvizsgálat próbával
Az illeszkedés nem
fogadható el!
Egymintás Kolmogorov-Szmirnov próba
H 0 : A minta
eloszlásfü
ggvénye
F
(
x
)
Most ún. illeszkedésvizsgálatról van szó!
t próba  n sup Femp ( x)  F ( x)
xI R
k
Femp ( x) 
n
ahol
k # xi ; xi  xvagy xk*  x  xk*1
Ha a nullhipotézis igaz, a próbastatisztika aszimptotikusan
Kolmogorov-eloszlást
követ.
A kritikus
értéket ez alapján
t

t

H
krit
0
DÖNTÉS próba
az eloszlás alapján határozzuk meg a szignifikancia szinthez.
Az empirikus eloszlásfüggvény és az elméleti
eloszlásfüggvény átfedése 100 elemű minta
esetén:
A Kolmogorov eloszlás
Példa egymintás Kolmogorov-Szmirnov próbára
Normális eloszlást követ-e a fogyás?
Példa egymintás Kolmogorov-Szmirnov próbára
Példa egymintás Kolmogorov-Szmirnov próbára
Jelentős nagyságú a szignifikancia szint,
el kell hogy fogadjuk a nullhipotézist! A
fogyás jól illeszkedik a normális
eloszláshoz!