statistik_12_04_05

Download Report

Transcript statistik_12_04_05

STATISIK
LV Nr.: 1375
SS 2005
12. April 2005
1
Nichtparametrische Tests
• Nichtparametrische Tests (v.a. wenn
Annahme der Normalverteilung nicht erfüllt
ist).
• Rangtests für Lageparameter
– Zeichentest
– Wilcoxon Vorzeichenrangtest für das
Symmetriezentrum einer Verteilung
• Verteilungsfreie Lokationsvergleiche
– Wilcoxon Rangsummentest oder
Mann-Whitney U Test
2
Rangtests für Lagemarameter
Zeichentest (Ordinalskala ausreichend)
– Annahme: unabhängige Beobachtungen x1, ..., xn
stammen aus einer Grundgesamtheit mit stetiger
Verteilungsfunktion F.
• Test für den Median ξ0,5 der Grundgesamtheit
• Einseitige Hypothesen:
– H0: ξ0,5  ξ0 gegen H1: ξ0,5 > ξ0
– H0: ξ0,5  ξ0 gegen H1: ξ0,5 < ξ0
• Zweiseitige Hypothese:
– H0: ξ0,5 = ξ0 gegen H1: ξ0,5  ξ0
3
Rangtests für Lagemarameter
• Vorgehensweise:
• Transformation der Beobachtungswerte:
– xi‘ = xi - ξ0
• Bestimmung von yi
– yi = 1 falls xi‘ > 0, yi = 0 falls xi‘ < 0,
Bindungen: yi = ½ falls xi‘ = 0
4
Rangtests für Lagemarameter
• Teststatistik:
n
T   yi
i 1
Unter H0 ist T ~ B(n, ½)
• Approximation durch N(0,1):
n
Z
1
yi  n

2
i 1
n
n
yi 

2
 i 1
1
1 1
n
n 1  
2
2 2
• Entscheidung: Vergleich von Z mit
kritischen Werten der N(0,1) Verteilung
5
Rangtests für Lagemarameter
• Beispiel für Zeichentest (Hartung, S. 243):
– Alter von Frauen bei der Geburt des ersten
Kindes. H0: ξ0,5  25 gegen H1: ξ0,5 > 25.
Zufällige Auswahl von n = 36 Müttern.
i
1
2
:
35
36
Alter xi
30,6
17,8
:
20
23,5
xi‘
5,6
-7,2
:
-5
-1,5
yi
1
0
:
0
0
6
Rangtests für Lagemarameter
• Beispiel
• Approximation durch N-Vt
n
1
yi  36

2 20  18
i 1
Z

 0, 667
1
3
36
2
• Entscheidung (bei α=0,05): Z < 1,645
Lehne H0: ξ0,5  25 nicht ab.
7
Rangtests für Lagemarameter
• Wilcoxon Vorzeichenrangtest für das
Symmetriezentrum einer Grundgesamtheit
– Basiert auf Rangzahlen der Beobachtungen
– Annahme: n unabhängige Beobachtungen
(x1, ..., xn) stammen aus einer Grundgesamtheit
mit Verteilungsfunktion F
• Frage: Ist die Verteilung symmetrisch um
einen Wert ξ0, d.h. gilt F(ξ0-y) = 1-F(ξ0+y)?
8
Rangtests für Lagemarameter
Verteilungsfunktion F(x)
1
1-F(ξ0+y)
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
F(ξ0-y)
0
-3
-2
ξ-1
0-y
ξ00
ξ01+y
2
9
3
Rangtests für Lagemarameter
• Wilcoxon Vorzeichenrangtest für das
Symmetriezentrum ξ0 einer
Grundgesamtheit
• Einseitige Hypothesen:
– H0: F symmetrisch um ξ  ξ0
– H0: F symmetrisch um ξ  ξ0
• Zweiseitige Hypothese:
– H0: F symmetrisch um ξ = ξ0
10
Rangtests für Lagemarameter
• Vorgehensweise:
• Transformation der Beobachtungswerte:
– xi‘ = xi - ξ0
• Ohne Berücksichtigung der Vorzeichen der
xi‘ Rangzahlen Ri zuweisen (1 für kleinsten
Wert, ..., n für größten Wert).
• Den Rangzahlen werden die Vorzeichen der
zugehörigen xi‘ Werte zugewiesen =>
Rangstatistik R̃i
11
Rangtests für Lagemarameter
• Teststatistik:
n
~

T   ci R i
i 1
mit ci = 0 falls R̃i < 0 und ci = 1 falls R̃i > 0
• Entscheidung: Vergleich von T+ mit
kritischen Werten wn,α des Vorzeichenrangtest von Wilcoxon (z.B. Hartung S. 245)
12
Rangtests für Lagemarameter
• Approximation durch N(0,1) Verteilung:
• Teststatistik T* (keine Bindungen):
+
+
T
-E
T
T* =
+
Var T
mit E T+ = n(n+1) / 4
und Var T+ = n(n+1)(2n+1) / 24
(Beim Auftreten von Bindungen: T* laut Hartung, S. 246)
• Vergleich von T* mit kritischen Werten der
N(0,1) Verteilung
13
Rangtests für Lagemarameter
• Beispiel Wilcoxon Vorzeichenrangtest
Psychologischer Test, Bewertung durch Punkte xi
H0: F symmetrisch um ξ = ξ0 = 61, α = 0,05
• Teststatistik:
n
~
T   ci R i

i 1
ci = 0 falls R̃i < 0 und ci = 1 falls R̃i > 0
14
Rangtests für Lagemarameter
• Beispiel:
i
xi
xi‘ = xi- ξ0
Ri
R̃ i
1
72
11
10,5
10,5
2
55
-6
3
-3
3
67
6
3
3
4
53
-8
7
-7
5
69
8
7
7
6
71
10
9
9
7
55
-6
3
-3
8
68
7
5
5
9
65
4
1
1
10
72
11
10,5
10,5
11
69
8
7
7
• T+ = 1·10,5+0·(-3)+1·3+0·(-7)+1·7+1·9+0·(-3)+1·5+1·1
+1·10,5+1·7 = 53
15
Rangtests für Lagemarameter
• Beispiel:
• Kritische Werte aus Tabelle: wn;α/2 = w11;0,025
= 11 und wn;1-α/2 = w11;0,975 = 54
• Entscheidung:
w11;0,025 = 11 < T+ = 53 < 54 = w11;0,975
Daher: lehne H0 nicht ab, F ist symmetrisch
um ξ0 = 61.
16
Vt.-freie Lokationsvergleiche
• Wilcoxon Rangsummentest oder MannWhitney U Test
• Annahme: zwei unabhängige Messreihen,
zugrundeliegenden Verteilungsfunktionen
sind stetig und vergleichbar (d.h. sie
schneiden einander nicht).
• Frage: Besteht ein Unterschied in den
Verteilungen? Sind z.B. die Werte der einen
Messreihe „im Durchschnitt größer“ als die
der anderen?
17
Vt.-freie Lokationsvergleiche
Verteilungsfunktionen
1
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
-5
-4
-3
-2
-1
0
1
2
3
4
5
18
6
Vt.-freie Lokationsvergleiche
• Einseitige Hypothesen:
– H0: F1(x)  F2(x) gegen H1: F1(x)  F2(x) und
für mind. ein x gilt: F1(x) < F2(x)
– H0: F1(x)  F2(x) gegen H1: F1(x)  F2(x) und
für mind. ein x gilt: F1(x) > F2(x)
• Zweiseitig Hypothese:
– H0: F1(x) = F2(x) gegen H1: F1(x)  F2(x)
19
Vt.-freie Lokationsvergleiche
• Vorgehensweise:
• Gemeinsame Rangzahlen der beiden
Messreihen bilden: r1, ..., rn1, rn1+1, ..., rn1+n2
• Teststatistik:
n1
Wn1,n1 = ri
i=1
• Kritische Werte des WilcoxonRangsummen-Tests aus Tabelle (siehe z.B.
Hartung 518)
20
Vt.-freie Lokationsvergleiche
• Entscheidung:
– H0: F1(x)  F2(x),
H0 verwerfen falls Wn1,n2 > Wn1;n2;1-α
– H0: F1(x)  F2(x),
H0 verwerfen falls Wn1,n2 < Wn1;n2;α
• Zweiseitig Hypothese:
– H0: F1(x) = F2(x)
H0 verwerfen falls Wn1,n2 < Wn1;n2;α/2 oder
Wn1,n2 > Wn1;n2;1-α/2
21
Vt.-freie Lokationsvergleiche
• Beispiel: Behandlung von Pilzen mit
Vitamin B1. Führt diese Behandlung zu
(signifikant) höherem Gewicht?
Behandlung
Rangz.
Behandlung
Rangz.
Kontrolle
Rangz.
Kontrolle
Rangz.
27
19
26,5
18
18
7
17
6
34
22,5
22
14
14,5
5
18,5
8
20,5
12
24,5
17
13,5
3
9,5
1
29,5
21
34
22,5
12,5
2
14
4
20
10,5
35,5
24
23
15
28
20
19
9
24
16
20
10,5
21
13
22
Vt.-freie Lokationsvergleiche
• Beispiel:
H0: FB(x) ≥ FK(x) bzw. XB ist stochastisch
kleiner als XK, α = 0,05.
• Teststatistik: Summe der Ranzahlen der
ersten Messreihe (Behandlungsgruppe):
Wn1,n2 = 220.
• Kritischer Wert: wn1;n2;0,95 = 191
• Entscheidung: 220 > 191 => H0 ablehnen.
D.h. die Behandlung führt zu einem
signifikant höheren Gewicht.
23
Varianzanalyse
Varianzanalyse od. ANOVA
• Frage: Hat ein Faktor Einfluss auf ein
Merkmal?
• Faktor: Nominal skalierte Größe,
Faktorausprägungen = Ebenen oder Stufen
• Merkmal (durch Faktor beeinflusst):
Metrische Größe
24
Varianzanalyse
Varianzanalyse
• Einfache Varianzanalyse: Ein Faktor
• Zweifache Varianzanalyse: Zwei Faktoren
• …
25
Varianzanalyse
• Test, für arithmetische Mittel von zwei oder
mehr Grundgesamtheiten.
– Test, ob die Differenz der arithmetischen Mittel
von zwei oder mehr als zwei
Grundgesamtheiten signifikant von Null
verschieden ist.
26
Varianzanalyse
• Modellannahmen der Varinazanalyse:
– Unabhängigkeit der Stichproben (i=1,…,r)
– Normalverteilung der Merkmale mit µi und σi²
– Varianzhomogenität (Homoskedastizität), d.h.
σi² = σ²
27
Varianzanalyse
• Nullhypothese: Alle Gruppen haben den
gleichen Mittelwert µ
H0: µ1 = µ2 = … = µ
• Alternativhypothese: Nicht alle Gruppen
haben den gleichen Mittelwert µ
H1: mindestens zwei µi sind ungleich
28
Varianzanalyse
• Frage: Beeinflusst der Faktor (nominalskalierte Größe) das Merkmal (metrischskalierte Größe)?
• Unter H0: µi = µ für alle i (i = 1,…,r
Faktorstufen).
• Abweichung, die dem Faktor zuzuschreiben
sind: αi = µi - µ (i = 1,…,r) heißen wahre
Effekte auf der i-ten Ebene.
29
Varianzanalyse
• Modell der einfachen Varianzanalyse:
• xij = µ + αi + eij
– µ … Gesamtmittelwert
– αi … Effekt auf der i-ten Ebene
– eij … Versuchsfehler = die Abweichung eines
zufällig aus der i-ten Ebene des Faktors
herausgegriffenen Beobachtungswertes xik vom
Mittelwert µi dieser Ebene.
eij = xij – µi = xij – (µ + αi)
30