Transcript 11_nonpara

Non-parametrische Testverfahren
Gliederung
• Definition
• Der χ² Test
• Kolmogorov-Smirnov-Test
• Überblick weitere Verfahren:
–
–
–
–
–
–
–
–
Der Fisher-Yates-Test
Der McNemar-Test
Cochran-Test (Q-Test)
Der Mediantest
Der U-Test (Mann-Whitney Test)
Vorzeichentest und Vorzeichenrangtest
Der Friedman-Test
Binominal-Test
11_nonpara
1
Non-parametrische Testverfahren
Definition:
• Nonparametrische (verteilungsfreie) Testverfahren setzen nicht
eine bestimmte Verteilungsformen des erfassten Merkmals (z.B.
Normalverteilung) voraus.
• Nonparametrische Verfahren werden eingesetzt…
 für die Analyse von Ordinal- oder Nominalskalierten Variablen
 Wenn die Normalverteilungsannahme verletzt ist.
• Parametrische Verfahren dürfen nur verwendet werden, wenn
die beteiligten Variablen die gefordert Verteilungsform ausweisen
(z.B. Normalverteilung für den t-Test). Sie haben in der Regel eine
höher statistische Power.
11_nonpara
2
Der χ² -Test
• Der χ²-Test („Chi-Quadrat-Test“) dient dem Vergleich von
beobachteten und erwarteten Häufigkeiten. Er kann eingesetzt
werden, wenn 1 oder 2 nominalskalierte unabhängige Variablen
vorliegen.
Beispiele:
• Leiden Männer und Frauen gleich häufig an einer bestimmten
Erkrankung?
• Leisten hoch-ängstlich und gering-ängstliche Personen gleich
häufig Hilfe in einer Notsituation?
11_nonpara
3
Der χ² -Test
Voraussetzung für den χ² -Test (Faustregeln)
(1) Weniger als 1/5 aller Zellen hat ein erwartete Häufigkeit
kleiner als 5.
(2) Keine Zelle weist eine erwartete Häufigkeit kleiner als 1
auf.
Wenn diese Voraussetzungen nicht erfüllt sind, sollte alternativ der
Fisher-Yates-Test verwendet werden.
11_nonpara
4
Der χ² -Test
χ² -Test – Beispiel 1
• Es soll geprüft werden, ob die Verteilung von Männern und
Frauen in einer Gruppe signifikant von einer Gleichverteilung
abweicht.
• N = 76 (Frauen: 56; Männer: 20)
• Statistische Hypothesen
– H0: π(Frau) = π(Mann)
– H1: π(Frau) ≠ π(Mann)
11_nonpara
5
Der χ² -Test
Schritt 1:
• Zunächst werden die nach der H0 zu erwarteten Häufigkeiten
berechnet:
• Beobachtet: NF = 56; NM=20
• Erwartet: ???
– Gesamtzahl: 76
– Bei einer Gleichverteilung wären also 38 Männer und 38 Frauen zu
erwarten.
11_nonpara
6
Der χ² -Test
Schritt 2:
• Nun wird der (empirische) χ²-Wert berechnet:

k
2
df  k 1
mit:
• k:
• fb,i:
• fe,i:
11_nonpara

i 1
f
 f e ,i 
2
b ,i
f e ,i
Anzahl der Stufen der beiden Variablen
Beobachtete Häufigkeit in der Zelle (i)
Erwartete Häufigkeit in der Zelle (i)
7
Der χ² -Test
Geschlecht
Frau
Mann
Beobachtet
56
20
76
Erwartet
38
38
76
58
20
78

k
2
df  k 1
 df2 1

i 1
f
 f e ,i 
2
b ,i
f e ,i
2
2
2

56  38 20  38 182  18




 8.53  8.53  17.05
11_nonpara
38
38
38
38
8
Der χ² -Test
• Schritt 3: Vergleich des empirischen χ²-Werts mit dem kritischen
χ²-Wert.
• Der kritische χ²-Wert wird in Abhängigkeit von den Freiheitsgraden und dem gewählten α-Niveau aus einer Tabelle zur χ²Verteilung abgelesen (Leonhart, S.448f).
• Für α=.05 ergibt sich bei df=1:
2
 emp
 17.05
2
 krit
 5.02
• Die H0 muss verworfen werden; folglich kann ein Unterschied
nachgewiesen werden.
11_nonpara
9
Der χ² -Test
Geschlecht
χ² -Test – Beispiel 2
Angst
Frau
Mann
gering
25
14
39
hoch
33
6
39
58
20
78
• Frage: Ist die (relative) Häufigkeit hoher bzw. geringer
Ängstlichkeit bei Männern und Frauen gleich?
• Statistische Hypothesen
– H0: π(Angst | Frau) = π(Angst | Mann)
– H1: π(Angst | Frau) ≠ π(Angst | Mann)
11_nonpara
10
Der χ² -Test
Schritt 1: Zunächst werden aus den Randsummen die nach der H0 zu
erwarteten Häufigkeiten geschätzt:
Beobachtet:
Geschlecht
Angst
Frau
Mann
gering
25
14
39
hoch
33
6
39
58
20
78
Erwartet:
11_nonpara
f e(i , j )
f b (i.) f b (. j )


N
N
N
f b (i.)  f b (. j )

N
Geschlecht
Angst
Frau
Mann
gering
29
10
39
hoch
29
10
39
58
20
78
11
Der χ² -Test
Schritt 2: Nun wird der (empirische) χ²-Wert berechnet:

k
2
df   k i  l 1
l
 
i 1 j 1
f
 f e(i , j ) 
2
b (i , j )
f e(i , j )
mit:
• k, l: Anzahl der Stufen der beiden Variablen
• fb(i,j): Beobachtete Häufigkeit in der Zelle (i,j)
• fe(i,j): Erwartete Häufigkeit in der Zelle (i,j)
11_nonpara
12
Der χ² -Test
Beobachtet:
Erwartet:
Geschlecht
Geschlecht
Angst
Frau
Mann
gering
25
14
hoch
33
58
k
l
 df2 k 1l 1  
i 1 j 1
 df2 1 
Angst
Frau
Mann
39
gering
29
10
39
6
39
hoch
29
10
39
20
78
58
20
78
f
b (i , j )  f e(i , j ) 
2
f e(i , j )
25  292 33  292 14  102 6  102


29
29
10
 0.55  0.55  1.60  1.60  4.30
11_nonpara

10
13
Der χ² -Test
• Schritt 3: Vergleich des empirischen χ²-Werts mit dem kritischen
χ²-Wert.
• Der kritische χ²-Wert wird in Abhängigkeit von den Freiheitsgraden und dem gewählten α-Niveau aus einer Tabelle zur χ²Verteilung abgelesen (Leonhart, S.448f).
• Für α=.05 ergibt sich bei df=1:
2
 emp
 4.30
2
 krit
 3.84
• Die H0 muss verworfen werden; folglich kann ein Unterschied
nachgewiesen werden.
11_nonpara
14
Der χ² -Test in SPSS
11_nonpara
15
Der χ² -Test in SPSS
NPAR TEST
/CHISQUARE=sex
/EXPECTED=EQUAL
11_nonpara
16
Der χ² -Test in SPSS
• SPSS-Ausgabe:
sex
1
2
Gesamt
Beobachtetes N Erwartete Anzahl
56
38,0
20
38,0
76
Residuum
18,0
-18,0
Statistik für Test
sex
Chi-Quadrat
17,053a
df
1
Asymptotische Signifikanz
,000
a. Bei 0 Zellen (.0%) werden weniger als 5 Häufigkeiten
erwartet. Die kleinste erwartete Zellenhäufigkeit ist 38.0.
11_nonpara
17
Der Kolmogorov-Smirnov-Test
Der Kolmogorov-Smirnov-Test
• Der Kolmogorov-Smirnov-Test vergleicht eine empirische
Verteilung mit einer vorgegebenen theoretischen Verteilung (z.B.
Normalverteilung).
• Damit ist es möglich, die Voraussetzung parametrischer
Testverfahren (z.B. für den t-Test) zu überprüfen.
• Statistische Hypothesen:
 H0: Die Variable ist normalverteilt
 H1: Die Variable ist nicht normalverteilt
11_nonpara
18
Der Kolmogorov-Smirnov-Test in SPSS
11_nonpara
19
Der Kolmogorov-Smirnov-Test in SPSS
NPAR TESTS
/K-S(NORMAL)=freiburg psycho stat.
11_nonpara
20
Der Kolmogorov-Smirnov-Test in SPSS
Kolmogorov-Smirnov-Anpassungstest
freiburg psycho
N
98
98
Parameter der
Mittelwert
20,8163 19,7908
a
Normalverteilung
Standardabweichung
1,89055 3,04428
Extremste Differenzen
Absolut
,182
,124
Positiv
,104
,063
Negativ
-,182
-,124
Kolmogorov-Smirnov-Z
1,797
1,225
Asymptotische Signifikanz (2-seitig)
,003
,099
a. Die zu testende Verteilung ist eine Normalverteilung.
stat
98
16,5204
3,15650
,111
,057
-,111
1,098
,179
Wenn p<.05 ist die Normalverteilungsannahme verletzt.
11_nonpara
21
Überblick weitere Verfahren:
Stichproben Nominaskalen
Ordinalskalen
Unabhängig • χ² Test
• Mediantest
• Fisher-Yates-Test • U-Test (Mann-Whitney)
• H-Test (Kruskal & Wallis)
Abhängig
• McNemar-Test
•
Vorzeichen-Test
• Cochran-Test
•
Vorzeichen-Rang-Test
(Wilkoxon)
•
Friedman-Test
11_nonpara
22
Der Fisher-Yates-Test
Der Fisher-Yates-Test
• Der Fisher-Yates Test wird eingesetzt, um Kontingenztabellen
auszuwerten, wenn die Voraussetzungen des χ²-Test verletzt sind
(d.h. bei geringen erwarteten Häufigkeiten).
• Beispiel:
Raucher
Nichtraucher
Frauen
20
40
Männer
3
5
• Berechnung: Siehe Leonhart (2004), Seite 162f
11_nonpara
23
McNemar-Test
Der McNemar-Test
• Der McNemar-Test wird für nominalskalierten Daten in zwei
abhängigen Stichproben (z.B. Messwiederholung) verwendet .
• Die erwarteten Häufigkeiten sollten nicht kleiner als 5 sein.
• Beispiel: Veränderung des Rauchverhaltens von der Jugend bis ins
Erwachsenenalter.
Erwachsene
Nichtraucher
Raucher
Σ
Nichtraucher
33
3
36
Raucher
18
21
39
Σ
51
24
75
Jugend
• Berechnung: Siehe Leonhart (2004), Seite 163f
11_nonpara
24
Cochran-Test (Q-Test)
Der Cochran-Test (Q-Test)
• Der Cochran-Test dient der Auswertung von nominalskalierten
Daten in mehr als zwei abhängigen Stichproben.
• Beispiel: (NR=Nichtraucher; R=Raucher)
Alter (Jahre)
Vp
12
16
20
24
28
1
NR
R
R
R
NR
2
NR
R
R
R
R
3
R
R
R
R
R
4
NR
NR
NR
NR
NR
5
NR
NR
R
R
R
• Berechnung: Siehe Leonhart (2004), Seite 165f
11_nonpara
25
Mediantest
Der Mediantest
• Der Der Mediantest dient dem Vergleich der zentralen Tendenz
ordinalskalierter Variablen, wenn zwei unabhängige Stichproben
vorliegen.
• Beispiel: Die Reaktionszeit bei einer Aufgabe soll zwischen
Männern und Frauen verglichen werden (Da die Zeiten nicht
normalverteilt sind, soll kein t-Test gerechnet werden)
• Berechnung: Siehe Leonhart (2004), Seite 162f
11_nonpara
26
U-Test (Mann-Whitney-Test)
Der U-Test (Mann-Whitney-Test)
• Der U-Test vergleicht die zentrale Tendenz eines ordinalskalierten
Merkmals zwischen zwei unabhängigen Zufallsstichproben.
• Anmerkung: Der U-Test hat einer höhere Power als der
Mediantest, jedoch ist er empfindlicher gegenüber
Ausreißerwerten.
• Beispiel: Der Therapieerfolg (Rating 1 bis 5) soll zwischen
einer Therapiegruppe und einer „Wartekontrollgruppe“
verglichen werden.
• Berechnung: Siehe Leonhart (2004), Seite 169f
11_nonpara
27
U-Test (Mann-Whitney-Test)
11_nonpara
28
U-Test (Mann-Whitney-Test)
NPAR TESTS
/M-W= freiburg BY sex(1 2) .
11_nonpara
29
U-Test (Mann-Whitney-Test)
Ränge
freiburg
Geschlecht
männlich
weiblich
Gesamt
N
Mittlerer Rang Rangsumme
21
41,57
873,00
75
50,44
3783,00
96
Statistik für Testa
Mann-Whitney-U
Wilcoxon-W
Z
Asymptotische Signifikanz (2-seitig)
a. Gruppenvariable: Geschlecht
freiburg
642,000
873,000
-1,312
,189
Weil p>.05 besteht also kein bedeutsamer Rangunterschied.
11_nonpara
30
H-Test (Kruskal & Wallis -Test)
Der H-Test (Kruskal & Wallis -Test)
• Der U-Test vergleicht die zentrale Tendenz eines ordinalskalierten
Merkmals zwischen zwei unabhängigen Zufallsstichproben.
• Beispiel: Der Therapieerfolg soll zwischen drei Therapieverfahren sowie einer „Wartekontrollgruppe“ verglichen
werden.
Therapieerfolg
Therapie A
Therapie B
Therapie C
Wartekontrollgruppe
4
3
4
2
2
4
2
3
4
4
3
3
2
2
1
3
• Berechnung: Siehe Leonhart (2004), Seite 175ff
11_nonpara
31
Vorzeichentest und Vorzeichenrangtest
Vorzeichentest und Vorzeichenrangtest
• Der Vorzeichentest und der Vorzeichenrangtest nach Wilcoxon
vergleichen, wie sich die Merkmalsausprägung eines
ordinalskalierten Merkmals zwischen zwei abhängigen
Stichproben unterscheiden.
• Anmerkung: Der Vorzeichenrangtest nach Wilcoxon hat die
höhere Power und ist daher generell zu bevorzugen.
• Beispiel: Es wird überprüft, ob sich die Arbeitsfähigkeit im Laufe
einer Reha-Maßnahme verbessert hat. Dabei wird die
Arbeitsfähigkeit als 5-stufiges Rating vor und nach der
Maßnahme erfasst.
• Berechnung: Siehe Leonhart (2004), Seite 172ff
11_nonpara
32
Friedman-Test
Der Friedman-Test
• Der Friedman-Test vergleicht die Merkmalsausprägung eines
ordinalskalierten Merkmals zwischen mehr als zwei abhängigen
Stichproben.
• Beispiel: Es wird überprüft, ob sich die Arbeitsfähigkeit im Laufe
einer Reha-Maßnahme verbessert hat. Dabei wird die
Arbeitsfähigkeit als 5-Stufiges Rating zu 3 Messzeitpunkten
erfasst (prä-, post-, follow-up - Erhebung).
• Berechnung: Siehe Leonhart (2004), Seite 177f
11_nonpara
33
Zusammenfassung
• Nonparametrische Testverfahren können eingesetzt werden, wenn
a) die vorliegenden Daten kein Intervallskalenniveau aufweisen oder
b) die Normalverteilungsannahme der parametrischen Tests verletzt ist.
• Der χ²-Test überprüft ob beobachtete und erwartete Häufigkeiten
signifikant voneinander abweichen.
• Der Kolmogorov-Smirnov-Test prüft, ob eine empirische
Verteilung mit einer theoretisch vorgegebenen Verteilungsform
(Normalverteilung) übereinstimmt.
• Der U-Test vergleicht die mittleren Rangplätze zwischen 2
Gruppen.
• Weitere Testverfahren können je nach Skalenniveau, Abhängigkeit
der Stichprobe und Anzahl der Gruppen ausgewählt werden
11_nonpara
34