Ikke parametriske te..

Download Report

Transcript Ikke parametriske te..

Ikke-parametriske tests
Dagens menu
t – testen… Hvordan var det nu lige det var?
Wilcoxson
Mann – Whitney U
Kruskall Wallis
Friedman
Kendalls og Spearmans correlation
2
t-testen
Patient
1,00
2,00
3,00
4,00
5,00
6,00
7,00
8,00
9,00
10,00
Drug
19,00
11,00
14,00
17,00
23,00
11,00
15,00
19,00
11,00
8,00
Placebo
22,00
18,00
17,00
19,00
22,00
12,00
14,00
11,00
19,00
7,00
difference
-3,00
-7,00
-3,00
-2,00
1,00
-1,00
1,00
8,00
-8,00
1,00
3
t-testen
Men er data normal fordelte? Vi spørger SPSS! – Table 4-1 Armitage
4
t-testen. Er data normalfordelte?
Tests of Normality
Kolmogorov-Smirnova
Statistic
df
Shapiro-Wilk
Sig.
Statistic
df
Sig.
drug
,191
10
,200*
,954
10
,715
placebo
,172
10
,200*
,936
10
,509
a. Lilliefors Significance Correction
*. This is a lower bound of the true significance.
5
t-testens begrænsninger
•
•
•
Hvis vi tvivler på normalfordeling
Hvis vores outcome (dependent variable) er ordinal (ordnet kategorisk)
fx ’--’, ’-’, ’0’, ’+’, ’++’
Hvis vi kan nøjes med en simpel metode
6
The sign test
•
•
•
Den non-parametriske version af one-sample t-test
H0 for One-sample t-test: Middelværdien er 0
H0 for sign testen: Fordelingen er symmetrisk omkring 0
7
The sign test
•
•
•
Er der lige mange plusser og
minusser?
Der er 4 plusser og 6 minusser.
Binomial fordelingen fortæller om
sandsynligheden for at få 4 plusser
ud af 10 mulige.
𝑛!
1 𝑟 1 𝑛−𝑟
𝑟! 𝑛−𝑟 ! 2
2
10! 1 4 1 6
•
𝑝 𝑟, 𝑛 =
•
𝑝 4,10 = 4!
•
6 ! 2
2
= 0.21
p = 𝑝 4,10 + 𝑝 3,10 +
𝑝 2,10 + 𝑝 1,10 + 𝑝 0,10 =
0.21 + 0.12 + 0.04 + 0.01 +
0.001 = 0.38 (One sided!)
Patient
1,00
2,00
3,00
4,00
5,00
6,00
7,00
8,00
9,00
10,00
Drug
19,00
11,00
14,00
17,00
23,00
11,00
15,00
19,00
11,00
8,00
Placebo
22,00
18,00
17,00
19,00
22,00
12,00
14,00
11,00
19,00
7,00
difference
-3,00
-7,00
-3,00
-2,00
1,00
-1,00
1,00
8,00
-8,00
1,00
Sign
+
+
+
+
8
The sign test in SPSS
9
The sign test in SPSS – the fancy dialog
10
The sign test
Binomial Test
Observed
Category
difference
Test Prop.
Group 1
<= 0
6
,60
Group 2
>0
4
,40
10
1,00
Total
•
Prop.
N
Exact Sig. (2-
,50
tailed)
,754
Det er altså ikke særligt usandsynligt at observere 4 eller mindre minusser ud
af 10 mulige
11
Men fortegnet beskriver jo ikke hele forskellen…
•
•
Hvis fx de negative værdier er
større end de positive
Wilcoxon’s signed rank sum test
Tager højde for det
Patient
1,00
2,00
3,00
4,00
5,00
6,00
7,00
8,00
9,00
10,00
Drug
19,00
11,00
14,00
17,00
23,00
11,00
15,00
19,00
11,00
8,00
Placebo
22,00
18,00
17,00
19,00
22,00
12,00
14,00
11,00
19,00
7,00
difference
-3,00
-7,00
-3,00
-2,00
1,00
-1,00
1,00
8,00
-8,00
1,00
12
Wilcoxon’s signed rank sum test
•
•
•
Opstil tallene efter størrelse uden at tage hensyn til fortegnet, men
noter det blot
Hvis flere tal har samme rank, bruges den gennemsnitlige rank
Plussernes hhv. minussernes rank summeres
1
Rank
Numerical value
sign
•
•
2
3
4
2.5
1
+
1
-
1
+
T+ = 2,5+2,5+2,5+9,5 = 17
T- = 2,5+5+6,5+6,5+8+9,5 = 38
1
+
5
5
2
-
6
7
6.5
3
-
3
-
8
8
7
-
9
10
9.5
8
+
8
-
difference
-3,00
-7,00
-3,00
-2,00
1,00
-1,00
1,00
8,00
-8,00
1,00
13
Wilcoxon’s signed rank sum test
Der slås op i tabel for at se om ranken af den mindste er lille.
14
Wilcoxon’s signed rank sum test
15
Wilcoxon’s signed rank sum test –the fancy version
16
Wilcoxon’s signed rank sum test
Test Statisticsb
Ranks
N
placebo - drug
Mean Rank
Sum of Ranks
placebo - drug
Negative Ranks
4a
4,25
17,00
Z
Positive Ranks
6b
6,33
38,00
Asymp. Sig. (2-tailed)
Ties
0c
a. Based on negative ranks.
Total
10
b. Wilcoxon Signed Ranks Test
-1,079a
,281
a. placebo < drug
b. placebo > drug
c. placebo = drug
17
Pause Opgave
• Use Wilcoxon’s signed rank sum test to test if there is a statistical
difference between the number of attacks in the placebo and the
Pronethaol groups
Patient number
1
2
3
4
5
6
7
8
9
10
11
12
# attack on
placebo
71
323
8
14
23
34
79
60
2
3
17
7
Pronethaol
29
348
1
7
16
25
65
41
0
0
15
2
18
Sammenligning mellem to uafhængige grupper
Mann Whitney U test
Eller Wilcoxon’s rank sum test
Eller Kendall’s S test
t-testen for ikke-parametrisk data
19
Mann Whitney U (Wilcoxon’s metode) test
H0: Fordelingerne som de to grupper stammer fra er identiske
Sådan gør man: ovnen tændes på 200C
1. Opstil tallene fra begge grupper i rækkefølge (Ranking)
2. Beregn summen af rank’ene for hver gruppe
3. Tæl antallet af tal i hver gruppe
4. Se om den mindste rank sum er mindre end den der er opgivet i tabel A8
20
Mann Whitney U test (Wilcoxon’s metode) - I hånden
High
Protein
134,00
146,00
104,00
119,00
124,00
161,00
107,00
83,00
113,00
129,00
97,00
123,00
Low
Protein
70,00
118,00
101,00
85,00
107,00
132,00
94,00
21
Mann Whitney U test (Wilcoxon’s metode) - I hånden
22
Mann Whitney U test (Wilcoxon’s metode) - I SPSS
Tabel 4-2 Armitage
Bemærk opsætningen af data!
23
Mann Whitney U test (Wilcoxon’s metode) - I SPSS
Bemærk at man skal definere
gruppe inddelingen!
24
Mann Whitney U test - I SPSS
25
Mann Whitney U test - I SPSS
Ranks
group
Weight
N
Mean Rank
Sum of Ranks
low
7
7,07
49,50
high
12
11,71
140,50
Total
19
Test Statisticsb
Weight
Mann-Whitney U
21,500
Wilcoxon W
49,500
Z
-1,733
Asymp. Sig. (2-tailed)
Exact Sig. [2*(1-tailed Sig.)]
,083
,083a
a. Not corrected for ties.
b. Grouping Variable: group
26
Sammenligning af flere usammenhængende grupper
Kruskal-Wallis test
H0: Fordelingerne som gruppere stammer fra er identiske
En-vejs ANOVA for parametrisk data
28
Kruskal-Wallis test
Et par definitioner:
k er antallet af grupper
ni antallet af observationer i den i’te gruppe
N er det samlede antal observationer
Ri summen af ranks i den i’te gruppe
Sådan gør man:
Rank alle observationer
Beregn rank summen for hver gruppe
Beregn H (Det der i bogen kaldes T)
Dette H er en chi-kvadrat fordeling med k-1 frihedsgræder
Slå p-værdien op i en tabel
H 
12 
Ti
2
ni
N  N  1
 3  N  1
29
Kruskal-Wallis test – Et eksampel fra Armitage
30
Kruskal-Wallis test – Et eksampel
De rå data rankes
31
Kruskal-Wallis test – Et eksampel
De rå data rankes
H beregnes
H 
H 

12 
Ti
2
ni
N  N  1
42
12
12  2422
20  21
2
 3  N  1
 53  36  79
2
2
20  20  1 
2

5  3  20  1 
 3  21  69 , 2  63  6 , 2
32
Kruskal-Wallis test – Et eksampel
De rå data rankes
H = 6,2
Antallet af frihedsgrader = k-1 = 3
33
Kruskal-Wallis test – i SPSS
34
Kruskal-Wallis test – i SPSS
35
Kruskal-Wallis test – i SPSS
36
Kruskal-Wallis test – i SPSS
Ranks
group
count
N
Mean Rank
1,00
5
8,40
2,00
5
10,60
3,00
5
7,20
4,00
5
15,80
Total
20
Test Statisticsa,b
count
Chi-Square
df
Asymp. Sig.
6,205
3
,102
a. Kruskal Wallis Test
b. Grouping Variable:
group
37
Sammenligning af flere sammenhængende grupper
Friedman’s test
Repeated ANOVA for parametrisk data
38
Friedman’s test Table 8.3 from Armitage
39
Friedman’s test
Ranks
Mean Rank
T1
1,38
T2
2,00
T3
2,94
T4
3,69
Test Statisticsa
N
Chi-Square
df
Asymp. Sig.
8
15,152
3
,002
a. Friedman Test
40
Friedman’s test
41
Pause opgave?
•
Er der forskel på grisebassernes vægt i de forskellige
fodergrupper?
42
Ranked Correlation
Kendall’s 
Spearman’s rs
Korrelation koefficienten er mellem -1 og 1.
Hvor -1 er perfekt omvendt korrelation, 0 betyder ingen korrelation, og 1 betyder
perfekt korrelation.
Pearson is the correlation method for normal data
Remember the assumptions:
1. Dependent variable must be metric continuous
2. Independent must be continuous or ordinal
3. Linear relationship between dependent and all independent variables
4. Residuals must have a constant spread.
5. Residuals are normal distributed
43
Kendall’s  - Et eksempel
44
Kendall’s  - Et eksempel
 
S
1
2
n n  1
S  PQ
45
Spearman – det samme eksempel
d2
rs  1 
6 d
2
n n
3
1
 1
4
9
6  52
10  10
3
1
1
1
9
9
1
16
 0.6848
46
Korrelation i SPSS
47
Korrelation i SPSS
Correlations
Correlations
a
a
Pearson
b
1
,685*
Kendall's tau_b
a
Sig. (2-tailed)
b
Pearson
Sig. (2-tailed)
,029
10
10
N
1,000
,511*
,685*
1
.
N
b
Correlation
,040
10
10
,511*
1,000
Coefficient
Correlation
Sig. (2-tailed)
b
Coefficient
Correlation
N
Correlation
a
Sig. (2-tailed)
,029
10
*. Correlation is significant at the 0.05 level (2-tailed).
,040 .
N
10
Spearman's rho
a
Correlation
10
10
1,000
,685*
Coefficient
Sig. (2-tailed)
N
b
Correlation
.
,029
10
10
,685*
1,000
Coefficient
Sig. (2-tailed)
N
,029 .
10
10
*. Correlation is significant at the 0.05 level (2-tailed).
48