Transcript nemparam3
2-próbák
Illeszkedésvizsgálat
Homogenitás-vizsgálat
Függetlenségvizsgálat
Nemparaméteres próbák
84
2-próba az eloszlás (illeszkedés) vizsgálatára
Illeszkedésvizsgálat Poisson-eloszlásra
29. példa
(G.E.P. Box, W.G. Hunter, J.S. Hunter: Statistics for experimenters, J. Wiley,
1978, p. 143)
Müzligyár ellenőrzi a mazsolák számát. Az előírás az, hogy egy
mintavevő kanálnyi müzliben 36 szem mazsolának kell lennie.
12 mintát vettek, az ezekben talált mazsola-szemek száma:
43, 46, 50, 40, 38, 29, 31, 35, 41, 52, 48, 37.
Teljesül-e az előírás?
Nemparaméteres próbák
85
Az adagonkénti mazsolák számának előfordulási valószínűsége
Poisson-eloszlással írható le:
E k
H0 : 0 36
Vark
e k
p(k )
k!
H1 : 36
Az adatok adott paraméterű Poisson-eloszlást
követnek (ún. tiszta illeszkedésvizsgálat)
Nemparaméteres próbák
86
A Poisson-eloszlás közelíthető normális eloszlással, ha a
paraméter elég nagy:
0
.4
p(x)
0
.3
=
1
0
=
1
0
.2
0
.1
0
.0
0
2
4
6
8
1
0
1
2
1
4
1
6
1
8
2
0
x
Nemparaméteres próbák
87
u
k
2
u
i
2
i
az egy adagban található mazsola-szemek számára
a több mintára, ha az adagonként található
mazsola-szemek száma független egymástól
A próbastatisztika:
2
0
i
ki 0
0
(43 36) 2 (46 36) 2
(37 36) 2
.....
24.06
36
36
36
2
0
=12, p=0.02
Nemparaméteres próbák
88
• nem 36 szem mazsola jut egy kanálra
• nem Poisson-eloszlást követnek a mazsolák
1. A Poisson-eloszlás paramétere nem 36
A Poisson-eloszlás additív tulajdonságú
k
i
~Poisson,
paraméterrel
i
i
i
k
i
490
i
i
12 36 432
i
H1 : 432
H0 : 0 432
2
(
490
432
)
02
7.79
432
=1, p=0.0053
Nemparaméteres próbák
89
Az egy mintavevő kanálra jutó mazsola-szám nem 36.
43 46 50 40 38 29 31 35 41 52 48 37 490
490
ˆ
40.83
12
Nemparaméteres próbák
90
2. A mazsola-szemek eloszlása nem =40.83 Poisson (overdispersion)
ún. becsléses illeszkedésvizsgálat
(43 40.83) 2
(37 40.83) 2
.......
14.34
40.83
40.83
2
0
12 1 11
(az eloszlás paraméterét is az adatokból becsültük)
p=0.215
Az egy mintavevő kanálra jutó mazsola-szám ugyan Poissoneloszlás szerint ingadozik (az egyes kanalakban a mazsola-szám
független), de nem 36 szem mazsola jut átlagosan egy mintavevő
kanálra.
Nemparaméteres próbák
91
Illeszkedésvizsgálat multinomiális eloszlásra
Binomiális eloszlás: kétféle kimenetel
n k
n!
nk
Pk (1 )
k (1 ) n k
k!n k !
k
Multinomiális eloszlás: többféle (c féle) kimenetel
n!
Pn1 , n2 ,..., nc
1n1 2n2 ... cnc
n1!n2 !...nc
Nemparaméteres próbák
92
c
2
ni n i
2
c 1
n i
i
a szumma tagjai között egy összefüggés van:
n ni
i
2
0
i
Oi Ei
Ei
2
Observed
Expected
Nemparaméteres próbák
93
30. példa
A. C. Wardlaw: Practical statistics for experimental biologists,
J. Wiley & Sons, 1985 p. 112
129 olyan gyermek vércsoportját vizsgálták, akinek mindkét
szülője AB vércsoportba tartozott.
28 gyermeknek volt A (AA), 36-nak B (BB) és 65-nek AB a
vércsoportja.
A Mendel-féle öröklődési szabályok szerint az esetek ¼-ében
kell A, ¼-ében B, ½-ében pedig AB előfordulásnak lennie.
Ellentmondanak az eredmények a Mendel-szabálynak?
genotípus
fenotípus
AA
A
A0
A
AB
AB
BB
B
Nemparaméteres próbák
B0
B
00
0
94
H 0 : AA
1
1
2
; BB ; AB
4
4
4
tiszta illeszkedésvizsgálat
c
Talált (O)
A
28
B
36
AB
65
129
2
2
Feltételezett (E)
129
32.25
4
129
32.25
4
129
64.5
2
129
2
i
02
i
ni n i 2
n i
Oi Ei 2
Ei
=3-1=2, kétoldali
2
129
129
129
28
36
65
4
4
2
1
02
129
129
129
4
4
2
Nemparaméteres próbák
95
Kontingencia-táblázatok elemzése: homogenitásvizsgálat (2x2 táblázat, a sorösszegek rögzítettek)
48. példa
(a 45. példa másképpen)
(M.J. Campbell, D. Manchin, Medical Statistics. A commonsense
approach, 2nd edition, J. Wiley & Sons, 1993, p. 71)
A páciensek kétféle gyógyszert kaptak, kisorsolva, hogy ki
melyiket. Kettős vak vizsgálatot végeztek: az orvos és a
páciens sem tudja, hogy ki melyik gyógyszert kapja.
Van-e a két gyógyszer között különbség a tekintetben, hogy
egyforma arányban gyógyultak-e tőlük a betegek?
Nemparaméteres próbák
96
Gyógyszer
típusa
A
B
Gyógyult
23
18
41
Nem
gyógyult
7
13
20
H0 : 1 2
30
31
61
H1 : 1 2
1 annak valószínűsége, hogy a beteg az A gyógyszertől
meggyógyul
2 annak valószínűsége, hogy a beteg a B gyógyszertől
meggyógyul
Az A és B gyógyszernél a gyógyulás relatív gyakorisága különkülön binomiális eloszlást követ 1 és 1 paraméterrel
Nemparaméteres próbák
97
Gyógyszer
típusa
A
B
u0
Gyógyult
23
18
41
Nem
gyógyult
7
13
20
ˆ1 ˆ 2
1
1
ˆ (1 ˆ )
n1 n2
u 2 2 1
a
c
c1
30
31
61
b
d
c2
2x2 táblázat,
két binomiális eloszlás
(score)
02 u02
Nemparaméteres próbák
ˆ1 ˆ 2 2
1 1
ˆ (1 ˆ )
n1 n2
98
r1
r2
N
02 u 02
ˆ1 ˆ 2 2
i
j
b
d
c2
1
1
ˆ (1 ˆ )
n1 n2
2-próba
2
0
a
c
c1
2
ad
bc
02 N
a bc d a c b d
O
ij
Eij
Eij
2
H0 : 1 2
=1
O: Observed, E: Expected
Nemparaméteres próbák
99
r1
r2
N
02 z02
ˆ1 ˆ 2 2
i
j
b
d
c2
1 1
ˆ (1 ˆ )
n1 n2
2-próba
2
0
a
c
c1
2
ad
bc
02 N
a bc d a c b d
O
ij
Eij
Eij
2
H0 : 1 2
=1
O: Observed, E: Expected
Nemparaméteres próbák
100
r1
r2
N
2
0
i
ˆ
O
ij
Eij
Gyógyszer
típusa
A
B
2
Eij
j
a
c
c1
Nem
gyógyult
b
d
c2
r1
r2
N
ac
ac
N
abcd
bd
E2 r2 1 ˆ a b
N
ac
ˆ
E1 r1 a b
N
2
Gyógyult
a r1
r1
2
b r1 (1 )
r1 (1 )
2
c r2
r2
Nemparaméteres próbák
2
d r2 (1 )
r2 (1 )
101
2
Statistics>Nonparametrics
Gyógyszer
típusa
A
B
Gyógyult
23
18
41
Nem
gyógyult
7
13
20
30
31
61
Nemparaméteres próbák
102
Frequencies, row 1
Percent of total
Frequencies, row 2
Percent of total
Column totals
Percent of total
Chi-square (df=1)
V-square (df=1)
Yates corrected Chi-square
Phi-square
Fisher exact p, one-tailed
two-tailed
McNemar Chi-square (A/D)
Chi-square (B/C)
Gyógyszer
típusa
A
B
2 x 2 Table (creditscoring)
Column 1 Column 2
Row
Totals
23
7
30
37.705% 11.475% 49.180%
18
13
31
29.508% 21.311% 50.820%
41
20
61
67.213% 32.787%
2.39 p= .1218
2.35 p= .1249
1.62 p= .2025
.03925
p= .1009
p= .1737
2.25 p= .1336
4.00 p= .0455
Gyógyult
23
18
41
Nem
gyógyult
7
13
20
30
31
61
2
ad
bc
02 N
a bc d a c b d
2
N
ad bc
2
02 N
a b c d a c b d
(folytonossági korrekcióval)
Nemparaméteres próbák
103
2x2 táblázat, összefüggő minták: függetlenségvizsgálat
44. példa
(hipotetikus)
Egy szociológiai vizsgálatnál 50 véletlenül kiválasztott embert
megkérdeztek a házastársi hűséghez való viszonyáról.
Független-e a két kérdésre adott válasz?
fontosnak tartja-e a
hűséget a házasságban
i
h
ű
s
é
g
e
s
-
e
i
n
g
e
e
n
m
1
g
e
n
8
6
2
4
n
e
2
m
2
0
2
4
3
0
2
6
5
0
H0: független
Nemparaméteres próbák
104
2 x 2 Table (Fiuc ipo)
C olumn 1 C olumn 2
Frequenc ies, row 1
Perc ent of t ot al
Frequenc ies, row 2
Perc ent of t ot al
C olumn t ot als
Perc ent of t ot al
C hi-square (df =1)
V-square (df =1)
Y at es c orrec ted C hi-square
Phi-s quare
Fis her ex act p, one-t ailed
t wo-tailed
McN emar C hi-square (A/ D )
C hi-square (B/ C)
18
36. 000%
6
12. 000%
24
48. 000%
23. 56
23. 09
20. 84
. 47115
. 60
1.13
2
4.000%
24
48. 000%
26
52. 000%
p= .0000
p= .0000
p= .0000
p=
p=
p=
p=
R ow
Tot als
20
40. 000%
30
60. 000%
50
a
c
c1
b
d
c2
r1
r2
N
.0000
.0000
.4404
.2889
döntés?
Nemparaméteres próbák
105
2x2 táblázat, összefüggő minták: McNemar-próba
22. példa
(hipotetikus)
Egy szociológiai vizsgálatnál 50 véletlenül kiválasztott
embert megkérdeztek a házastársi hűséghez való
viszonyáról. Szimmetrikus-e a konzisztens viselkedéstől
való eltérés valószínűsége a két irányban?
fontosnak tartja-e a
hűséget a házasságban
i
h
ű
s
é
g
e
s
-
e
i
n
g
e
e
n
m
1
g
e
n
8
6
2
4
n
e
2
m
2
0
2
4
3
0
2
6
5
0
H0: összefüggenek
(annak valószínűsége, hogy valaki hűtlen, de fontosnak tartja a
hűséget, ugyanakkora, mint hogy hűséges, de nem tartja fontosnak)
Nemparaméteres próbák
106
n b c a diszkordáns egyedek száma, b<c
a
c
c1
b
d
c2
n<20, kismintás
n
p Pk b 0.5n
k 0 k
b n 0.5
n20, nagymintás
z0
n 0.52
b
bc
z0
bc
n bc
2
b
c
2
bc
0
A folytonossági korrekcióval:
z0
b c 1
bc
b c 1
2
2
0
bc
Nemparaméteres próbák
107
r1
r2
N
a
c
c1
n<20, kismintás, b<c
n
p Pk b 0.5n
k 0 k
b
18
6
24
2
24
26
b
d
c2
r1
r2
N
Minitab>Calc>Probability distributions>
>Binomial
20
30
N
Döntés?
Nemparaméteres próbák
108
32. példa
G.A.Walker: Common statistical methods for clinical research with SAS
examples, Collins-Wellesley Publishing, San Diego, California, 1996
A páciensek kezelést kapnak.
Véletlenszerűen kiválasztottak 86 pácienst. Mindenkinek
megmérték a bilirubin-szintjét kezelés előtt és kezelés után is.
Kérdés: a kezelésnek van-e mellékhatása a vizelet bilirubinszintjére, vagyis hogy a kezeléstől megváltozik-e a bilirubin-szint.
Kezelés előtt
n
m
o
r
a
m
g
á
a
s
l i s
Kezelés után
normális magas
6
7
4
2
0
1
4
6
6
1
66
20
86
Nemparaméteres próbák
109
2 x 2 Table
Column 1 Column 2
Frequencies, row 1
Percent of total
Frequencies, row 2
Percent of total
Column totals
Percent of total
Chi-square (df=1)
V-square (df=1)
Yates corrected Chi-square
Phi-square
Fisher exact p, one-tailed
two-tailed
McNemar Chi-square (A/D)
Chi-square (B/C)
60
69.767%
6
6.977%
66
76.744%
5.59
5.52
3.98
.06499
42.56
2.45
b c 1
2
02
bc
14
16.279%
6
6.977%
20
23.256%
p= .0181
p= .0188
p= .0460
p=
p=
p=
p=
Row
Totals
74
86.047%
12
13.953%
86
.0282
.0282
.0000
.1175
2
14 6 1
14 6
2.45
2
b
c
2
0
Nemparaméteres próbák
bc
2
14 6
14 6
110
3.197
a
c
c1
Fisher egzakt próbája, a sor- és
oszlop-összegek is adottak
b
d
c2
51. példa
A. Agresti: Categorical data analysis, J. Wiley, 2002, p. 444
Fisher tea-példája: először a tejet, utána a teát?
tényleges
sorrend
tej előbb
vélt sorrend
tej előbb
tea előbb
3
1
4
tea előbb
1
3
4
4
4
8
Nemparaméteres próbák
111
r1
r2
N
tényleges
sorrend
tej előbb
vélt sorrend
tej előbb
tea előbb
3
1
4
tea előbb
1
3
4
4
4
8
4 4
3 1
P3
0.229
8
4
hipergeometrikus eloszlás
p annak valószínűsége, hogy a talált vagy annál
szélsőségesebb eredmény álljon elő
Nemparaméteres próbák
112
4 4
4 0
P4
0.0143
8
4
p 0.2423
A kis minta-elemszám miatt nagyok az ugrások, p<0.05 csak
akkor lenne, ha mind a 4-et jól eltalálnák.
Nemparaméteres próbák
113
4
1
5
5
1
6
1
4
5
1
5
6
5
5
10
6
6
12
p=0.1072
p=0.0411
Nemparaméteres próbák
114
A 2- próbához szükséges előfordulási számok
Cochran: egyik Eij sem lehet kisebb 1-nél, és a cellák
legföljebb 20%-ában lehet kisebb 5-nél
Conover: ha néhány Eij érték 0.5 körül van, de a többség
nagyobb 1-nél, az eljárás alkalmazható.
Ha túlságosan kicsinyek a várható előfordulási számok, a
cellákat összevonhatjuk.
Nemparaméteres próbák
115