Transcript nemparam3

2-próbák
Illeszkedésvizsgálat
Homogenitás-vizsgálat
Függetlenségvizsgálat
Nemparaméteres próbák
84
2-próba az eloszlás (illeszkedés) vizsgálatára
Illeszkedésvizsgálat Poisson-eloszlásra
29. példa
(G.E.P. Box, W.G. Hunter, J.S. Hunter: Statistics for experimenters, J. Wiley,
1978, p. 143)
Müzligyár ellenőrzi a mazsolák számát. Az előírás az, hogy egy
mintavevő kanálnyi müzliben 36 szem mazsolának kell lennie.
12 mintát vettek, az ezekben talált mazsola-szemek száma:
43, 46, 50, 40, 38, 29, 31, 35, 41, 52, 48, 37.
Teljesül-e az előírás?
Nemparaméteres próbák
85
Az adagonkénti mazsolák számának előfordulási valószínűsége
Poisson-eloszlással írható le:
E k   
H0 :   0  36
Vark   
e   k
p(k ) 
k!
H1 :   36
Az adatok adott paraméterű Poisson-eloszlást
követnek (ún. tiszta illeszkedésvizsgálat)
Nemparaméteres próbák
86
A Poisson-eloszlás közelíthető normális eloszlással, ha a 
paraméter elég nagy:
0
.4


p(x)
0
.3
=
1
0
=
1
0
.2
0
.1
0
.0
0
2
4
6
8
1
0
1
2
1
4
1
6
1
8
2
0
x
Nemparaméteres próbák
87
u
k 

2
u


i
2
i
az egy adagban található mazsola-szemek számára
a több mintára, ha az adagonként található
mazsola-szemek száma független egymástól
A próbastatisztika:
 
2
0
i
ki  0
0
(43  36) 2 (46  36) 2
(37  36) 2
 

 ..... 
 24.06
36
36
36
2
0
=12, p=0.02
Nemparaméteres próbák
88
• nem 36 szem mazsola jut egy kanálra
• nem Poisson-eloszlást követnek a mazsolák
1. A Poisson-eloszlás  paramétere nem 36
A Poisson-eloszlás additív tulajdonságú
k
i

~Poisson,
paraméterrel
i
i
i
k
i
 490
i

i
 12  36  432
i
H1 :   432
H0 :   0  432
2
(
490

432
)
 02 
 7.79
432
=1, p=0.0053
Nemparaméteres próbák
89
Az egy mintavevő kanálra jutó mazsola-szám nem 36.
43  46  50  40  38  29  31  35  41  52  48  37  490
490
ˆ

 40.83
12
Nemparaméteres próbák
90
2. A mazsola-szemek eloszlása nem =40.83 Poisson (overdispersion)
ún. becsléses illeszkedésvizsgálat
(43  40.83) 2
(37  40.83) 2
 
 ....... 
 14.34
40.83
40.83
2
0
  12 1  11
(az eloszlás paraméterét is az adatokból becsültük)
p=0.215
Az egy mintavevő kanálra jutó mazsola-szám ugyan Poissoneloszlás szerint ingadozik (az egyes kanalakban a mazsola-szám
független), de nem 36 szem mazsola jut átlagosan egy mintavevő
kanálra.
Nemparaméteres próbák
91
Illeszkedésvizsgálat multinomiális eloszlásra
Binomiális eloszlás: kétféle kimenetel
n k
n!
nk
Pk     (1   ) 
 k (1   ) n k
k!n  k !
k 
Multinomiális eloszlás: többféle (c féle) kimenetel
n!
Pn1 , n2 ,..., nc  
 1n1  2n2 ... cnc
n1!n2 !...nc
Nemparaméteres próbák
92
c
 
2
ni  n i 
2
  c 1
n i
i
a szumma tagjai között egy összefüggés van:
n   ni
i
 
2
0
i
Oi  Ei 
Ei
2
Observed
Expected
Nemparaméteres próbák
93
30. példa
A. C. Wardlaw: Practical statistics for experimental biologists,
J. Wiley & Sons, 1985 p. 112
129 olyan gyermek vércsoportját vizsgálták, akinek mindkét
szülője AB vércsoportba tartozott.
28 gyermeknek volt A (AA), 36-nak B (BB) és 65-nek AB a
vércsoportja.
A Mendel-féle öröklődési szabályok szerint az esetek ¼-ében
kell A, ¼-ében B, ½-ében pedig AB előfordulásnak lennie.
Ellentmondanak az eredmények a Mendel-szabálynak?
genotípus
fenotípus
AA
A
A0
A
AB
AB
BB
B
Nemparaméteres próbák
B0
B
00
0
94
H 0 :  AA
1
1
2
 ;  BB  ;  AB 
4
4
4
tiszta illeszkedésvizsgálat
c
Talált (O)
A
28
B
36
AB
65

129
2
2  
Feltételezett (E)
129
 32.25
4
129
 32.25
4
129
 64.5
2
129
2
i
 02  
i
ni  n i 2
n i
Oi  Ei 2
Ei
=3-1=2, kétoldali
2
129 
129 
129 



28

36

65







4
4
2
 
 
 1
 02  
129
129
129
4
4
2
Nemparaméteres próbák
95
Kontingencia-táblázatok elemzése: homogenitásvizsgálat (2x2 táblázat, a sorösszegek rögzítettek)
48. példa
(a 45. példa másképpen)
(M.J. Campbell, D. Manchin, Medical Statistics. A commonsense
approach, 2nd edition, J. Wiley & Sons, 1993, p. 71)
A páciensek kétféle gyógyszert kaptak, kisorsolva, hogy ki
melyiket. Kettős vak vizsgálatot végeztek: az orvos és a
páciens sem tudja, hogy ki melyik gyógyszert kapja.
Van-e a két gyógyszer között különbség a tekintetben, hogy
egyforma arányban gyógyultak-e tőlük a betegek?
Nemparaméteres próbák
96
Gyógyszer
típusa
A
B

Gyógyult
23
18
41
Nem
gyógyult
7
13
20

H0 : 1   2
30
31
61
H1 :  1   2
1 annak valószínűsége, hogy a beteg az A gyógyszertől
meggyógyul
2 annak valószínűsége, hogy a beteg a B gyógyszertől
meggyógyul
Az A és B gyógyszernél a gyógyulás relatív gyakorisága különkülön binomiális eloszlást követ 1 és 1 paraméterrel
Nemparaméteres próbák
97
Gyógyszer
típusa
A
B

u0 
Gyógyult
23
18
41
Nem
gyógyult
7
13
20
ˆ1  ˆ 2
1
1 
ˆ (1  ˆ )  
 n1 n2 
u 2   2 1
a
c
c1

30
31
61
b
d
c2
2x2 táblázat,
két binomiális eloszlás
(score)
 02  u02 
Nemparaméteres próbák
ˆ1  ˆ 2 2
1 1
ˆ (1  ˆ )  
 n1 n2 
98
r1
r2
N
 02  u 02 
ˆ1  ˆ 2 2
  
i
j
b
d
c2
1
1
ˆ (1  ˆ )  
 n1 n2 
2-próba
2
0
a
c
c1
2


ad

bc
 02  N
a  bc  d a  c b  d 
O
ij
 Eij
Eij

2
H0 :  1   2  
=1
O: Observed, E: Expected
Nemparaméteres próbák
99
r1
r2
N
 02  z02 
ˆ1  ˆ 2 2
  
i
j
b
d
c2
1 1
ˆ (1  ˆ )  
 n1 n2 
2-próba
2
0
a
c
c1
2


ad

bc
 02  N
a  bc  d a  c b  d 
O
ij
 Eij
Eij

2
H0 :  1   2  
=1
O: Observed, E: Expected
Nemparaméteres próbák
100
r1
r2
N
  
2
0
i
ˆ 
O
ij
 Eij
Gyógyszer
típusa
A
B


2
Eij
j
a
c
c1

Nem
gyógyult
b
d
c2
r1
r2
N
ac
ac

N
abcd
bd
E2  r2 1  ˆ   a  b 
N
ac
ˆ
E1  r1  a  b 
N
2 
Gyógyult
 a  r1 
r1
2

 b  r1 (1   ) 
r1 (1   )
2

 c  r2 
r2
Nemparaméteres próbák
2

 d  r2 (1   ) 
r2 (1   )
101
2
Statistics>Nonparametrics
Gyógyszer
típusa
A
B

Gyógyult
23
18
41
Nem
gyógyult
7
13
20

30
31
61
Nemparaméteres próbák
102
Frequencies, row 1
Percent of total
Frequencies, row 2
Percent of total
Column totals
Percent of total
Chi-square (df=1)
V-square (df=1)
Yates corrected Chi-square
Phi-square
Fisher exact p, one-tailed
two-tailed
McNemar Chi-square (A/D)
Chi-square (B/C)
Gyógyszer
típusa
A
B

2 x 2 Table (creditscoring)
Column 1 Column 2
Row
Totals
23
7
30
37.705% 11.475% 49.180%
18
13
31
29.508% 21.311% 50.820%
41
20
61
67.213% 32.787%
2.39 p= .1218
2.35 p= .1249
1.62 p= .2025
.03925
p= .1009
p= .1737
2.25 p= .1336
4.00 p= .0455
Gyógyult
23
18
41
Nem
gyógyult
7
13
20

30
31
61
2


ad

bc
 02  N
a  bc  d a  c b  d 
2
N

 ad  bc  
2

 02  N
a  b c  d a  c b  d 
(folytonossági korrekcióval)
Nemparaméteres próbák
103
2x2 táblázat, összefüggő minták: függetlenségvizsgálat
44. példa
(hipotetikus)
Egy szociológiai vizsgálatnál 50 véletlenül kiválasztott embert
megkérdeztek a házastársi hűséghez való viszonyáról.
Független-e a két kérdésre adott válasz?
fontosnak tartja-e a
hűséget a házasságban
i
h
ű
s
é
g
e
s
-
e
i
n
g
e
e
n
m
1
g
e
n
8
6
2
4
n
e
2
m
2
0
2
4
3
0
2
6
5
0
H0: független
Nemparaméteres próbák
104
2 x 2 Table (Fiuc ipo)
C olumn 1 C olumn 2
Frequenc ies, row 1
Perc ent of t ot al
Frequenc ies, row 2
Perc ent of t ot al
C olumn t ot als
Perc ent of t ot al
C hi-square (df =1)
V-square (df =1)
Y at es c orrec ted C hi-square
Phi-s quare
Fis her ex act p, one-t ailed
t wo-tailed
McN emar C hi-square (A/ D )
C hi-square (B/ C)
18
36. 000%
6
12. 000%
24
48. 000%
23. 56
23. 09
20. 84
. 47115
. 60
1.13
2
4.000%
24
48. 000%
26
52. 000%
p= .0000
p= .0000
p= .0000
p=
p=
p=
p=
R ow
Tot als
20
40. 000%
30
60. 000%
50
a
c
c1
b
d
c2
r1
r2
N
.0000
.0000
.4404
.2889
döntés?
Nemparaméteres próbák
105
2x2 táblázat, összefüggő minták: McNemar-próba
22. példa
(hipotetikus)
Egy szociológiai vizsgálatnál 50 véletlenül kiválasztott
embert megkérdeztek a házastársi hűséghez való
viszonyáról. Szimmetrikus-e a konzisztens viselkedéstől
való eltérés valószínűsége a két irányban?
fontosnak tartja-e a
hűséget a házasságban
i
h
ű
s
é
g
e
s
-
e
i
n
g
e
e
n
m
1
g
e
n
8
6
2
4
n
e
2
m
2
0
2
4
3
0
2
6
5
0
H0: összefüggenek
(annak valószínűsége, hogy valaki hűtlen, de fontosnak tartja a
hűséget, ugyanakkora, mint hogy hűséges, de nem tartja fontosnak)
Nemparaméteres próbák
106
n  b  c a diszkordáns egyedek száma, b<c
a
c
c1
b
d
c2
n<20, kismintás
n
p  Pk  b       0.5n
k 0  k 
b  n  0.5
n20, nagymintás
z0 
n  0.52
b
bc
z0 
bc
n bc
2


b

c
2 
bc
0
A folytonossági korrekcióval:
z0 
b  c 1
bc

b  c  1

2

2
0
bc
Nemparaméteres próbák
107
r1
r2
N
a
c
c1
n<20, kismintás, b<c
n
p  Pk  b       0.5n
k 0  k 
b
18
6
24
2
24
26
b
d
c2
r1
r2
N
Minitab>Calc>Probability distributions>
>Binomial
20
30
N
Döntés?
Nemparaméteres próbák
108
32. példa
G.A.Walker: Common statistical methods for clinical research with SAS
examples, Collins-Wellesley Publishing, San Diego, California, 1996
A páciensek kezelést kapnak.
Véletlenszerűen kiválasztottak 86 pácienst. Mindenkinek
megmérték a bilirubin-szintjét kezelés előtt és kezelés után is.
Kérdés: a kezelésnek van-e mellékhatása a vizelet bilirubinszintjére, vagyis hogy a kezeléstől megváltozik-e a bilirubin-szint.
Kezelés előtt
n
m

o
r
a
m
g
á
a
s
l i s
Kezelés után
normális magas

6
7
4
2
0
1
4
6
6
1
66
20
86
Nemparaméteres próbák
109
2 x 2 Table
Column 1 Column 2
Frequencies, row 1
Percent of total
Frequencies, row 2
Percent of total
Column totals
Percent of total
Chi-square (df=1)
V-square (df=1)
Yates corrected Chi-square
Phi-square
Fisher exact p, one-tailed
two-tailed
McNemar Chi-square (A/D)
Chi-square (B/C)
60
69.767%
6
6.977%
66
76.744%
5.59
5.52
3.98
.06499
42.56
2.45
 b  c  1
2
 02 
bc
14
16.279%
6
6.977%
20
23.256%
p= .0181
p= .0188
p= .0460
p=
p=
p=
p=
Row
Totals
74
86.047%
12
13.953%
86
.0282
.0282
.0000
.1175
2

14  6  1

14  6
 2.45
2


b

c
2 
0
Nemparaméteres próbák
bc
2

14  6

14  6
110
 3.197
a
c
c1
Fisher egzakt próbája, a sor- és
oszlop-összegek is adottak
b
d
c2
51. példa
A. Agresti: Categorical data analysis, J. Wiley, 2002, p. 444
Fisher tea-példája: először a tejet, utána a teát?
tényleges
sorrend
tej előbb
vélt sorrend
tej előbb
tea előbb
3
1
4
tea előbb
1
3
4
4
4
8
Nemparaméteres próbák
111
r1
r2
N
tényleges
sorrend
tej előbb
vélt sorrend
tej előbb
tea előbb
3
1
4
tea előbb
1
3
4
4
4
8
 4  4
    
3  1 

P3 
 0.229
8 
 
 4
hipergeometrikus eloszlás
p annak valószínűsége, hogy a talált vagy annál
szélsőségesebb eredmény álljon elő
Nemparaméteres próbák
112
 4  4
    
4 0

P4 
 0.0143
8 
 
 4
p  0.2423
A kis minta-elemszám miatt nagyok az ugrások, p<0.05 csak
akkor lenne, ha mind a 4-et jól eltalálnák.
Nemparaméteres próbák
113


4
1
5
5
1
6
1
4
5
1
5
6

5
5
10

6
6
12
p=0.1072
p=0.0411
Nemparaméteres próbák
114
A 2- próbához szükséges előfordulási számok
Cochran: egyik Eij sem lehet kisebb 1-nél, és a cellák
legföljebb 20%-ában lehet kisebb 5-nél
Conover: ha néhány Eij érték 0.5 körül van, de a többség
nagyobb 1-nél, az eljárás alkalmazható.
Ha túlságosan kicsinyek a várható előfordulási számok, a
cellákat összevonhatjuk.
Nemparaméteres próbák
115