Transcript nemparam3
2-próbák Illeszkedésvizsgálat Homogenitás-vizsgálat Függetlenségvizsgálat Nemparaméteres próbák 84 2-próba az eloszlás (illeszkedés) vizsgálatára Illeszkedésvizsgálat Poisson-eloszlásra 29. példa (G.E.P. Box, W.G. Hunter, J.S. Hunter: Statistics for experimenters, J. Wiley, 1978, p. 143) Müzligyár ellenőrzi a mazsolák számát. Az előírás az, hogy egy mintavevő kanálnyi müzliben 36 szem mazsolának kell lennie. 12 mintát vettek, az ezekben talált mazsola-szemek száma: 43, 46, 50, 40, 38, 29, 31, 35, 41, 52, 48, 37. Teljesül-e az előírás? Nemparaméteres próbák 85 Az adagonkénti mazsolák számának előfordulási valószínűsége Poisson-eloszlással írható le: E k H0 : 0 36 Vark e k p(k ) k! H1 : 36 Az adatok adott paraméterű Poisson-eloszlást követnek (ún. tiszta illeszkedésvizsgálat) Nemparaméteres próbák 86 A Poisson-eloszlás közelíthető normális eloszlással, ha a paraméter elég nagy: 0 .4 p(x) 0 .3 = 1 0 = 1 0 .2 0 .1 0 .0 0 2 4 6 8 1 0 1 2 1 4 1 6 1 8 2 0 x Nemparaméteres próbák 87 u k 2 u i 2 i az egy adagban található mazsola-szemek számára a több mintára, ha az adagonként található mazsola-szemek száma független egymástól A próbastatisztika: 2 0 i ki 0 0 (43 36) 2 (46 36) 2 (37 36) 2 ..... 24.06 36 36 36 2 0 =12, p=0.02 Nemparaméteres próbák 88 • nem 36 szem mazsola jut egy kanálra • nem Poisson-eloszlást követnek a mazsolák 1. A Poisson-eloszlás paramétere nem 36 A Poisson-eloszlás additív tulajdonságú k i ~Poisson, paraméterrel i i i k i 490 i i 12 36 432 i H1 : 432 H0 : 0 432 2 ( 490 432 ) 02 7.79 432 =1, p=0.0053 Nemparaméteres próbák 89 Az egy mintavevő kanálra jutó mazsola-szám nem 36. 43 46 50 40 38 29 31 35 41 52 48 37 490 490 ˆ 40.83 12 Nemparaméteres próbák 90 2. A mazsola-szemek eloszlása nem =40.83 Poisson (overdispersion) ún. becsléses illeszkedésvizsgálat (43 40.83) 2 (37 40.83) 2 ....... 14.34 40.83 40.83 2 0 12 1 11 (az eloszlás paraméterét is az adatokból becsültük) p=0.215 Az egy mintavevő kanálra jutó mazsola-szám ugyan Poissoneloszlás szerint ingadozik (az egyes kanalakban a mazsola-szám független), de nem 36 szem mazsola jut átlagosan egy mintavevő kanálra. Nemparaméteres próbák 91 Illeszkedésvizsgálat multinomiális eloszlásra Binomiális eloszlás: kétféle kimenetel n k n! nk Pk (1 ) k (1 ) n k k!n k ! k Multinomiális eloszlás: többféle (c féle) kimenetel n! Pn1 , n2 ,..., nc 1n1 2n2 ... cnc n1!n2 !...nc Nemparaméteres próbák 92 c 2 ni n i 2 c 1 n i i a szumma tagjai között egy összefüggés van: n ni i 2 0 i Oi Ei Ei 2 Observed Expected Nemparaméteres próbák 93 30. példa A. C. Wardlaw: Practical statistics for experimental biologists, J. Wiley & Sons, 1985 p. 112 129 olyan gyermek vércsoportját vizsgálták, akinek mindkét szülője AB vércsoportba tartozott. 28 gyermeknek volt A (AA), 36-nak B (BB) és 65-nek AB a vércsoportja. A Mendel-féle öröklődési szabályok szerint az esetek ¼-ében kell A, ¼-ében B, ½-ében pedig AB előfordulásnak lennie. Ellentmondanak az eredmények a Mendel-szabálynak? genotípus fenotípus AA A A0 A AB AB BB B Nemparaméteres próbák B0 B 00 0 94 H 0 : AA 1 1 2 ; BB ; AB 4 4 4 tiszta illeszkedésvizsgálat c Talált (O) A 28 B 36 AB 65 129 2 2 Feltételezett (E) 129 32.25 4 129 32.25 4 129 64.5 2 129 2 i 02 i ni n i 2 n i Oi Ei 2 Ei =3-1=2, kétoldali 2 129 129 129 28 36 65 4 4 2 1 02 129 129 129 4 4 2 Nemparaméteres próbák 95 Kontingencia-táblázatok elemzése: homogenitásvizsgálat (2x2 táblázat, a sorösszegek rögzítettek) 48. példa (a 45. példa másképpen) (M.J. Campbell, D. Manchin, Medical Statistics. A commonsense approach, 2nd edition, J. Wiley & Sons, 1993, p. 71) A páciensek kétféle gyógyszert kaptak, kisorsolva, hogy ki melyiket. Kettős vak vizsgálatot végeztek: az orvos és a páciens sem tudja, hogy ki melyik gyógyszert kapja. Van-e a két gyógyszer között különbség a tekintetben, hogy egyforma arányban gyógyultak-e tőlük a betegek? Nemparaméteres próbák 96 Gyógyszer típusa A B Gyógyult 23 18 41 Nem gyógyult 7 13 20 H0 : 1 2 30 31 61 H1 : 1 2 1 annak valószínűsége, hogy a beteg az A gyógyszertől meggyógyul 2 annak valószínűsége, hogy a beteg a B gyógyszertől meggyógyul Az A és B gyógyszernél a gyógyulás relatív gyakorisága különkülön binomiális eloszlást követ 1 és 1 paraméterrel Nemparaméteres próbák 97 Gyógyszer típusa A B u0 Gyógyult 23 18 41 Nem gyógyult 7 13 20 ˆ1 ˆ 2 1 1 ˆ (1 ˆ ) n1 n2 u 2 2 1 a c c1 30 31 61 b d c2 2x2 táblázat, két binomiális eloszlás (score) 02 u02 Nemparaméteres próbák ˆ1 ˆ 2 2 1 1 ˆ (1 ˆ ) n1 n2 98 r1 r2 N 02 u 02 ˆ1 ˆ 2 2 i j b d c2 1 1 ˆ (1 ˆ ) n1 n2 2-próba 2 0 a c c1 2 ad bc 02 N a bc d a c b d O ij Eij Eij 2 H0 : 1 2 =1 O: Observed, E: Expected Nemparaméteres próbák 99 r1 r2 N 02 z02 ˆ1 ˆ 2 2 i j b d c2 1 1 ˆ (1 ˆ ) n1 n2 2-próba 2 0 a c c1 2 ad bc 02 N a bc d a c b d O ij Eij Eij 2 H0 : 1 2 =1 O: Observed, E: Expected Nemparaméteres próbák 100 r1 r2 N 2 0 i ˆ O ij Eij Gyógyszer típusa A B 2 Eij j a c c1 Nem gyógyult b d c2 r1 r2 N ac ac N abcd bd E2 r2 1 ˆ a b N ac ˆ E1 r1 a b N 2 Gyógyult a r1 r1 2 b r1 (1 ) r1 (1 ) 2 c r2 r2 Nemparaméteres próbák 2 d r2 (1 ) r2 (1 ) 101 2 Statistics>Nonparametrics Gyógyszer típusa A B Gyógyult 23 18 41 Nem gyógyult 7 13 20 30 31 61 Nemparaméteres próbák 102 Frequencies, row 1 Percent of total Frequencies, row 2 Percent of total Column totals Percent of total Chi-square (df=1) V-square (df=1) Yates corrected Chi-square Phi-square Fisher exact p, one-tailed two-tailed McNemar Chi-square (A/D) Chi-square (B/C) Gyógyszer típusa A B 2 x 2 Table (creditscoring) Column 1 Column 2 Row Totals 23 7 30 37.705% 11.475% 49.180% 18 13 31 29.508% 21.311% 50.820% 41 20 61 67.213% 32.787% 2.39 p= .1218 2.35 p= .1249 1.62 p= .2025 .03925 p= .1009 p= .1737 2.25 p= .1336 4.00 p= .0455 Gyógyult 23 18 41 Nem gyógyult 7 13 20 30 31 61 2 ad bc 02 N a bc d a c b d 2 N ad bc 2 02 N a b c d a c b d (folytonossági korrekcióval) Nemparaméteres próbák 103 2x2 táblázat, összefüggő minták: függetlenségvizsgálat 44. példa (hipotetikus) Egy szociológiai vizsgálatnál 50 véletlenül kiválasztott embert megkérdeztek a házastársi hűséghez való viszonyáról. Független-e a két kérdésre adott válasz? fontosnak tartja-e a hűséget a házasságban i h ű s é g e s - e i n g e e n m 1 g e n 8 6 2 4 n e 2 m 2 0 2 4 3 0 2 6 5 0 H0: független Nemparaméteres próbák 104 2 x 2 Table (Fiuc ipo) C olumn 1 C olumn 2 Frequenc ies, row 1 Perc ent of t ot al Frequenc ies, row 2 Perc ent of t ot al C olumn t ot als Perc ent of t ot al C hi-square (df =1) V-square (df =1) Y at es c orrec ted C hi-square Phi-s quare Fis her ex act p, one-t ailed t wo-tailed McN emar C hi-square (A/ D ) C hi-square (B/ C) 18 36. 000% 6 12. 000% 24 48. 000% 23. 56 23. 09 20. 84 . 47115 . 60 1.13 2 4.000% 24 48. 000% 26 52. 000% p= .0000 p= .0000 p= .0000 p= p= p= p= R ow Tot als 20 40. 000% 30 60. 000% 50 a c c1 b d c2 r1 r2 N .0000 .0000 .4404 .2889 döntés? Nemparaméteres próbák 105 2x2 táblázat, összefüggő minták: McNemar-próba 22. példa (hipotetikus) Egy szociológiai vizsgálatnál 50 véletlenül kiválasztott embert megkérdeztek a házastársi hűséghez való viszonyáról. Szimmetrikus-e a konzisztens viselkedéstől való eltérés valószínűsége a két irányban? fontosnak tartja-e a hűséget a házasságban i h ű s é g e s - e i n g e e n m 1 g e n 8 6 2 4 n e 2 m 2 0 2 4 3 0 2 6 5 0 H0: összefüggenek (annak valószínűsége, hogy valaki hűtlen, de fontosnak tartja a hűséget, ugyanakkora, mint hogy hűséges, de nem tartja fontosnak) Nemparaméteres próbák 106 n b c a diszkordáns egyedek száma, b<c a c c1 b d c2 n<20, kismintás n p Pk b 0.5n k 0 k b n 0.5 n20, nagymintás z0 n 0.52 b bc z0 bc n bc 2 b c 2 bc 0 A folytonossági korrekcióval: z0 b c 1 bc b c 1 2 2 0 bc Nemparaméteres próbák 107 r1 r2 N a c c1 n<20, kismintás, b<c n p Pk b 0.5n k 0 k b 18 6 24 2 24 26 b d c2 r1 r2 N Minitab>Calc>Probability distributions> >Binomial 20 30 N Döntés? Nemparaméteres próbák 108 32. példa G.A.Walker: Common statistical methods for clinical research with SAS examples, Collins-Wellesley Publishing, San Diego, California, 1996 A páciensek kezelést kapnak. Véletlenszerűen kiválasztottak 86 pácienst. Mindenkinek megmérték a bilirubin-szintjét kezelés előtt és kezelés után is. Kérdés: a kezelésnek van-e mellékhatása a vizelet bilirubinszintjére, vagyis hogy a kezeléstől megváltozik-e a bilirubin-szint. Kezelés előtt n m o r a m g á a s l i s Kezelés után normális magas 6 7 4 2 0 1 4 6 6 1 66 20 86 Nemparaméteres próbák 109 2 x 2 Table Column 1 Column 2 Frequencies, row 1 Percent of total Frequencies, row 2 Percent of total Column totals Percent of total Chi-square (df=1) V-square (df=1) Yates corrected Chi-square Phi-square Fisher exact p, one-tailed two-tailed McNemar Chi-square (A/D) Chi-square (B/C) 60 69.767% 6 6.977% 66 76.744% 5.59 5.52 3.98 .06499 42.56 2.45 b c 1 2 02 bc 14 16.279% 6 6.977% 20 23.256% p= .0181 p= .0188 p= .0460 p= p= p= p= Row Totals 74 86.047% 12 13.953% 86 .0282 .0282 .0000 .1175 2 14 6 1 14 6 2.45 2 b c 2 0 Nemparaméteres próbák bc 2 14 6 14 6 110 3.197 a c c1 Fisher egzakt próbája, a sor- és oszlop-összegek is adottak b d c2 51. példa A. Agresti: Categorical data analysis, J. Wiley, 2002, p. 444 Fisher tea-példája: először a tejet, utána a teát? tényleges sorrend tej előbb vélt sorrend tej előbb tea előbb 3 1 4 tea előbb 1 3 4 4 4 8 Nemparaméteres próbák 111 r1 r2 N tényleges sorrend tej előbb vélt sorrend tej előbb tea előbb 3 1 4 tea előbb 1 3 4 4 4 8 4 4 3 1 P3 0.229 8 4 hipergeometrikus eloszlás p annak valószínűsége, hogy a talált vagy annál szélsőségesebb eredmény álljon elő Nemparaméteres próbák 112 4 4 4 0 P4 0.0143 8 4 p 0.2423 A kis minta-elemszám miatt nagyok az ugrások, p<0.05 csak akkor lenne, ha mind a 4-et jól eltalálnák. Nemparaméteres próbák 113 4 1 5 5 1 6 1 4 5 1 5 6 5 5 10 6 6 12 p=0.1072 p=0.0411 Nemparaméteres próbák 114 A 2- próbához szükséges előfordulási számok Cochran: egyik Eij sem lehet kisebb 1-nél, és a cellák legföljebb 20%-ában lehet kisebb 5-nél Conover: ha néhány Eij érték 0.5 körül van, de a többség nagyobb 1-nél, az eljárás alkalmazható. Ha túlságosan kicsinyek a várható előfordulási számok, a cellákat összevonhatjuk. Nemparaméteres próbák 115