Transcript t_testy
t - testy. Předpokládejme, že data mají normální rozdělení (pocházejí z normálního rozdělení N(m, s2)). 1. Předpokládejme, že parametr s rozdělení je znám. Z předchozího zkoumání, nebo z teoretických úvah plyne, že m = m0. Na základě našich pokusů se však zdá, že poslední rovnost neplatí. H0: m = m0. H1: m m0. V předchozí přednášce byl vysvětlen význam chyby 1. a 2. druhu. V pokusu byl proveden náhodný výběr z N(m, s2) o rozsahu n. Označíme ho X1, …, Xn. Výběrový průměr X může při dostatečném rozsahu výběru Dobře aproximovat střední hodnotu m. s S.E. = n Pokud data pocházejí z normálního rozdělení N(m, s2), pak za platnosti H0 platí, že X pochází rovněž z normálního rozdělení N (m0 , s2 n ) . n ( X m0 ) / s ~ N (0,1) Ideální pro platnost H0 je stav X = m0 , neboli To znamená, že n ( X m0 ) / s = 0 . Podle principu statistického testování existuje tedy kritická hodnota k > 0 tak, že H0 nezamítám, jestliže k m0 ks ks X m0 n n n ( X m0 ) s k . Úpravou této nerovnosti dostáváme , při tom k je voleno tak, aby P( y k ) . se nazývá hladina testu. Platí-li předchozí nerovnost, nezamítáme H0 na hladině , neplatí-li nerovnost, zamítáme H0 na hladině . Při tom hodnoty k u() byly pro daná tabelovány. Z historických důvodů se tabelovaly hodnoty pro = 0.05, 0.025, 0.01, 0.001. Dnes se z dat vypočítá hodnota X, při známých hodnotách m a s se vypočte hodnota výrazu n ( X m ) / s. Statistický SW vypočítá příslušnou hodnotu P, tj. pravděpodobnost P = P( y n ( X m ) / s ) P se nazývá dosažená hladina významnosti. Je na tom, kdo pokus vyhodnocuje, kdy zamítne H0 a kdy H0 nezamítne. Z historických důvodů H0 zamítáme, pokud P 0.05. Nerovnost X u ( )s u ( )s mX n n , definuje pro dané konfindenční interval, neboli interval spolehlivosti pro m na hladině . Pravděpodobnost, že konfindenční interval překryje m, je 1-. 2. Neznáme předem hodnotu parametru s. Jestliže X1, …, Xn je náhodný výběr z N (m, s2). Pak 1. Nestranným odhadem parametru s 2. Náhodná veličina (označení tn-1). T= X m S 1 n ( X i X )2 . je náhodná veličina S = n 1 i =1 2 má Studentovo t-rozdělení s n-1 stupni volnosti Interval spolehlivosti pro m při neznámém s je X t n1 ( ) S t ( ) S , m X n1 n n kde t n1 ( ) je kritická hodnota t-rozdělení s n-1 stupni volnosti na hladině , tj. P( y tn1 ( )) Jednovýběrový t - test. Příklad. Při kontrole balícího automatu na cukr, který plní sáčky o hmotnosti 1 kg, byly zjištěny následující odchylky od 1 kg (v gramech): -3, 2, -2, 0, -1, 2, 5, -4, 2, 0. Vykazuje automat systematickou odchylku? Odchylky představují náhodný výběr a předpokládáme, že pochází z normálního Rozdělení se střední hodnotou m a variabilitou s. Rozsah výběru n = 10. Smyslem pokusu je ukázat, že automat vykazuje odchylku, tj, že m 0 Proto H0: m = 0 H1: m 0 X = (3 2 2 1 2 5 4 2) / 10 = 0.1 S= 1 1 8.178 (3.1) 2 3(1.9) 2 (2.1) 2 (1.1) 2 (4.9) 2 (4.1) 2 = 66.88 = = 0.91 9 9 9 T= 0.1 10 = 0.348 0.91 Kritická hodnota t9(0.05) = 2.262 2.262 > T = 0.348 Závěr: Nelze zamítnout nulovou hypotézu, že automat plní balíčky přesně 1 kg. Příklad. Stejně jako v předchozím, pouze s jiným náhodným výběrem. -3, 10, -1, 0, 20, 4, 10, 0, 10, -1. , X = 4.9 , S = 7,355, T = 2.106, t9(0.05) = 2.262 > T = 2.106 Závěr: Nelze zamítnout nulovou hypotézu, že automat plní balíčky přesně 1 kg. Při zpracování na počítači je dosažená hladina významnosti P = 0.0644 > 0.05 H1: m 0 znamená, m > 0 nebo m < 0 ( jedná se o oboustranný test). Podle znaménka X usuzujeme, že by mohlo platit m > 0. Znovu formulujeme jednostranný test: H1: m > 0 (alternativní hypotézu formulujeme nejdříve) H0: m 0 (doplněk k H1) Při zpracování na počítači je dosažená hladina významnosti P = 0.0644/2 < 0.05 Závěr: S pravděpodobností (1- P) > 0.95 lze tvrdit, že automat váží více než 1 kg. Alternativní hypotéza představuje jasný závěr statistického testování, proto při zpřesňování formulace nejprve formulujeme ji. Statistické balíky programů nejsou zbytečné. Umožňují vytvářet přesnější závěry. Párový t - test. Provádíme 2 měření téže veličiny na jednom objektu. Měření závisejí na měřeném objektu. Výhodou je, že se předpokládá stejnávariabilita 1. i 2. souboru měření. Nevýhodou je závislost na měřeném objektu, tj. ve skutečnosti máme pouze 1 náhodný výběr. Párový t-test se převádí na jednovýběrový t-test odečtením obou hodnot na daném objektu. Příklad. Na 10 myších se testoval vliv léku na změnu hmotnosti. Myši byly zváženy před podáním léku a 12 hodin po podání léku. Před podáním léku [g]: 50, 60, 20, 100, 80, 30, 50, 40, 70, 90. Po podání léku [g]: 55, 55, 20, 95, 75, 40, 52, 35, 68, 88. Před podáním – po podání [g]: -5, 5, 0, 5, 5, -10, -2, 5, 2, 2. T = 0.435, P = 0.673 > 0.05. Nemohu zamítnout, že lék nemá vliv na hmotnost myší. Dvouvýběrový t - test. Dva nezávislé výběry, jeden z N(m1, s2), druhý z N (m2, s2). Předpokládejme stejnou variabilitu obou souborů. První výběr X1, …, Xn, druhý výběr Y1, …, Ym. X Y ( m1 m 2 ) nm(n m 2) T = Náhodná veličina má rozdělení tn+m-2. 2 2 ((n 1)S X (m 1)SY nm V případě, že nelze předpokládat stejnou variabilitu obou souborů, provádí se korekce na nestejnou variabilitu: Označíme: S X2 SY2 S= n m S X2 vX = n S Y2 vY = m Nulovou hypotézu m1 – m2 = 0 v oboustranném testu zamítáme na hladině , jestliže X Y S v X t n1 ( ) vY t m1 ( ) v X vY Test rovnosti variancí (dvouvýběrový t – test). Nechť X1, …, Xn je náhodný výběr z N(m1, s12) a Y1, …, Ym je náhodný výběr z N(m2, s22), nechť jsou výběry nezávislé. Pak s 12 X ~ N ( m1 , n ) Y ~ N (m 2 , 2 2 2 (n 1)S X / s1 ~ n1 s 22 m ) (m 1)SY2 / s 22 ~ m2 1 S X2 Jestliže s1 = s2, pak 2 ~ Fn1,m1 , kde Fn-1, m-1 je Fisherovo-Snedecorovo SY rozdělení s m, n stupni volnosti. Pro informaci, hustota Fn,m je rovna mn ) n n ( n m ) n 2 2 1 n 2 f n ,m ( z ) = ( ) z (1 z ) 2 n m m m ( ) ( ) 2 2 ( Prakticky. Test rovnosti variancí: H0: s12 = s22 proti H1: s12 s22. Platnost H0 znamená s 12 =1. s 22 H0 bude zamítnuta, pokud S bude příliš vzdálen od 1(bude menší nebo větší než 1). S 2 X 2 Y Neparametrické testy. Základní předpoklad pro provádění t-testů je, že výběry pocházejí z normálního rozdělení. t-testy nejsou citlivé na porušení normality (jsou robustní). Jestliže můžeme provést transformaci dat do normálního rozdělení, je lepší ji provést. • pokud střední hodnota lineárně závisí na průměru, provádí se logaritmická transformace. • pokud máme procentuální data v rozsahu 10% - 90%, není transformace nutná. • pokud máme procentuální data, v nichž se vyskytují čísla menší než 10% nebo větší než 90%, pak se použije transformace arcsin( x / 100) . Jsou k dispozici neparametrické testy (nepoužívají k výpočtům parametry normálního rozdělení). • neparametrickými ekvivalenty párového t-testu či jednovýběrového t-testu je například Wilcoxonův test. • neparametrickým ekvivalentem 2-výběrového t-testu je například Mann-Whitne test. Neparametrické testy jsou slabší než parametrické, tj. neodhalí rozdíly, které by t-test odhalil. V praxi se příliš nepoužívají. Výsledky se často navíc aproximují normovaným normálním rozdělením. Wilcoxonův test. Nechť náhodný výběr X1, …, Xn pochází z rozdělení s distribuční funkcí F (x). Testujeme nulovou hypotézu, že 0 je mediánem tohoto rozdělení. Seřadíme hodnoty náhodného výběru do rostoucí posloupnosti podle absolutních hodnot. Každé hodnotě přiřadíme pořadí při tomto uspořádání. Označíme S+ (resp. S-) součet pořadí, které náležejí kladným (resp. záporným) Hodnotám Xi. S U = 1 n(n 1) 4 1 n(n 1)(2n 1) 24 má asymptoticky normované normální rozdělení. Test na nulový medián se tak transformuje na test, že U je blízko 0. Příklad. U 8 osob byl měřen krevní tlak před a po podání léku. Systolické tlaky byly: Před pokusem: 130,185, 162, 136, 147, 181, 138, 139 Po pokusu: 139, 190, 175, 135, 155, 175, 158, 149 Rozdíly: 9, 5, 13, -1, 8, -6, 20, 10 Má lék vliv na změnu krevního tlaku? Příklad lze spočítat párovým t-testem. H0: TK před = TK po H1: TK před TK po X = 152.25, Y = 159.5 , T = -2,542, P = 0.039 Závěr: podaný lék ovlivňuje krevní tlak. Protože T < 0, lze výpověď zpřesnit: H1: TK před < TK po H0: TK před TK po P = 0.0195 Závěr: podaný lék zvyšuje krevní tlak. Výpočet Wilcoxonovým testem. Rozdíly tlaků: 9, 5, 13, -1, 8, -6, 20, 10 Pořadí absolutních hodnot rozdílů: 5, 2, 7, 1, 4, 3, 8, 6 S+= 2 + 4 + 5 + 6 + 7 + 8 = 32 S- = 1 + 3 = 4 U = -1.961 < u(0.025) = -1.95 Závěr: zamítám nulovou hypotézu. Avšak jedná se o mezní hodnotu. Test je mnohem méně citlivý než t-test. Mann-Whitneyův test. Máme 2 nezávislé výběry, X1, .., Xn a Y1, …, Ym, ze 2 spojitých rozdělení. Testujeme hypotézu, že distribuční funkce obou rozdělení se rovnají. Všech m + n hodnot uspořádáme vzestupně. Zjistíme součet pořadí pro X1, …, Xn a označíme ho T1. Součet pořadí pro Y1, …, Ym označíme T2. U 1 = mn n(n 1) T1 2 Platí U= U1 1 mn 2 mn (m n 1) 12 ~ N (0,1) U 2 = mn m(m 1) T2 2 (U1 U 2 ) = mn) Příklad. 4 plochy byly hnojeny novým hnojivem, 6 ploch bylo ošetřeno starým způsobem. Je rozdíl mezi hektarovým výnosem plodiny? Nový způsob: 51, 52, 49, 55 Starý způsob: 45, 54, 48, 44, 53, 50. Je možno použít 2-výběrový t-test. Nejprve test homogenity variancí (Levenův): s 12 s 12 H0: =1, H1: 2 1 s 22 s 2 F 1,8 = 2.02, P = 0.193 nelze zamítnout homogenitu variancí. Použijeme 2-výběrový test pro rovnost variancí. H0: starý = nový, H1: starý nový t8 = 1.19, P = 0.27 nelze zamítnout, že nový způsob hnojení nemá vliv na výnos. Jednostranný test nic na tomto závěru nezmění, protože P/2 > 0.05. Neparametrický Mann-Whitneyův test. U = 0.959, P = 0.337 nelze zamítnout, že nový způsob hnojení nemá vliv na výnos.