Transcript t_testy

t - testy.
Předpokládejme, že data mají normální rozdělení (pocházejí z normálního
rozdělení N(m, s2)).
1. Předpokládejme, že parametr s rozdělení je znám.
Z předchozího zkoumání, nebo z teoretických úvah plyne, že m = m0.
Na základě našich pokusů se však zdá, že poslední rovnost neplatí.
H0: m = m0.
H1: m  m0. V předchozí přednášce byl vysvětlen význam chyby 1. a 2. druhu.
V pokusu byl proveden náhodný výběr z N(m, s2) o rozsahu n.
Označíme ho X1, …, Xn. Výběrový průměr X může při dostatečném rozsahu výběru
Dobře aproximovat střední hodnotu m.
s
S.E. = n
Pokud data pocházejí z normálního rozdělení N(m, s2), pak za platnosti H0 platí, že
X pochází rovněž z normálního rozdělení
N (m0 ,
s2
n
)
.
n ( X  m0 ) / s ~ N (0,1)
Ideální pro platnost H0 je stav X = m0 , neboli
To znamená, že
n ( X  m0 ) / s = 0 .
Podle principu statistického testování existuje tedy kritická hodnota k > 0 tak, že
H0 nezamítám, jestliže  k 
m0 
ks
ks
 X  m0 
n
n
n ( X  m0 )
s
 k . Úpravou této nerovnosti dostáváme
, při tom k je voleno tak, aby P( y  k )  
.
 se nazývá hladina testu.
Platí-li předchozí nerovnost, nezamítáme H0 na hladině ,
neplatí-li nerovnost, zamítáme H0 na hladině .
Při tom hodnoty k  u() byly pro daná  tabelovány. Z historických důvodů se
tabelovaly hodnoty pro  = 0.05, 0.025, 0.01, 0.001.
Dnes se z dat vypočítá hodnota X, při známých hodnotách m a s se vypočte
hodnota výrazu
n ( X  m ) / s.
Statistický SW vypočítá příslušnou hodnotu P, tj. pravděpodobnost
P = P( y  n ( X  m ) / s )
P se nazývá dosažená hladina významnosti.
Je na tom, kdo pokus vyhodnocuje, kdy zamítne H0 a kdy H0 nezamítne.
Z historických důvodů H0 zamítáme, pokud P  0.05.
Nerovnost
X
u ( )s
u ( )s
mX 
n
n
, definuje pro dané 
konfindenční interval, neboli interval spolehlivosti pro m na hladině .
Pravděpodobnost, že konfindenční interval překryje m, je 1-.
2. Neznáme předem hodnotu parametru s.
Jestliže X1, …, Xn je náhodný výběr z N (m, s2). Pak
1. Nestranným odhadem parametru s
2. Náhodná veličina
(označení tn-1).
T=
X m
S
1 n
( X i  X )2 .
je náhodná veličina S =

n  1 i =1
2
má Studentovo t-rozdělení s n-1 stupni volnosti
Interval spolehlivosti pro m při neznámém s je
X
t n1 ( ) S
t ( ) S
,
 m  X  n1
n
n
kde t n1 ( ) je kritická hodnota t-rozdělení s n-1 stupni volnosti na hladině , tj.
P( y  tn1 ( ))  
Jednovýběrový t - test.
Příklad.
Při kontrole balícího automatu na cukr, který plní sáčky o hmotnosti 1 kg, byly
zjištěny následující odchylky od 1 kg (v gramech):
-3, 2, -2, 0, -1, 2, 5, -4, 2, 0.
Vykazuje automat systematickou odchylku?
Odchylky představují náhodný výběr a předpokládáme, že pochází z normálního
Rozdělení se střední hodnotou m a variabilitou s.
Rozsah výběru n = 10.
Smyslem pokusu je ukázat, že automat vykazuje odchylku, tj, že m  0
Proto
H0: m = 0
H1: m  0
X = (3  2  2  1  2  5  4  2) / 10 = 0.1
S=
1
1
8.178
(3.1) 2  3(1.9) 2  (2.1) 2  (1.1) 2  (4.9) 2  (4.1) 2 =
66.88 =
= 0.91
9
9
9
T=
0.1
10 = 0.348
0.91
Kritická hodnota t9(0.05) = 2.262
2.262 > T = 0.348
Závěr: Nelze zamítnout nulovou hypotézu, že automat plní balíčky přesně 1 kg.
Příklad.
Stejně jako v předchozím, pouze s jiným náhodným výběrem.
-3, 10, -1, 0, 20, 4, 10, 0, 10, -1. ,
X = 4.9 , S = 7,355, T = 2.106, t9(0.05) = 2.262 > T = 2.106
Závěr: Nelze zamítnout nulovou hypotézu, že automat plní balíčky přesně 1 kg.
Při zpracování na počítači je dosažená hladina významnosti P = 0.0644 > 0.05
H1: m  0 znamená, m > 0 nebo m < 0 ( jedná se o oboustranný test).
Podle znaménka X usuzujeme, že by mohlo platit m > 0.
Znovu formulujeme jednostranný test:
H1: m > 0 (alternativní hypotézu formulujeme nejdříve)
H0: m  0 (doplněk k H1)
Při zpracování na počítači je dosažená hladina významnosti P = 0.0644/2 < 0.05
Závěr: S pravděpodobností (1- P) > 0.95 lze tvrdit, že automat váží více než 1 kg.
Alternativní hypotéza představuje jasný závěr statistického testování, proto při
zpřesňování formulace nejprve formulujeme ji.
Statistické balíky programů nejsou zbytečné. Umožňují vytvářet přesnější závěry.
Párový t - test.
Provádíme 2 měření téže veličiny na jednom objektu.
Měření závisejí na měřeném objektu.
 Výhodou je, že se předpokládá stejnávariabilita 1. i 2. souboru měření.
 Nevýhodou je závislost na měřeném objektu, tj. ve skutečnosti máme pouze 1
náhodný výběr.
Párový t-test se převádí na jednovýběrový t-test odečtením obou hodnot na daném
objektu.
Příklad.
Na 10 myších se testoval vliv léku na změnu hmotnosti. Myši byly zváženy před
podáním léku a 12 hodin po podání léku.
Před podáním léku [g]: 50, 60, 20, 100, 80, 30, 50, 40, 70, 90.
Po podání léku [g]: 55, 55, 20, 95, 75, 40, 52, 35, 68, 88.
Před podáním – po podání [g]: -5, 5, 0, 5, 5, -10, -2, 5, 2, 2.
T = 0.435, P = 0.673 > 0.05.
Nemohu zamítnout, že lék nemá vliv na hmotnost myší.
Dvouvýběrový t - test.
Dva nezávislé výběry, jeden z N(m1, s2), druhý z N (m2, s2).
Předpokládejme stejnou variabilitu obou souborů.
První výběr X1, …, Xn, druhý výběr Y1, …, Ym.
X  Y  ( m1  m 2 )
nm(n  m  2)
T
=
Náhodná veličina
má rozdělení tn+m-2.
2
2
((n  1)S X  (m  1)SY
nm
V případě, že nelze předpokládat stejnou variabilitu obou souborů, provádí se
korekce na nestejnou variabilitu:
Označíme:
S X2 SY2
S=

n
m
S X2
vX =
n
S Y2
vY =
m
Nulovou hypotézu m1 – m2 = 0 v oboustranném testu zamítáme na hladině , jestliže
X Y
S

v X t n1 ( )  vY t m1 ( )
v X  vY
Test rovnosti variancí (dvouvýběrový t – test).
Nechť X1, …, Xn je náhodný výběr z N(m1, s12) a Y1, …, Ym je náhodný výběr z
N(m2, s22), nechť jsou výběry nezávislé.
Pak
s 12
 X ~ N ( m1 , n )
Y ~ N (m 2 ,
2
2
2
 (n 1)S X / s1 ~  n1
s 22
m
)
(m 1)SY2 / s 22 ~  m2 1
S X2
 Jestliže s1 = s2, pak 2 ~ Fn1,m1 , kde Fn-1, m-1 je Fisherovo-Snedecorovo
SY
rozdělení s m, n stupni volnosti.
Pro informaci, hustota Fn,m je rovna
mn
)
n n
( n  m )
n 2 2 1
n
2
f n ,m ( z ) =
( ) z (1  z ) 2
n
m m
m
 ( ) ( )
2
2
(
Prakticky.
Test rovnosti variancí: H0: s12 = s22 proti H1: s12  s22.
Platnost H0 znamená s 12 =1.
s 22
H0 bude zamítnuta, pokud S bude příliš vzdálen od 1(bude menší nebo větší než 1).
S
2
X
2
Y
Neparametrické testy.
Základní předpoklad pro provádění t-testů je, že výběry pocházejí z normálního
rozdělení.
t-testy nejsou citlivé na porušení normality (jsou robustní).
 Jestliže můžeme provést transformaci dat do normálního rozdělení,
je lepší ji provést.
• pokud střední hodnota lineárně závisí na průměru, provádí se logaritmická
transformace.
• pokud máme procentuální data v rozsahu 10% - 90%, není transformace nutná.
• pokud máme procentuální data, v nichž se vyskytují čísla menší než 10% nebo
větší než 90%, pak se použije transformace arcsin( x / 100) .
 Jsou k dispozici neparametrické testy (nepoužívají k výpočtům parametry
normálního rozdělení).
• neparametrickými ekvivalenty párového t-testu či jednovýběrového t-testu
je například Wilcoxonův test.
• neparametrickým ekvivalentem 2-výběrového t-testu je například
Mann-Whitne test.
Neparametrické testy jsou slabší než parametrické, tj. neodhalí rozdíly, které by
t-test odhalil. V praxi se příliš nepoužívají.
Výsledky se často navíc aproximují normovaným normálním rozdělením.
Wilcoxonův test.
Nechť náhodný výběr X1, …, Xn pochází z rozdělení s distribuční funkcí F (x).
Testujeme nulovou hypotézu, že 0 je mediánem tohoto rozdělení.
Seřadíme hodnoty náhodného výběru do rostoucí posloupnosti podle absolutních
hodnot.
Každé hodnotě přiřadíme pořadí při tomto uspořádání.
Označíme S+ (resp. S-) součet pořadí, které náležejí kladným (resp. záporným)
Hodnotám Xi.
S 
U =
1
n(n  1)
4
1
n(n  1)(2n  1)
24
má asymptoticky normované normální rozdělení.
Test na nulový medián se tak transformuje na test, že U je blízko 0.
Příklad.
U 8 osob byl měřen krevní tlak před a po podání léku. Systolické tlaky byly:
Před pokusem: 130,185, 162, 136, 147, 181, 138, 139
Po pokusu: 139, 190, 175, 135, 155, 175, 158, 149
Rozdíly: 9, 5, 13, -1, 8, -6, 20, 10
Má lék vliv na změnu krevního tlaku?
Příklad lze spočítat párovým t-testem.
H0: TK před = TK po
H1: TK před  TK po
X = 152.25, Y = 159.5 , T = -2,542, P = 0.039
Závěr: podaný lék ovlivňuje krevní tlak.
Protože T < 0, lze výpověď zpřesnit:
H1: TK před < TK po
H0: TK před  TK po
P = 0.0195
Závěr: podaný lék zvyšuje krevní tlak.
Výpočet Wilcoxonovým testem.
Rozdíly tlaků: 9, 5, 13, -1, 8, -6, 20, 10
Pořadí absolutních hodnot rozdílů: 5, 2, 7, 1, 4, 3, 8, 6
S+= 2 + 4 + 5 + 6 + 7 + 8 = 32
S- = 1 + 3 = 4
U = -1.961 < u(0.025) = -1.95
Závěr: zamítám nulovou hypotézu.
Avšak jedná se o mezní hodnotu. Test je mnohem méně citlivý než t-test.
Mann-Whitneyův test.
Máme 2 nezávislé výběry, X1, .., Xn a Y1, …, Ym, ze 2 spojitých rozdělení.
Testujeme hypotézu, že distribuční funkce obou rozdělení se rovnají.
Všech m + n hodnot uspořádáme vzestupně. Zjistíme součet pořadí pro X1, …, Xn a
označíme ho T1. Součet pořadí pro Y1, …, Ym označíme T2.
U 1 = mn 
n(n  1)
 T1
2
Platí
U=
U1 
1
mn
2
mn
(m  n  1)
12
~ N (0,1)
U 2 = mn 
m(m  1)
 T2
2
(U1  U 2 ) = mn)
Příklad.
4 plochy byly hnojeny novým hnojivem, 6 ploch bylo ošetřeno starým způsobem.
Je rozdíl mezi hektarovým výnosem plodiny?
Nový způsob: 51, 52, 49, 55
Starý způsob: 45, 54, 48, 44, 53, 50.
Je možno použít 2-výběrový t-test.
Nejprve test homogenity variancí (Levenův):
s 12
s 12
H0:
=1, H1: 2 1
s 22
s
2
F 1,8 = 2.02, P = 0.193  nelze zamítnout homogenitu variancí.
Použijeme 2-výběrový test pro rovnost variancí.
H0: starý = nový, H1: starý  nový
t8 = 1.19, P = 0.27  nelze zamítnout, že nový způsob hnojení nemá vliv na výnos.
Jednostranný test nic na tomto závěru nezmění, protože P/2 > 0.05.
Neparametrický Mann-Whitneyův test.
U = 0.959, P = 0.337  nelze zamítnout, že nový způsob hnojení nemá vliv na výnos.