Statistická indukce

Download Report

Transcript Statistická indukce

Statistická indukce
Testování statistických
hypotéz
Dvouvýběrové testy (testy hypotéz o
parametrech dvou rozdělení)
Máme k dispozici dva výběrové soubory a na základě
jejich porovnání provádíme úsudky o základních
charakteristikách dvou ZS, z nichž byly výběry provedeny.
Test významnosti rozdílu dvou výběrových
rozptylů (F-test)
Uvažujme dva nezávislé náhodné výběry X = (x1, x2, …,
xm)´ a Y = (y1, y2, …, yn)´ o rozsazích m, resp. n, jež byly
odebrány ze ZS s rozdělením N  1; 12 , resp. N  2 ; 22 ,
kde 1 , 2 , 12 a 22 jsou neznámé hodnoty.




H0 :   
2
1
Test nulové hypotézy
2
2
provedeme pomocí testového kritéria
kde
2
1
2
2
s
2
2
F  , s1  s 2 ,
s
m
1
2
s12 
(
x

x
)

i
m  1 i 1
n
1
2
s 22 
(
y

y
)

i
n  1 i 1
jsou nestranné výběrové rozptyly, pomocí nichž
2
2
odhadujeme neznámé rozptyly 1 a 2 .
Za platnosti H0 má statistika Snedecorovo F-rozdělení
o f1 = (m-1) a f2 = (n-1) stupních volnosti.
Kritický obor
Alternativa
H1 :   
2
1
Kritický obor
2
2
H1 : 12  22
K = F > F/2 [(m-1), (n-1)]
K = F > F [(m-1), (n-1)]
Jestliže F < F (f1, f2), není důvod, abychom nulovou
hypotézu H0 : 12  22 zamítali.
Příklad
Z velké zásilky součástek jsme jich náhodným výběrem
vybrali 30 a zjistili pro některý jejich rozměr výběrovou
směrodatnou odchylku 4,081 mm. Ze zásilky od druhého
dodavatele jsme vybrali 25 součástek a zjistili jsme pro
stejný rozměr výběrový rozptyl 18,25. Na základě těchto
údajů chceme ověřit, zda variabilita sledovaného
parametru je u obou dodávek shodná.
m = 30
n = 25
s12  16,654561
s 22  18,25
H0 : 12  22
H1 : 12  22
2
1
2
2
s
18,25
F 
 1,0958
s 16,654561
F (f1, f2) = F0,05 (24; 29) = 1,90
F < F (f1, f2)  H0 nezamítáme a variabilita obou
dodávek je v ZS shodná.
Test významnosti rozdílu dvou výběrových
průměrů (t-test)
 t-test při známých rozptylech
Budeme předpokládat, že ze dvou základních souborů,
které mají rozdělení N  1; 12 , resp. N  2 ; 22 byly
provedeny nezávislé náhodné výběry o rozsazích m,
resp. n (vyžaduje větší rozsahy).
Na základě těchto nezávislých náhodných výběrů
chceme ověřit nulovou hypotézu H0: 1 = 2 proti
alternativní hypotéze H1: 1  2 (event. 1 – 2 = 0).
Je třeba rozhodnout, zda výběrové průměry určené z
nezávislých náhodných výběrů o rozsazích m a n se liší
statisticky významně nebo pouze náhodně.




Jako testovacího kritéria použijeme statistiky U,
která má za platnosti H0 rozdělení N(0; 1).
U
xy
 

m n
2
1
2
2
Kritický obor
Alternativa
Kritický obor
H1: 1  2
K = U> u
H1: 1  2
K = U > u2
H1: 1  2
K = U < -u2
 t-test při neznámých rozptylech
K dispozici máme pouze nestranné odhady rozptylů
2
2
s1 a s 2 , vypočtené z hodnot, zjištěných ve dvou
nezávislých náhodných výběrech o rozsazích m a n.
Před vlastním provedením testu je potřeba ověřit,
zda se neznámé rozptyly 12 a 22 sobě rovnají nebo
zda se od sebe liší.
Tzn. před každým t-testem se provádí F-test (test
hypotézy o shodě dvou rozptylů).
Test hypotézy H0: 1 = 2 při stejných rozptylech
(dvouvýběrový t-test)


Jsou-li oba rozptyly 12 a 22 stejné 12  22 , používá
se k testování hypotézy testové kritérium
xy
t
,
1 1
s

m n
kde


1
s 
 m  1  s12  (n  1)  s 22 .
mn2
2
Kritické obory uvádí následující přehled.
Alternativa
Kritický obor
H 1 : 1   2
K = t> t (m+n-2)
H 1 : 1   2
K = t > t2 (m+n-2)
H 1 : 1   2
K = t < -t2 (m+n-2)
Příklad
Máme k dispozici údaje o zaměstnanosti žen (v %) v
jednotlivých zemích EU. Je možné konstatovat, že z
hlediska zaměstnanosti žen existuje rozdíl mezi novými a
starými zeměmi EU?
Stát – EU 15
Belgie
Dánsko
Finsko
Francie
Irsko
Itálie
Lucembursko
Německo
Nizozemsko
Portugalsko
Rakousko
Řecko
Spojené království
Španělsko
Švédsko
Ženy
51,8
70,5
65,7
57,2
55,8
42,7
52,0
59,0
65,8
60,6
62,8
43,8
65,3
46,0
71,5
Stát
Česká republika
Estonsko
Kypr
Litva
Lotyšsko
Maďarsko
Malta
Polsko
Slovensko
Slovinsko
Ženy
56,3
59,0
60,4
58,4
57,9
50,9
33,6
46,0
52,2
57,6
H0: 1 = 2 – zaměstnanost žen je stejná
H1: 1  2 – zaměstnanost žen je rozdílná
m = 15
n = 10
1 = 58,033
2 = 53,23
s  85,8824
s  67,3179
2
1
2
1
Nejprve je potřeba provést F-test.
H0 :   
2
1
2
2
H1 : 12  22
2
1
2
2
s
85,8824
F 
 1,2758
s
67,3179
F0,05 (14; 10) = 2,86
F < F (f1, f2)  H0 se nezamítá, tzn. že variabilita
obou souborů v ZS je shodná
Nyní pokračujeme t-testem pro variantu shodných
rozptylů.

1
2
2
s 
 m  1  s1  (n  1)  s 2
mn2
2

1
s 
  14  85, 8824  9  67, 3179   78,618
15  10  2
2
xy
58,033 53,23
t

 1,327
1 1
1 1

s

78,618   
m n
 15 10 
t0,05 (15+10-2) = 2,069
t = 1,327 < t = 2,069
t < t (f)  H0: 1 = 2 se nezamítá a rozdíl v
průměrné zaměstnanosti žen v rámci starých a
nových zemí EU lze označit za statisticky
nevýznamný
Test hypotézy H0: 1 = 2 při nestejných
rozptylech (Welchův t-test)
Jsou-li oba rozptyly 12 a 22 podle F–testu rozdílné
2
2
1  2 , použije se Welchův test založený na
testové statistice


t
xy
2
1
2
2
s s

m n
.
Kritické obory pro tento test mají zcela analogický
tvar jako kritické obory uvedené u předchozího testu s
tím rozdílem, že počet stupňů volnosti v kritických
hodnotách je potřeba stanovit samostatným výpočtem.
Počet stupňů volnosti pro Welchův test
2
s s 
  
m n

f
2 2
2 2
 s1   s 2 
   
m   n 
m 1 n 1
2
1
2
2
Jestliže t > t (f)  H0: 1 = 2 se na dané hladině
významnosti zamítá a platí hypotéza alternativní.
Kromě Welchova testu lze použít i jiný způsob
provedení testu, který se nazývá
Behrens-Fisherův test.
Jako testové kritérium slouží statistika
t
xy
2
1
2
2
s s

m n
.
U tohoto testu se nestanovují stupně volnosti, nýbrž
se přepočítává celá tabulková hodnota.
Přepočet tabulkové hodnoty
2
1
2
2
s
s
t  ( m 1)   t  ( n 1) 

m
n
t 
2
2
s1 s 2

m n
Kritický obor
Alternativa
Kritický obor
H 1 : 1   2
 t t 
K t  t 
K   t  t 
H 1 : 1   2
H 1 : 1   2
K
*

*
2
*
2
Příklad
Máme k dispozici údaje o zaměstnanosti mužů a žen (v %)
v jednotlivých zemích EU. Je možné konstatovat, že z
hlediska zaměstnanosti existuje mezi muži a ženami rozdíl?
Stát
Muži
Belgie
67,3
Dánsko
79,6
Finsko
69,7
Francie
69,4
Irsko
75,0
Itálie
69,6
Lucembursko
73,3
Německo
70,9
Nizozemsko
80,9
Portugalsko
74,1
Rakousko
75,8
Řecko
72,4
Spojené království 78,1
Ženy
51,8
70,5
65,7
57,2
55,8
42,7
52,0
59,0
65,8
60,6
62,8
43,8
65,3
Stát
Španělsko
Švédsko
Česká republika
Estonsko
Kypr
Litva
Lotyšsko
Maďarsko
Malta
Polsko
Slovensko
Slovinsko
Muži
73,2
74,2
73,1
67,2
78,8
64,0
66,1
63,5
74,5
56,5
63,3
67,4
Ženy
46,0
71,5
56,3
59,0
60,4
58,4
57,9
50,9
33,6
46,0
52,2
57,6
H0: 1 = 2 – zaměstnanost mužů a žen je stejná
H1: 1  2 – zaměstnanost mužů a žen je rozdílná
m = 25
n = 25
1 = 71,116
2 = 56,112
s  34,0264
s  81,11027
2
1
2
1
Nejprve je potřeba provést F-test.
H0 :   
2
1
2
2
H1 : 12  22
2
1
2
2
s
81,11027
F 
 2,384
s
34,0264
F0,05 (24; 24) = 1,98
F > F (f1, f2)  H0 se zamítá, tzn. že variabilita obou
souborů je rozdílná
Nyní pokračujeme t-testem pro variantu rozdílných
rozptylů.
Nejprve použijeme Welchův test.
t
xy
2
1
2
2
s s

m n

71,116 56,115
 6,9915
34,0264 81,11027

25
25
2
2
s s 
 34,0264 81,11027
  



m n
25
25 


f

 41,12
2
2
2
2
 s12   s 22 
 34,0264  81,11027
   

 

 25    25 
m   n 
24
24
m 1 n 1
2
1
2
2
t0,05 (41) = 2,021
t = 6,99 > t = 2,021
t > t (f)  H0: 1 = 2 se zamítá a rozdíl v průměrné
zaměstnanosti mužů a žen v rámci EU lze označit za
statisticky významný
Nyní použijeme druhý možný postup a to test Behrens
– Fisherův.
t
xy
2
1
2
2
s s

m n

71,116 56,115
 6,9915
34,0264 81,11027

25
25
t0,05 (24) = 2,064
34,0264
81,11027
s12
s 22
2,064
 2,064
t  ( m1)   t  ( n 1) 
25
25
m
n 
t  
 2,064
2
2
34
,
0264
81
,
11027
s1 s 2


25
25
m n
t  t  H0 se zamítá
*

t-test pro párové hodnoty (párový t-test)
Ve všech předchozích úvahách jsme vycházeli z
předpokladu nezávislosti výběrových souborů.
V praxi se však často stává, že oba porovnávané
soubory jsou určitým způsobem vázány a to tak, že
každý prvek jednoho souboru tvoří pár s určitým
prvkem druhého souboru.
V těchto případech hovoříme o tzv. párových
výběrech.
Setkáváme s nimi např. tehdy, provádíme-li měření na
jedné statistické jednotce dvakrát nebo na objektech
máme párové části (oči, uši, nohy) a provedeme na
nich měření.
Výsledkem zjišťování jsou dvojice hodnot (xi, yi),
které tvoří páry závislých pozorování.
Test hypotézy, že výběry x = (x1, x2, …, xn)´ a y = (y1,
y2, …, yn)´ pocházejí z rozdělení se stejnými středními
hodnotami 1 a 2, lze převést na jednovýběrový
t-test, aplikovaný na hodnoty di = xi – yi.
Soubor diferencí d = (d1, d2, …, dn)´ lze považovat za
náhodný výběr o rozsahu n z rozdělení N d ; d2 , kde
d = 1 – 2.


Aritmetický průměr a rozptyl tohoto výběru jsou:
n
n
1
1
d   d i   ( x i  yi )  x  y
n i 1
n i 1
n
1
2
s 
(d i  d )

n  1 i 1
2
d
Testovanou nulovou hypotézu ve tvaru H0: 1 = 2
můžeme nyní napsat v upraveném podobě jako
H0: d = 0, kde d je průměr souboru diferencí di.
Testové kritérium má tvar
t
d
2
d
s
n

d
n
 (d
i 1
i
.
 d)
2
n (n  1)
Kritický obor
Alternativa
Kritický obor
H 1 : 1   2
K = t> t (n-1)
H 1 : 1   2
K = t > t2 (n-1)
H 1 : 1   2
K = t < -t2 (n-1)
Příklad
Máme k dispozici údaje o výkonech žáků ve skoku do
dálky při tréninku a při závodě. Je možné konstatovat, že
jsou výkony žáků při tréninku a při závodě shodné?
Skok při
tréninku
(m)
Skok
v závodu
(m)
di
3,3 3,4 3,35 3,75 3,15 3,3 3,45 3,5 3,65 4,05 3,35 3,5
3,15 3,5 3,45 3,7 3,25 3,4 3,55 3,35 3,5 4,15 3,45 3,15
0,15 -0,1 -0,1 0,05 -0,1 -0,1 -0,1 0,15 0,15 -0,1 -0,1 0,35
H0: 1 = 2
H1: 1  2
d

d
n
s
2
d
i
0,15

 0,0125
12

d


t
 d
2
i
n 1
d
0,260625

 0,02369
11
0,0125

 0,2813
2
0,02369
sd
12
n
t(n-1) = t0,05 (11) = 2,201
t < t (n-1)  H0 se nezamítá, tzn. lze konstatovat, že
výkony žáků jsou vyrovnané (nebyl prokázán
statisticky významný rozdíl ve výkonech při tréninku
a v závodě)
Test významnosti rozdílu dvou výběrových
relativních čeností
Přepokládejme, že jsou dány dva ZS s alternativním
rozdělením s parametry p1 a p2.
Na základě náhodných výběrů o velkých rozsazích n1 a
n2 (n1 > 100; n2 > 100) je třeba ověřit hypotézu
H0: p1 = p2.
Test je založen na statistice
u
m1 m 2

n1 n 2
1 1 
p  (1  p )    
 n1 n 2 
,
m1
m2
, resp.
n1
n2
výběrové relativní četnosti
výskytu náhodného jevu A v 1.,
resp. ve 2. výběru
p – vážený aritmetický průměr obou výběrových
relativních četností
m1
m2
 n1 
 n2
m1  m 2
n1
n2
p

n1  n 2
n1  n 2
Pro tento test je možné použít i trochu jiné testové
kritérium.
m m
1
u
m1  m 2
p
n1  n 2
q  1 p
n1

2
n2
pq
n
n1  n 2
n
n1  n 2
Kritický obor je stejný pro obě varianty testového
kritéria.
Alternativa
Kritický obor
H1: p1  p2
K = u> u
H1: p1  p2
K = u > u2
H1: p1  p2
K = u < -u2
Příklad
Máme k dispozici údaje o počtu narozených dětí v rámci
dvou regionů. V regionu A zjistili, že během sledovaného
období se v rámci 120 dětí narodilo 51 chlapců, zatímco v
regionu B se za stejné období narodilo celkem 150 dětí, z
toho 66 děvčat. Je možné konstatovat, že pravděpodobnost
narození chlapce je u obou regionů stejná?
H0: p1 = p2 – pravděpodobnost narození chlapce je shodná
H1: p1  p2 – pravděpodobnost je odlišná
m1 = 51
n1 = 120
m2 = 84
n2 = 150
m1  m 2
51 84
p

 0,5
n1  n 2 120 150
u
m1 m 2

n1 n 2
51 84

120 150

 2,2045
1 
1 1 
 1
0,5  0,5  


p  (1  p )    
 120 150
 n1 n 2 
u = u0,05 = 1,96
u> u  H0 se zamítá, tzn. že pravděpodobnost
narození chlapce je v rámci dvou sledovaných regionů
odlišná
Nyní použijeme druhé testové kritérium.
m1  m 2
51 84
p

 0,5
n1  n 2 120 150
n1  n 2
120150
n

 66, 6
n1  n 2 120 150
m1 m 2
51 84


n1 n 2 120 150
u

 2,2045
pq
0,5  0,5
n
66, 6
Vícevýběrové testy (testy hypotéz o
parametrech více než dvou rozdělení)
Testy rovnosti parametrů
, k  normálních
rozdělení
2
> k2
Test rovnosti dvou rozptylů lze zobecnit na případ
k > 2 normálně rozdělených základních souborů,
z nichž pořizujeme výběry.
Bartlettův test
Mějme k > 2 vzájemně nezávislých náhodných výběrů
ze ZS s rozdělením N  i; i2 , kde oba parametry jsou
neznámé.
Rozsahy jednotlivých výběrů jsou n1, n2, …, nk.


Na základě uvedených náhodných výběrů testujeme
hypotézu
2
2
2
H0 : 1  2  ...  k
proti hypotéze alternativní
H1: alespoň dva z rozptylů jsou různé.
Testovacím kritériem je statistika
2,30259 
2
2
B
 N  k  log s   n i  1 log si ,
C
i 1


k
k
1 
2
2
B   N  k  ln s   (n i  1)  ln si ,
C 
i 1

k
1
2
2
n i  1 si ,
s 

N  k i 1
k

1
1
1 
,
C  1
  

3  (k  1)  i 1 n i  1 N  k 
N  n1  n 2  ... n k .
Statistika má za platnosti H0 rozdělení 2 – rozdělení
o (k-1) stupních volnosti.
Jestliže B  2 ( k 1)  H0 se zamítá.
Cochranův test
Vyjdeme ze stejných předpokladů jako u Bartlettova
testu a předpokládejme dále, že všechny výběrové
soubory mají stejné rozsahy, tzn. n1 = n2 =…= nk = n.
Ověření nulové hypotézy H0 : 12  22  ...  2k
lze sice i v tomto případě provést pomocí Bartlettova
testu, ale výhodnější a rychlejší je zde Cochranův
test.
Testovací kritérium má tvar
G
s
2
max
s  s  ...  s
2
1
2
2
2
k
,
2
max
kde s
je největší z rozptylů s i2 (i = 1, 2, …, m),
které představují nestranné odhady neznámých
populačních rozptylů i2 .
Kritický obor se určí z podmínky
P (G  G (k, f) / H0) = ,
kde G(k, f) je kritická hodnota, kterou určíme pro
zvolenou hladinu významnosti , přičemž k je počet
srovnávaných rozptylů a f = n–1 je počet stupňů
volnosti těchto rozptylů (je stejný pro všechny
rozptyly, neboť jsou vypočteny ze stejného počtu
pozorování).
Jestliže G  G (k, f)  H0 se zamítá.
V případě vyváženého třídění (n1 = n2 = … = nk = n)
lze hypotézu o shodě více jak dvou rozptylů ověřit
pomocí Hartleyova testu.
Testové kritérium má tvar
2
max
2
min
s
Fmax 
s
.
Kritický obor je vymezen takto:
K=Fmax  Fmax;  (k, f)
Fmax;  (k, f) – tabulková hodnota pro k – počet
srovnávaných rozptylů a pro f = n – 1 stupňů volnosti
Příklad
Tří různých vyučovacích metod bylo použito na malých
skupinách žáků. Na základě závěrečného zkoušení
(v bodech), které jsou uvedeny v tabulce, posuďte, zda
existuje rozdíl ve variabilitě v počtu získaných bodů mezi
jednotlivými metodami.
Metoda
xij
A
9 11 10 12 7 11 12 10 13 11 13 11 10 12 13
B
15 16 15 10 13 14 15 7 13 15 15 14 11 15 10
C
18 14 17 9 14 17 16 15 16 8 10 16 14 15 17
Testujeme hypotézu o shodě rozptylů ZS
H0 :       
2
1
2
2
2
3
2
xi.
165
198
216
Výpočty k Bartlettovu testu
15
Metoda
x
j1
2
ij
x
2
i.
x i2.
15
s
2
i
log s
2
i
A
1853
27225
1815,0
2,71
0,4330
B
2706
39204
2613,0
6,60
0,8195
C
3242
46656
3110,4
9,40
0,9731
Celkem
7801
113085
7539,0
18,71
2,2256
2
3 15
3
x
1
1
2
2
i.
s 
  x ij     7801 7539  6,24
45  3 i1 j1
42
i 1 15
log s  0,7952
2
1 3 1
C  1
     1,03
3  2  14 42 
2,30259
B
 42 0,7952 14 2,2256  5,008
1,03
B  5,008 
2
0, 05 ( 2)
 5,99
H0 o shodě rozptylů nemůžeme zamítnout.
Bylo možné také použít Cochranův test.
s
2
max
9,40
G 2 2

 0,502
2
s1  s 2  ...  s m 18,71
G  0,502  G0,05 (3; 14)  0,560
Odchylky mezi rozptyly lze pokládat za nevýznamné.
Hartleyův test
2
max
2
min
s
Fmax 
s
9,40

 3,468
2,71
Fmax; 0,05 (3; 14)  3,54
F  Fmax; 0,05 (3; 14)  H0 se nezamítá