Testování statistických hypotéz Co je to statistická hypotéza? Hypotéza o základním souboru (populaci).

Download Report

Transcript Testování statistických hypotéz Co je to statistická hypotéza? Hypotéza o základním souboru (populaci).

Testování
statistických hypotéz
Co je to statistická hypotéza?
Hypotéza o základním souboru (populaci).
Typy stat. hypotéz
•
Parametrické hypotézy
- hypotézy o parametrech populace
a) Hypotézy o parametru jedné populace (o střední hodnotě,
mediánu, rozptylu, relativní četnosti…)
b) Hypotézy o parametrech dvou populací (srovnávací testy)
c) Hypotézy o parametrech více než dvou populací (ANOVA …)
•
Neparametrické hypotézy
- hypotézy o jiných vlastnostech populace (tvar rozdělení,
závislost proměnných…)
Zdroje hypotéz
• Hypotéza je založena na předchozí zkušenosti
• Hypotéza vychází z teorie, kterou je třeba doložit
• Hypotéza vychází z požadavku na kvalitu
produktu
• Hypotéza je pouhým dohadem založeným na
náhodném pozorování
Co to je testování hypotéz?
Egon Sharpe Pearson (1895-1980)
Jerzy Neymann (1894-1981)
Rozhodovací proces, v němž proti sobě stojí
2 tvrzení - nulová a alternativní hypotéza.
Nulová hypotéza
- takové tvrzení o populaci, které je bráno jak
předpoklad při testování
- představuje určitý rovnovážný stav a bývá
vyjádřena rovnosti „=“
např. μ = 100, μ1 = μ2 = μ3 …
Alternativní hypotéza
- představuje porušení rovnovážného stavu a
zapisujeme ji tedy jedním ze tří možných zápisů
nerovnosti ( ≠ , <, >)
Výběr vhodné alternativní hypotézy
• jednostranná vs. oboustranná alternativa
• alternativní hypotéza musí být v souladu
s výběrovým souborem
Princip testování hypotéz
Základní soubor
(populace)
Výběrový
soubor
Hypotéza o populaci
Jsou data konzistentní s hypotézou o populaci ?
Chyby při testování hypotéz
jsou nevyhnutelnou součásti testování
Rozhodnutí
Skutečnost
Platí H0
Platí HA
Nezamítáme H0
Zamítáme H0
Správné rozhodnutí
Pravděpodobnost: 1 – α
(spolehlivost)
Chyba I. druhu
Pravděpodobnost: α
(hladina významnosti)
Chyba II. druhu
Pravděpodobnost: β
Správné rozhodnutí
Pravděpodobnost: 1 – β
(síla testu)
• Chyba I. druhu
- nulová hypotéza platí, ale my ji zamítneme
- maximální přípustná pravděpodobnost chyby I. druhu
(hladina významnosti) se volí ještě před pořízením
výběrového souboru)
• Chyba II. druhu
- nulová hypotéza neplatí, ale my ji nezamítneme
(nepoznáme, že neplatí)
- síla testu závisí na zvolené testové metodě (zejména
na skutečném rozdělení dat)
Grafický zápis chyby II. druhu
(pro konkrétní alternativu)
Operativní charakteristika
Křivka síly testu
(Power Curve)
Příklad
Standardním výrobním způsobem lze vyrobit monitory se
střední životnosti 1200 hodin a směrodatnou odchylkou
300 hodin.
Novou technologií, kterou navrhuje vývojové centrum
bylo zkušebně vyrobeno 100 obrazovek, jejichž
průměrná životnost byla 1265 hodin. Předpokládejme, že
výběr pocházel z normálního rozdělení.
Jde o kvalitnější technologii,
nejde pouze o náhodný rozdíl?
H 0 :   1200hodin
H A :   1200hodin
X  1265hodin
Nakolik průměr odpovídá nulové hypotéze?
 2 
X  N   ; 
n 

2

300 

X  N 1200;
100 

X  N 1200;900
Výsledek testu
Skutečnost
H 0 :   1200
H A :   1200
H A1 :   1240
Jestliže platí H0
H0
HA
H0
OK
Chyba
I. druhu
HA
Chyba
II.druhu
OK
Jestliže platí konkrétní HA
Nezamítáme H0
Zamítáme H0
β
µ0 =1200
α (volíme)
XC
μA = 1240
Jak snížit pravděpodobnost obou chyb?
H 0 :   1200
Vliv rostoucího rozsahu výběru
na pravděpodobnost chyb I. a II. druhu
H A :   1200
H A1 :   1240
Jestliže platí H0
Jestliže platí konkrétní HA
Nezamítáme H0
β
µ0 =1200
Zamítáme H0
α
XC
μA = 1240
Přístupy k testování hypotéz
• Testování pomocí intervalových odhadů
• Klasický test
• Čistý test významnosti
(testování pomocí p-value (p-hodnoty))
Testování
pomocí intervalových odhadů
Lze použít pouze pro testování parametrických hypotéz
1. Formulace nulové a alternativní hypotézy
2. Nalezení příslušného intervalového odhadu (POZOR!
Umíme zatím nalézt pouze int. odhady parametrů
normálního rozdělení!!!)
3. Ověření toho, zda testovaná hodnota parametru leží v
nalezeném intervalovém odhadu
4. Formulace závěru testu
Klasický test
1. Formulace nulové a alternativní hypotézy
2. Volba testové statistiky (testového kritéria) T(X),
musíme znát (nulové rozdělení) F0 ( x)  P(T ( X )  x H0 )
3. Ověření předpokladů testu
4. Sestrojení kritického oboru a oboru přijetí
5. Výpočet pozorované hodnoty testové statistiky T(X) xOBS
6. Formulace závěru testu
Konstrukce kritického oboru - C
PT X  C H0   
1. Alternativní hypotéza ve tvaru „<“ (ve prospěch
alternativy svědčí
nízké hodnoty testové statistiky)
C ≤ Tα
2. Alternativní hypotéza ve tvaru „>“ (ve prospěch alternativy svědčí
vysoké hodnoty testové statistiky), pak je kritický obor vymezen jako:
C ≥ T1-α
3. Alternativní hypotéza ve tvaru „≠“ (ve prospěch alternativy svědčí
extrémně nízké nebo extrémně vysoké hodnoty testové statistiky) –
POZOR! Lze použít pouze při symetrickém nulovém rozdělení!!!!
(C ≤ Tα/2) nebo (C ≥ T1-α/2)
Příklad
1. Formulace nulové a alternativní hypotézy:
H 0 :   1200
H A :   1200
2. Volba testového kritéria:
T X   Z 
X 

 n  N 0;1
3. Ověření předpokladu testu:
Viz. předpoklad v zadání úlohy.
4. Výpočet pozorované hodnoty:
X  1265hod.,   300 hod., n  100
xOBS  Z H 0 
X  0

 n
1265 1200
 100  2,17
300
5. Konstrukce kritického oboru:
Jestliže platí H0
Nezamítáme H0
Zamítáme H0
α
µ0 =1200 X C
T(X), jestliže platí H0
Nezamítáme H0
Zamítáme H0
α
µ =0
z0,95=1,64
C
6. Rozhodnutí:
T(X), jestliže platí H0
Nezamítáme H0
Zamítáme H0
α
µ =0
C
1,64
xOBS=2,17
Zamítáme H0 ve prospěch HA, tj. s 95% ní pravděpodobnosti lze
tvrdit, že došlo ke zlepšení střední životnosti monitorů.
Vliv volby α na rozhodnutí
T(X), jestliže platí H0
Nezamítáme H0
Zamítáme H0
α
µ =0
1,64
xOBS=2,17
C
Čistý test významnosti
1. Formulace nulové a alternativní hypotézy
2. Volba testové statistiky (testového kritéria) T(X),
musíme znát (nulové rozdělení)
3. Ověření předpokladů testu
4. Výpočet pozorované hodnoty testové statistiky T(X) –
xOBS
5. Určení p-value
6. Formulace závěru testu
Co je to p-value?
T(X), jestliže platí H0
Nezamítáme H0
Zamítáme H0
p-value
α
µ =0
C
1,64
xOBS=2,17
p-value je pravděpodobnost, že testová statistika bude
alespoň tak „extrémní“ jako pozorovaná hodnota.
Jak určujeme p-value?
1.Alternativní hypotéza ve tvaru „<“ (ve prospěch
nízké hodnoty testové statistiky)
p-value = F0(xOBS)
alternativy svědčí
2. Alternativní hypotéza ve tvaru „>“ (ve prospěch alternativy svědčí
vysoké hodnoty testové statistiky), pak je kritický obor vymezen
jako:
p-value = 1-F0(xOBS)
3. Alternativní hypotéza ve tvaru „≠“ (ve prospěch alternativy svědčí
extrémně nízké nebo extrémně vysoké hodnoty testové statistiky) –
POZOR! Lze použít pouze při symetrickém nulovém
rozdělení!!!!
p-value = 2.min{F0(xOBS) ;1-F0(xOBS)}
Jak rozhodujeme pomocí p-value?
T(X), jestliže platí H0
Nezamítáme H0
Zamítáme H0
p-value
α
µ =0
C
1,64
xOBS=2,17
α>p-value
α<p-value
zamítáme H0
nezamítáme H0
α>p-value
α<p-value
zamítáme H0
nezamítáme H0
P-value je nejvyšší hladina významnosti na níž
nezamítáme nulovou hypotézu.
•
• P-value je nejnižší hladina významnosti na níž
zamítáme nulovou hypotézu.
Rozhodování na klasických hladinách
významnosti (0,05 a 0,01)
Zamítáme H0
Nerozhodná oblast
0,01
Nezamítáme H0
0,05
p-value