Transcript PDPL IRB Ilakovac - Katedra za medicinsku informatiku
STATISTIČKI TESTOVI I RAZINA ZNAČAJNOSTI
dr.sc. Vesna Ilakovac, znanstveni suradnik Katedra za biofiziku, medicinsku statistiku i medicinsku informatiku Medicinski fakultet Osijek
PDDS MOLBIO 1
OSNOVNI POJMOVI
STATISTIČKI TEST
– postupak pomoću kojeg se dolazi do odluke o prihvaćanju ili odbacivanju statističke hipoteze uz određenu vjerojatnost
STATISTIČKA HIPOTEZA
– izjava (tvrdnja) o nekoj karakteristici populacije koju prihvaćamo ili odbacujemo na osnovu informacija dobivenih iz prikupljenih podataka
NUL-HIPOTEZA (H 0 ) – H 1 –
polazna hipoteza koja se testira alternativna hipoteza, negacija H 0 PDDS MOLBIO 2
POSTUPAK STATISTIČKOG TESTIRANJA
1.
postavljanje nul-hipoteze
npr.
H 0 .....
m
1 =
m
2
parametri populacija iz kojih su uzorci uzeti su jednaki uzorci pripadaju istoj populaciji PDDS MOLBIO 3
POSTUPAK STATISTIČKOG TESTIRANJA
2.
testiranje
izračunavanje odgovarajuće test statistike i određivanje vjerojatnosti da su razlike u ocjenama parametara (x 1 vrijednost) i x 2 ) slučajne (p PDDS MOLBIO 4
POSTUPAK STATISTIČKOG TESTIRANJA
3.
donošenje odluke
o odbacivanju H 0 (prihvaćanju H 1 ) ili prihvaćanju H 0 (odbacivanju H 1 )
na određenoj razini značajnosti
PDDS MOLBIO 5
POGREŠKE PRI ODLUČIVANJU O STATISTIČKOJ HIPOTEZI
STVARNO STANJE
H 0 točna H 1 točna ODLUKA PRIHVATI H 0 ISPRAVNO POGREŠKA TIPA 2 ( b ) ODBACI H 0 POGREŠKA TIPA 1 ( a ) ISPRAVNO PDDS MOLBIO 6
VJEROJATNOSTI POGREŠKE
najveća vjerojatnost pogreške tipa 1 ( a ) je
razina značajnosti testa
– – najmanja vjerojatnost uz koju još prihvaćamo H 0 kada je
p <
a , test sugerira odbacivanje H 0 (“statistički značajno”) – –
određuje ju istraživač na temelju modela pokusa
uobičajeno se stavlja a = 0.05
PDDS MOLBIO 7
VJEROJATNOSTI POGREŠKE
najveća vjerojatnost pogreške tipa 2 ( b ) – djelomično je pod kontrolom – – ovisi o: stvarnom stanju u populaciji razini značajnosti a modelu pokusa a i b su inverzno povezane (ali ne direktno) PDDS MOLBIO 8
ODABIR NIVOA ZNAČAJNOSTI
pitanje štetnih posljedica pogreške: 1.
2.
Odluka/zaključak da razlike postoje onda kada ih u stvarnosti nema može prouzročiti štetne posljedice =>
smanjiti vjerojatnost nastajanja pogreške tipa 1, tj. odabrati manji
a Odluka/zaključak da nema razlike onda kada u stvarnosti razlika postoji može prouzročiti štetne posljedice =>
smanjiti vjerojatnost pogreške tipa 2, tj. odabrati veći
a 9 PDDS MOLBIO
Ispitivanja lijeka X pokazala su da njegovo korištenje izaziva vrlo štetne posljedice te je lijek X povučen iz uporabe. Ispitan je novi alternativni lijek Y i ustanovljeno je smanjenje štetnog utjecaja u odnosu na lijek X. Koju razinu značajnosti treba upotrijebiti za ocjenu značajnosti smanjenja štetnog utjecaja lijeka Y u odnosu na lijek X?
10 PDDS MOLBIO
PDDS MOLBIO
STVARNO STANJE: Oba lijeka jednako su štetna.
ODLUKA: Lijek Y ima manje štetne posljedice od lijeka X.
a
STVARNO STANJE: Lijek Y manje je štetan od lijeka X.
ODLUKA: Lijek Y ima jednako štetne posljedice kao i lijek X.
b 11
a PDDS MOLBIO b 12
Na slučajnom uzorku vozača ispitivan je utjecaj alkohola na vrijeme reagiranja. Mjerenja vremena reakcije prije i nakon konzumacije određene količine alkohola pokazala su prosječno povećanje vremena reakcije nakon konzumacije alkohola. Koju razinu značajnosti treba upotrijebiti za ocjenu značajnosti pronađene razlike?
13 PDDS MOLBIO
PDDS MOLBIO
STVARNO STANJE: Alkohol ne utječe na vrijeme reakcije.
ODLUKA: Alkohol produljuje vrijeme reakcije
a
STVARNO STANJE: Alkohol produljuje vrijeme reakcije.
ODLUKA: Alkohol ne utječe na vrijeme reakcije.
b 14
PDDS MOLBIO a b 15
POSTAVKE DIZAJNA
općenito testove treba dizajnirati tako da imaju b a gdje je odabrani b 0.2 ili 0.1 za b = 0.2 , to znači samo 80% šanse da se detektira određena alternativna hipoteza kada je stvarno točna izraz 100(1 b )% naziva se
(statistička) SNAGA TESTA
PDDS MOLBIO 16
JEDNOSMJERNO I DVOSMJERNO TESTIRANJE
jednosmjerno testiranje – interes istraživača usmjeren je na promjene u jednom smjeru (npr. povećanje ili smanjenje) H 0 : m 16 ; H 1 : m > 16 dvosmjerno testiranje – interes istraživača usmjeren je na promjenu u bilo kojem smjeru H 0 : m = 0 ; H 1 : m 0
Testiranje bi trebalo biti dvosmjerno, osim ako istraživanje posebno ne zahtijeva da se određenom smjeru UNAPRIJED!
promjene usmjere u
17 PDDS MOLBIO
ŠTO JE P-VRIJEDNOST?
NIJE vjerojatnost istinitosti nul-hipoteze (iako je vrlo slično) JESTE vjerojatnost dobivanja istih ili ekstremnijih rezultata kada je nul-hipoteza istinita PDDS MOLBIO 18
statistička značajnost NIJE isto što i klinička važnost bolje je navesti točnu vrijednost
p
nego “NS” PDDS MOLBIO 19
VIŠESTRUKA TESTIRANJA
valjanost se smanjuje višestrukim testiranjem – pretpostavimo da uspoređujemo težinu triju nezavisnih skupina ispitanika podvrgnutih različitim tretmanima; H 0 : m 1 H 1 : m 1 H 2 : m 1 H 3 : m 2 = m 2 m 2 m 3 m 3 = m 3 nul-hipoteza alternativne hipoteze (za k eksperimentalnih grupa moguće je izvršiti k(k-1)/2 ovakve usporedbe) PDDS MOLBIO 20
VIŠESTRUKA TESTIRANJA
razina značajnosti a može se izraziti kao
vjerojatnost (odbacivanje H 0 kada je H 0 točna)
odnosno
1 – vjerojatnost(ne odbacivanje H 0 kada je H 0 točna) tj. 1-(1-
a
)
u slučaju višestrukih (r) testova to postaje
1 – vjerojatnost(ne odbacivanje svih H 0 kada su sve H 0 točne)
odnosno
1-(1 a ) r 21 PDDS MOLBIO
VIŠESTRUKA TESTIRANJA
ako je a = 0.05, tada je za
r
višestrukih testova
r
a
r 1 2 3 4 5 6 7 8 9 10 0.050
0.098
0.143
0.185
0.226
0.265
0.302
0.337
0.370
0.401
r
a
r 11 12 13 14 15 16 17 18 19 20 0.431
0.460
0.487
0.512
0.537
0.560
0.582
0.603
0.623
0.642
22 PDDS MOLBIO
Koliko slučajnih značajnih rezultata očekujemo na 20 učinjenih višestrukih testova ako su sve nul-hipoteze istinite uz
a
= 0.05?
U slučaju da su sve nul-hipoteze istinite, uz
a
=0.05
očekujemo 5% značajnih rezultata slučajno => za 20 testova to je 1, tj. očekujemo 1 značajan rezultat kao posljedicu SLUČAJNOSTI !
PDDS MOLBIO 23
VIŠESTRUKA TESTIRANJA
rješenje: – prilagodba p vrijednosti u cilju održavanja općeg nivoa značajnosti (Bonferroni, Sidak, Hochberg...) – primjena sofisticiranijih metoda analize (npr. ANOVA, multivarijatne metode) 24 PDDS MOLBIO
VIŠESTRUKA TESTIRANJA
Bonferroni metoda – za r nezavisnih testova
p
corr
= p·r
npr. za tri nezavisna testa H 1 : m 1 = m 2 H 2 : m 1 = m 3 H 3 : m 2 = m 3 ; ; ; p = 0.017; p = 0.025 ; p = 0.063 ; p corr = 0.051
p corr = 0.075
p corr = 0.189
PDDS MOLBIO 25
PDDS MOLBIO
VIŠESTRUKA TESTIRANJA
AKO MUČITE PODATKE DOVOLJNO DUGO ONI ĆE NAPOSLIJETKU PRIZNATI !!!
26
IZBOR STATISTIČKOG TESTA
Ne ovisi u velikoj mjeri o veličini uzorka nego: prirodi (tipu) varijabli broju uzoraka (1, 2 ili više) jesu li su uzorci zavisni ili ne PDDS MOLBIO 27
BROJ UZORAKA DVA JEDAN NEZAVISNI NOMINALNA VARIJABLA ORDINALNA ILI KONTINUIRANA KOJA NIJE NORMALNO DISTRIBUIRANA
2 -test Kolmogorov-Smirnov test
2 -test Fisherov egzaktni test Mann-Whitney U test Medijan test KONTINUIRANA NORMALNO DISTRIBUIRANA t-test Studentov t-test ZAVISNI McNemarov test Wilcoxonov test t-test diff.
NEZAVISNI
2 -test VIŠE OD 2 ZAVISNI Cochran Q Stuart-Maxwell POVEZANOST DVIJU
PDDS MOLBIO
VARIJABLI Koef. kontingencije Kappa koef.
Kruskall-Wallis test Friedmanov test Spermanov Kendalov
t r
ANOVA ANOVA za ponavljana mjerenja Pearsonov r
28