PDPL IRB Ilakovac - Katedra za medicinsku informatiku

Download Report

Transcript PDPL IRB Ilakovac - Katedra za medicinsku informatiku

STATISTIČKI TESTOVI I RAZINA ZNAČAJNOSTI

dr.sc. Vesna Ilakovac, znanstveni suradnik Katedra za biofiziku, medicinsku statistiku i medicinsku informatiku Medicinski fakultet Osijek

PDDS MOLBIO 1

OSNOVNI POJMOVI

STATISTIČKI TEST

– postupak pomoću kojeg se dolazi do odluke o prihvaćanju ili odbacivanju statističke hipoteze uz određenu vjerojatnost

STATISTIČKA HIPOTEZA

– izjava (tvrdnja) o nekoj karakteristici populacije koju prihvaćamo ili odbacujemo na osnovu informacija dobivenih iz prikupljenih podataka

NUL-HIPOTEZA (H 0 ) – H 1 –

polazna hipoteza koja se testira alternativna hipoteza, negacija H 0 PDDS MOLBIO 2

POSTUPAK STATISTIČKOG TESTIRANJA

1.

postavljanje nul-hipoteze

npr.

H 0 .....

m

1 =

m

2

 parametri populacija iz kojih su uzorci uzeti su jednaki  uzorci pripadaju istoj populaciji PDDS MOLBIO 3

POSTUPAK STATISTIČKOG TESTIRANJA

2.

testiranje

izračunavanje odgovarajuće test statistike i određivanje vjerojatnosti da su razlike u ocjenama parametara (x 1 vrijednost) i x 2 ) slučajne (p PDDS MOLBIO 4

POSTUPAK STATISTIČKOG TESTIRANJA

3.

donošenje odluke

o odbacivanju H 0 (prihvaćanju H 1 ) ili prihvaćanju H 0 (odbacivanju H 1 )

na određenoj razini značajnosti

PDDS MOLBIO 5

POGREŠKE PRI ODLUČIVANJU O STATISTIČKOJ HIPOTEZI

STVARNO STANJE

H 0 točna H 1 točna ODLUKA PRIHVATI H 0 ISPRAVNO POGREŠKA TIPA 2 ( b ) ODBACI H 0 POGREŠKA TIPA 1 ( a ) ISPRAVNO PDDS MOLBIO 6

VJEROJATNOSTI POGREŠKE

 najveća vjerojatnost pogreške tipa 1 ( a ) je

razina značajnosti testa

– – najmanja vjerojatnost uz koju još prihvaćamo H 0 kada je

p <

a , test sugerira odbacivanje H 0 (“statistički značajno”) – –

određuje ju istraživač na temelju modela pokusa

uobičajeno se stavlja a = 0.05

PDDS MOLBIO 7

VJEROJATNOSTI POGREŠKE

 najveća vjerojatnost pogreške tipa 2 ( b ) – djelomično je pod kontrolom – – ovisi o:  stvarnom stanju u populaciji  razini značajnosti a  modelu pokusa a i b su inverzno povezane (ali ne direktno) PDDS MOLBIO 8

ODABIR NIVOA ZNAČAJNOSTI

 pitanje štetnih posljedica pogreške: 1.

2.

Odluka/zaključak da razlike postoje onda kada ih u stvarnosti nema može prouzročiti štetne posljedice =>

smanjiti vjerojatnost nastajanja pogreške tipa 1, tj. odabrati manji

a Odluka/zaključak da nema razlike onda kada u stvarnosti razlika postoji može prouzročiti štetne posljedice =>

smanjiti vjerojatnost pogreške tipa 2, tj. odabrati veći

a 9 PDDS MOLBIO

Ispitivanja lijeka X pokazala su da njegovo korištenje izaziva vrlo štetne posljedice te je lijek X povučen iz uporabe. Ispitan je novi alternativni lijek Y i ustanovljeno je smanjenje štetnog utjecaja u odnosu na lijek X. Koju razinu značajnosti treba upotrijebiti za ocjenu značajnosti smanjenja štetnog utjecaja lijeka Y u odnosu na lijek X?

10 PDDS MOLBIO

PDDS MOLBIO

STVARNO STANJE: Oba lijeka jednako su štetna.

ODLUKA: Lijek Y ima manje štetne posljedice od lijeka X.

a

STVARNO STANJE: Lijek Y manje je štetan od lijeka X.

ODLUKA: Lijek Y ima jednako štetne posljedice kao i lijek X.

b 11

a PDDS MOLBIO b 12

Na slučajnom uzorku vozača ispitivan je utjecaj alkohola na vrijeme reagiranja. Mjerenja vremena reakcije prije i nakon konzumacije određene količine alkohola pokazala su prosječno povećanje vremena reakcije nakon konzumacije alkohola. Koju razinu značajnosti treba upotrijebiti za ocjenu značajnosti pronađene razlike?

13 PDDS MOLBIO

PDDS MOLBIO

STVARNO STANJE: Alkohol ne utječe na vrijeme reakcije.

ODLUKA: Alkohol produljuje vrijeme reakcije

a

STVARNO STANJE: Alkohol produljuje vrijeme reakcije.

ODLUKA: Alkohol ne utječe na vrijeme reakcije.

b 14

PDDS MOLBIO a b 15

POSTAVKE DIZAJNA

 općenito testove treba dizajnirati tako da imaju b  a gdje je odabrani b 0.2 ili 0.1  za b = 0.2 , to znači samo 80% šanse da se detektira određena alternativna hipoteza kada je stvarno točna  izraz 100(1 b )% naziva se

(statistička) SNAGA TESTA

PDDS MOLBIO 16

JEDNOSMJERNO I DVOSMJERNO TESTIRANJE

 jednosmjerno testiranje – interes istraživača usmjeren je na promjene u jednom smjeru (npr. povećanje ili smanjenje)  H 0 : m  16 ; H 1 : m > 16  dvosmjerno testiranje – interes istraživača usmjeren je na promjenu u bilo kojem smjeru  H 0 : m = 0 ; H 1 : m  0

Testiranje bi trebalo biti dvosmjerno, osim ako istraživanje posebno ne zahtijeva da se određenom smjeru UNAPRIJED!

promjene usmjere u

17 PDDS MOLBIO

ŠTO JE P-VRIJEDNOST?

 NIJE vjerojatnost istinitosti nul-hipoteze (iako je vrlo slično)  JESTE vjerojatnost dobivanja istih ili ekstremnijih rezultata kada je nul-hipoteza istinita PDDS MOLBIO 18

 statistička značajnost NIJE isto što i klinička važnost  bolje je navesti točnu vrijednost

p

nego “NS” PDDS MOLBIO 19

VIŠESTRUKA TESTIRANJA

 valjanost se smanjuje višestrukim testiranjem – pretpostavimo da uspoređujemo težinu triju nezavisnih skupina ispitanika podvrgnutih različitim tretmanima;  H 0 : m 1  H 1 : m 1  H 2 : m 1  H 3 : m 2 = m 2  m 2  m 3  m 3 = m 3 nul-hipoteza alternativne hipoteze (za k eksperimentalnih grupa moguće je izvršiti k(k-1)/2 ovakve usporedbe) PDDS MOLBIO 20

VIŠESTRUKA TESTIRANJA

 razina značajnosti a može se izraziti kao

vjerojatnost (odbacivanje H 0 kada je H 0 točna)

odnosno

1 – vjerojatnost(ne odbacivanje H 0 kada je H 0 točna) tj. 1-(1-

a

)

u slučaju višestrukih (r) testova to postaje

1 – vjerojatnost(ne odbacivanje svih H 0 kada su sve H 0 točne)

odnosno

1-(1 a ) r 21 PDDS MOLBIO

VIŠESTRUKA TESTIRANJA

 ako je a = 0.05, tada je za

r

višestrukih testova

r

a

r 1 2 3 4 5 6 7 8 9 10 0.050

0.098

0.143

0.185

0.226

0.265

0.302

0.337

0.370

0.401

r

a

r 11 12 13 14 15 16 17 18 19 20 0.431

0.460

0.487

0.512

0.537

0.560

0.582

0.603

0.623

0.642

22 PDDS MOLBIO

Koliko slučajnih značajnih rezultata očekujemo na 20 učinjenih višestrukih testova ako su sve nul-hipoteze istinite uz

a

= 0.05?

U slučaju da su sve nul-hipoteze istinite, uz

a

=0.05

očekujemo 5% značajnih rezultata slučajno => za 20 testova to je 1, tj. očekujemo 1 značajan rezultat kao posljedicu SLUČAJNOSTI !

PDDS MOLBIO 23

VIŠESTRUKA TESTIRANJA

 rješenje: – prilagodba p vrijednosti u cilju održavanja općeg nivoa značajnosti (Bonferroni, Sidak, Hochberg...) – primjena sofisticiranijih metoda analize (npr. ANOVA, multivarijatne metode) 24 PDDS MOLBIO

VIŠESTRUKA TESTIRANJA

 Bonferroni metoda – za r nezavisnih testova

p

corr

= p·r

 npr. za tri nezavisna testa H 1 : m 1 = m 2 H 2 : m 1 = m 3 H 3 : m 2 = m 3 ; ; ; p = 0.017; p = 0.025 ; p = 0.063 ; p corr = 0.051

p corr = 0.075

p corr = 0.189

PDDS MOLBIO 25

PDDS MOLBIO

VIŠESTRUKA TESTIRANJA

AKO MUČITE PODATKE DOVOLJNO DUGO ONI ĆE NAPOSLIJETKU PRIZNATI !!!

26

IZBOR STATISTIČKOG TESTA

Ne ovisi u velikoj mjeri o veličini uzorka nego:    prirodi (tipu) varijabli broju uzoraka (1, 2 ili više) jesu li su uzorci zavisni ili ne PDDS MOLBIO 27

BROJ UZORAKA DVA JEDAN NEZAVISNI NOMINALNA VARIJABLA ORDINALNA ILI KONTINUIRANA KOJA NIJE NORMALNO DISTRIBUIRANA

2 -test Kolmogorov-Smirnov test

2 -test Fisherov egzaktni test Mann-Whitney U test Medijan test KONTINUIRANA NORMALNO DISTRIBUIRANA t-test Studentov t-test ZAVISNI McNemarov test Wilcoxonov test t-test diff.

NEZAVISNI

2 -test VIŠE OD 2 ZAVISNI Cochran Q Stuart-Maxwell POVEZANOST DVIJU

PDDS MOLBIO

VARIJABLI Koef. kontingencije Kappa koef.

Kruskall-Wallis test Friedmanov test Spermanov Kendalov

t r

ANOVA ANOVA za ponavljana mjerenja Pearsonov r

28