Paraméteres és nem paraméteres próbák alkalmazása

Download Report

Transcript Paraméteres és nem paraméteres próbák alkalmazása

Paraméteres és nem
paraméteres próbák alkalmazása
több csoport összehasonlítására
folytonos változók esetén
Dr. Gombos Tímea
SE, III.sz. Belgyógyászati Klinika
Megválaszolandó kérdések
 Különbözik-e egymástól a férfiak és a nők BMIje?
 Változik-e a vércukor szint egy gyógyszeres
kezelés hatására?
 Emelkedik-e a koleszterint szint a kor
előrehaladtával?
 Más-e a vérnyomás a különböző stádiumú
betegekben?
►Létezik-e (szignifikáns) különbség két vagy
több betegcsoport között?
Megfelelő statisztikai próba kiválasztása
 Hány csoportunk van?
2
 3 vagy több
 Függetlenek a mintáink?
 független csoportok – nők vs. férfiak, súlyos vs.
enyhébb betegek
 kapcsolt csoportok –
ua. kezelés előtt vs. kezelés után,
ua. 10 év múlva
valamilyen kritérium alapján előre felállított párok
 Normál eloszlású a minta?
 normál eloszlás → paraméteres teszt
 nem normál eloszlás → nem paraméteres teszt
Paraméteres
 Normál eloszlás
Nem paraméteres
 Nem normál eloszlás esetén
 A próba a tényleges
 A próba sorrendbe állítja az
értékekkel számol
összes értéket, a sorszámokkal
(rangok) számol
 Az orvosi gyakorlatban
viszonylag ritka, de az  Az orvosi gyakorlatban gyakoribb
adatok normál
eloszlásúvá
transzformálhatóak (pl.
logaritmizálás)
Normál eloszlású a mintám?
 Ho – az eloszlás normál
H1 – az eloszlás eltér a
normálistól
► ha a próba szignifikáns,
az eloszlás nem normál
HR_0 = 192*10*normal(x; 80,974; 17,5351)
60
50
40
No of obs
 Hisztogram készítése,
normál görbe
ráfektetése, szemmel
ellenőrzés
 Shapiro-Wilks teszt
Histogram of HR_0
adatbzis_1.sta 21v *195c
30
20
10
0
30
40
50
60
70
80
90
100
110
120
130
140
150
160
 Bizonytalanság esetén? HR_0: SW-W = 0,9351; p = 0,00000
HR_0
tekintsük úgy, mintha nem normál eloszlású lenne a mintánk,
mert ha normál eloszlású adatokon nem parametrikus tesztet
végzünk, gyakorlatilag a parametrikus teszttel azonos
eredményt kapunk, míg fordított esetben ez nem áll fent!
Mintaszám?
Hány csoport?
2 minta
igen
nem
3 vagy több
igen
Független minták?
nem
Normál eloszlású
a minta?
igen
nem
2 mintás t-próba
igen
Páros t-próba
Mann-Whitney t.
Paraméteres
próbák
nem
igen
nem
1 szempontos
AVOVA
Wilcoxon t.
igen
nem
Ismételt méréses
ANOVA
Kruskal-Wallis t.
Friedman próba
Nem paraméteres
próbák
Két mintás t-próba (unpaired T-test)
 Például?
- A férfiak vagy a nők HGB szintje nagyobb? (felt. norm.)
 Két minta átlagát hasonlítja össze – ebből következtetünk a
populáció átlagára
 H0 – a két mintavételi populáció azonos
 H1’ – az egyik mintavételi populáció nagyobb
 H1” – az két mintavételi populáció különböző
 Képlettel számítjuk a t – értéket (minél nagyobb, annál
nagyobb eltérésre utal)
 Táblázatból ismert, hogy adott szabadságfok mellett
mekkora p (probability) érték tartozik hozzá
 Ha a p-érték kellően kicsi – elutasítjuk a H0-t
 Mi a kellően kicsi? – előre meghatározott érték, a
szignifikancia küszöb. Ált. 0,05, vagyis 5%.
 Ha a p ennél kisebb, mondhatjuk, hogy a két populáció
közötti különbség szignifikáns
 A p-érték annak a valószínűsége, hogy elsőfajú hibát
követek el (hibásan utasítom el a H0-t)
 ► p-érték annak a valószínűsége, hogy mégis igaz a H0
Egyoldali vagy két oldali próba (one-tailed, twotailed)
 A kérdés (az alternatív hipotézis) határozza meg melyik
szükséges
 Egyoldali próba – egyirányú eltérést vizsgálok (H1’) pl. az
egyik pop. nagyobb
 Kétoldali próba – kétirányú eltérés (H1”) pl. a két pop.
különbözik
A kétoldali próba! (az ábrán a
 Melyik a „szigorúbb”?
piros)
A STATISTICA eleve kétoldali
próbához tartozó p-értéket ad
meg. Ha a kérdésfeltevésünk
indokolja (lehetővé teszi) az
egyoldali próbát, a kapott pértéket osszuk el kettővel (az
ábrán a kék intervallum)
Elérési útvonal STATISTICA-ban: Statistics // Basic statistics/Tables// t-test,
independent, by groups
A számított statiszika értéke
Degree of freedom,
szabadságfok. A két csoport
esetszáma -2
A kétoldali próbához tartozó
p-érték
Megj.: A t-próba akkor végezhető, ha a két
csoport varianciája megegyezik. Ezt
tesztelhetjük az F-próbával, ennek az
eredménye látható itt. Ha a varianciák
jelentősen különböznek (a próba szignifikáns), a
t-próba helyett Welch-próba (STATISTICA-ban
nem elérhető) vagy nem paraméteres teszt
végzése javasolt.
Mann-Whitney teszt
 Például? –
férfiak vagy a nők BMI-je nagyobb?
 H0 – nincs különbség a két csoport között
Mintaszám?
Hány csoport?
2 minta
igen
nem
3 vagy több
Független minták?
igen
nem
Normál eloszlású
a minta?
igen
nem
2 mintás t-próba
igen
nem
Páros t-próba
Mann-Whitney t.
igen
1 szempontos
AVOVA
Wilcoxon t.
nem
igen
nem
Ismételt méréses
ANOVA
Kruskal-Wallis t.
Friedman próba
Elérési útvonal: Statistics
(felső parancssor) //
Nonparametrics
//Compairing two
independent samples
(groups)
A próba
Ábra készítése
A rangszámösszegből számolt
statisztika értéke és a hozzá tartozó
p-érték
Csoporttól
függetlenül adott
rangszámok
csoportösszege
Ha az egyik csoport minden egyes eleméhez
hozzárendeljük a másik csoport minden egyes
elemét, akkor a két csoport esetszámainak
szorzatával egyenlő számú párt kapunk
(144x50=7200db-t). Az U azt mutatja meg,
hogy hány ilyen párban nagyobb az első érték,
mint a második (+ az egyenlő párok számának
a fele). Ha egyforma lenne a HGB a férfiak és
a nők között, az U 7200/2=3600 lenne.
Boxplot by Group
Variable: HGB_0
200
180
HGB
160
140
120
100
80
1
0
sex
esetszám
Median
25%-75%
Min-Max
Mivel az eredményekből csak nehézkesen
állapítható meg, hogy melyik csoportban
vannak a nagyobb értékek, érdemes
grafikusan ábrázolni.
Páros t-próba
 Például?
- Változott-e egy év elteltével a betegek Na szintje (felt.
norm. eloszlás)
 H0 – a különbségek átlaga = 0
Mintaszám?
Hány csoport?
2 minta
igen
nem
3 vagy több
Független minták?
igen
nem
Normál eloszlású
a minta?
igen
nem
2 mintás t-próba
igen
nem
Páros t-próba
Mann-Whitney t.
igen
1 szempontos
AVOVA
Wilcoxon t.
nem
igen
nem
Ismételt méréses
ANOVA
Kruskal-Wallis t.
Friedman próba
 Elérési útvonal STATISTICA-ban: Statistics // Basic
statistics/Tables // t-test, dependent samples
Itt is lehet ábrát kérni!
A mintapárok közötti különbségeken alapul a t-értéket meghatározó képlet, de
szerepel benne a szórás (SD) is.
Jelen esetben a p-érték nagyobb, mint a küszöb érték, a H0-t nem vetjük el, a
csoportok között nincs különbség.
(Megtévesztő lehet, de akár kis eltérés is lehet szignifikáns, ha az eltérések
szórása kicsi. Könnyen belátható, hogy ha pl. 0,5 az átlagos eltérés, de az a 0,40,6 tartományba esik, az egy jelentős különbség. Míg abban az esetben, ha
ugyancsak 0,5 az eltérések átlaga, de az értékek -1 és 2 között szórnak, akkor
nincs tényleges különbség a két csoport között)
Megj.: hamis eredményt kaphatunk, ha a két mérés nem azonos módszerrel
történik, vagy pl. nem azonos a mértékegység!
Wilcoxon próba
 Például?
- Változott-e egy év elteltével a betegek Na szintje ( nem
norm. eloszlás)
 H0 – a különbségek átlaga = 0
Mintaszám?
Hány csoport?
2 minta
igen
nem
3 vagy több
Független minták?
igen
nem
Normál eloszlású
a minta?
igen
nem
2 mintás t-próba
igen
nem
Páros t-próba
Mann-Whitney t.
igen
1 szempontos
AVOVA
Wilcoxon t.
nem
igen
nem
Ismételt méréses
ANOVA
Kruskal-Wallis t.
Friedman próba
 Elérési útvonal STATISTICA-ban: Statistics // Nonparametrics //
Comparing two dependent samples (variables)
 A próba előjeltől függetlenül rangsorolja a két minta közötti
különbségeket, majd a negatív és a pozitív különbségekhez tartozó
rangokkal számol.
Egyszempontos ANOVA
 Például?
- Különböznek-e egymástól a más-más NYHA stádiumban
lévő szívelégtelen betegek kreatinin szintje? (felt. norm
eloszlást)
Mintaszám?
Hány csoport?
2 minta
igen
nem
3 vagy több
Független minták?
igen
nem
Normál eloszlású
a minta?
igen
nem
2 mintás t-próba
igen
nem
Páros t-próba
Mann-Whitney t.
igen
1 szempontos
AVOVA
Wilcoxon t.
nem
igen
nem
Ismételt méréses
ANOVA
Kruskal-Wallis t.
Friedman próba
ANOVA = Analysis of Variance
Több csoport összehasonlításánál
kézenfekvő, de nem helyes a párokat alkotni
és azokat t-teszttel összehasonlítani.
Ha a csoportok
egy szempont szerint különböznek (pl. betegség
súlyossága)→ egyszempontos ANOVA
több szempontot szerint is vizsgáljuk (pl. betegség
súlyossága és nem) → többszempontos ANOVA
H0 – mindegyik minta ugyanolyan átlagú
sokaságból származik.
A csoportokon belüli és a csoportok közötti
varianciát elemzi
 Elérési útvonal STATISTICA-ban: Statistics // ANOVA // one-way ANOVA
Osztályozó vagy független
változó
Függő változó – a mért
vagy megfigyelt adatok
NYHA_0; LS Means
Current effect: F(3, 190)=14,810, p=,00000
Effective hypothesis decomposition
Vertical bars denote 0,95 confidence intervals
kreat_0
 Ha a teszt
szignifikáns
eredményt ad, a
csoportok közül
legalább az egyik
nem azonos
populációból
származik
 A kísérleti tervtől
függően választott
elemzéssel
meghatározhatjuk,
hogy melyik csoport
különbözik
220
200
180
160
140
120
100
80
60
40
1
2
3
NYHA
4
Kruskal-Wallis próba
 Például?
- Különböznek-e egymástól a más-más NYHA stádiumban
lévő szívelégtelen betegek kreatinin szintje? (nem norm
eloszlás)
Mintaszám?
Hány csoport?
2 minta
igen
nem
3 vagy több
Független minták?
igen
nem
Normál eloszlású
a minta?
igen
nem
2 mintás t-próba
igen
nem
Páros t-próba
Mann-Whitney t.
igen
1 szempontos
AVOVA
Wilcoxon t.
nem
igen
nem
Ismételt méréses
ANOVA
Kruskal-Wallis t.
Friedman próba
Median test – a K-Wt „egyszerűbb”
változata. Ha sok
kiugró érték van,
megbízhatóbb
500
Páronkénti
összehasonlítások
eredményei
400
Elérési útvonal STATISTICA-ban:
Statistics // Nonparametrics //
Comparing multiple indep.
samples
kreat_0
300
200
100
0
1
2
3
NY HA_0
4
Median
25%-75%
Min-Max
Friedman próba
 Például?
- Változik-e a koleszterint szint 5 évenként mérve?
Mintaszám?
Hány csoport?
2 minta
igen
nem
3 vagy több
Független minták?
igen
nem
Normál eloszlású
a minta?
igen
nem
2 mintás t-próba
igen
nem
Páros t-próba
Mann-Whitney t.
igen
1 szempontos
AVOVA
Wilcoxon t.
nem
igen
nem
Ismételt méréses
ANOVA
Kruskal-Wallis t.
Friedman próba
Elérési útvonal STATISTICA-ban: Statistics // Nonparametrics // Comparing
multiple dep. Samples (variables)
Általános vizsgálati szempontok
 Először fogalmazzuk meg a kérdést, ehhez keressük meg a
megfelelő próbát
 Ne csak a p-értéket nézzük, próbáljunk utánagondolni az
eredményeknek (pl. Mann-Whitney tesztnél U). Ábrázoljuk
ellenőrzésképpen grafikusan is!
 Orvosi gyakorlatban leggyakrabban nem paraméteres
teszteket használunk
 A programmal két csoportot könnyen több száz változó
szerint is összehasonlíthatunk (szignifikancia vadászat).
Ilyenkor ne felejtsük el lejjebb vinni a szignifikancia küszöböt
(Bonferroni korrekció). Definícióból adódik, hogy 100 db 0,05
p-értékű tesztnél valószínűleg 5 szignifikáns eltérést mutat
még akkor is, ha a két populáció nem különbözik!
Összefoglalás
folyamatos változók (pl. életkor, se Na)
normál eloszlású
2 független csoport
összehasonlítása
nem normál eloszlású
két mintás t-próba
Mann-Whitney teszt
Basic stat./Tables//T test,
independent, by groups
Nonparametrics//Comparing two
independent samples (groups)
Szignifikánsan különbözik-e a súlyos és nem súlyos betegek vércukor
értéke?
2 kapcsolt csoport
összehasonlítása
(pl. érték kezelés
előtt és kezelés
után)
3 vagy több független
csoport
összehasonlítása
3 vagy több kapcsolt
csoport
összehasonlítása
páros t próba
Wilcoxon teszt
Basic stat./Tables//T test dependent
samples
Nonparametrics//Comparing two
dependent samples (variables)
Megváltozik-e a betegek fehérvérsejt száma a kezelés hatására? Változike a betegek koleszterinszintje 10 év követés alatt?
egy szempontos ANOVA
Kruskal-Wallis teszt
ANOVA//One-way ANOVA//All
effects
Nonparametrics//Compairing
multiple independent samples
(groups)
Van-e különbség a különböző Dukes stadiumú betegek hemoglobin
szintjében?
ismételt méréses ANOVA
Friedman próba
ANOVA//Repeated measures
ANOVA
Nonparametrics//Compairing
multiple dependent samples
(groups)
Az ismételt mérések során változik-e a betegek BMI-je?
Köszönöm a figyelmet!