SORAH_Neparametrijski_testovi
Download
Report
Transcript SORAH_Neparametrijski_testovi
NEPARAMETRIJSKI TESTOVI
P aram etrijsk e m eto d e: m erljiv i p o d aci
k o ji se n o rm aln o d istrib u iraju
N ep aram etrijsk e m eto d e:
n ije v ažn o d a li rezu ltati p o d ležu
n o rm aln o j rasp o d eli,
često rezu ltati n isu izražen i m ern im
jed in icam a v eć frek v en cijam a
"statistik a slo b o d n a o d d istrib u cije"
"sn ag a" n ep aram etrijsk ih testo v a
<
"sn ag a" p aram etrijsk ih testo v a
Pogodne za:
preliminarna ispitivanja malog broja
merenja
brza izračunavanja (često bez tablica)
raspodela značajno odstupa od
normalne
Mera centralne tendencije: obično medijana
Merilo disperzije: interkvartilni interval
P rim er 1. U tvrđeno je da nivo proteina krvne
plazm e kod 20 m uškaraca i 20 žena iznosi
(m g/100 m L ):
M : 3 2 1 4 3 2 9 13 11 3 18 2 4 6 2
1 8 5 1 14
Ž : 6 5 2 1 7 2 2 11 2 1 1 3 11 3 2
3 2 1 4 8.
K akve inform acije o razlici izm eđu nivoa
ovog proteina kod m uškaraca i žena m ožete
dobiti na osnovu ovih rezultata?
2
M: 1, 1, 1, 2, 2, 2, 2, 3, 3, 3,
4, 4, 5, 6, 8, 9, 11, 13, 14, 18
3,5
8,5
2
Z: 1, 1, 1, 1, 2, 2, 2, 2, 2, 2,
3, 3, 3, 4, 5, 6, 7, 8, 11, 11
5,5
2,5
Rezultati se prikazuju u obliku tablice:
min. niži medijana viši
max
kvartil
kvartil
M: 1
2
3,5
8,5
18
Ž: 1
2
2,5
5,5
11
može i grafički
nesimetrična distribucija metode koje
podrazumevaju normalnu raspodelu nisu
pogodne
medijane slične
interval vrednosti značajno širi za muškarce
proveriti pogodnim testom da li je ta
razlika statistički značajna
Test predznaka (The sign test)
najjednostavnija od svih neparametrijskih
metoda
nalik t-testu
može da se primeni na nekoliko načina
Primer 2. Neki farmaceutski preparat treba da
ima medijanu sadržaja aktivne komponente
od 8%. Ispitivanja uzastopnih šarži dala su
sledeće rezultate:
7,3; 7,1; 7,9; 9,1; 8,0; 7,1; 6,8; 7,3%. Da li se
podaci značajno razlikuju od postulirane
medijane na nivou značajnosti od P = 0,05?
parametrijska metoda → t-test
neparametrijski postupak:
P ( k ) ( nk ) p k q ( n k ) p = q = 1/2
P(6) = 7C6 × (1/2)6 × (1/2)1 = 7/128;
P(7) = 1/128 P(6 ili više "-") = 8/128
- dvosmerni test: P(6 ili više identičnih
znakova) = 16/128 = 0,125 > 0,05
Ne može da se odbaci H0
M ože da se koristi i za poređenje dva seta
rezultata;
da ukaže na trend
P rim er 3. N ivo horm ona u krvnoj plazm i pacijenta
m eren je u isto vrem e tokom 10 dana. D obijeni su
sledeći rezultati:
Dan
1
ng/mL 5,8
2
3
4
5
6
7
8
9
10
7,3
4,9
6,1
5,5
5,5
6,0
4,9
6,0
5,0
Da li ovi rezultati ukazuju na trend u koncentraciji hormona?
Parametrijska metoda: linearna regresiona analiza i
provera da li se nagib dobijene prave značajno
razlikuje od 0
neparametrijska metoda – jednostavnija:
H0: ne postoji trend u rezultatima.
Postupak: podaci se podele u dva jednaka seta, pri
čemu se zadrži njihov redosled:
5,8
7,3
4,9
6,1
5,5
5,5
6,0
4,9
6,0
5,0
+
+
0
+
+
4 rezultata, svi pozitivni
P 4 ista znaka od 4 = 2 × 1/16 = 0,125 > 0,05
H0: nema trenda u rezultatima ne može da se odbaci
na nivou značajnosti od P = 0,05.
T est h om ogen og n iza
(W ald -W olfow itz runs test)
da li pojave im aju "+ " ili " -" znak
da li se ovi znaci javljaju u
sekvenci.
slučajnoj
P rim er 4.
L inearna regresiona jednačina je prim enjena za
podešavanje prave od 12 kalibracionih tačaka. Z naci
rezultujućih y -ostataka u nizu rastućih x -vrednosti
su: + + + + ------+ + . D a li je bolje prihvatiti
krivolinijsko podešavanje tačaka?
Nul-hipoteza: sekvenca + i - znakova je
slučajna.
N = broj "+" znakova = 6
M = broj "–" znakova = 6
broj nizova = 3 (i jedan znak predstavlja niz)
Tablica: na nivou značajnosti od P = 0,05 broj
nizova mora da bude < 4 da bi nulta hipoteza
bila odbačena
ODBACUJEMO NUL-HIPOTEZU
KRIVOLINIJSKA ZAVISNOST
T est ek vivalen tn ih p arova
(W ilcoxon signed rank test)
V ilkoksonov test ekvivalentnih parova =
V ilkoksonov test predznaka i ranga =
V ilkoksonov test ranga sa predznakom
da li su individualna m erenja veća ili m anja
od m edijane, a veličina ovih devijacija se ne
uzim a u obzir;
Primer.
Nivo Pb u krvi (u pg/mL) sedmoro dece iznosi:
104; 79; 98; 150; 87; 136 i 101. Mogu li ovakvi
podaci pripadati istoj populaciji, za koju je
pretpostavljeno da je simetrična, sa medijanom
(srednjom vrednošću) od 95 pg/mL?
Odstupanja od medijane iznose:
9, -16, 3, 55, -8, 41, 6.
Ove vrednosti se poređaju u rastući niz
bez obzira na znak:
3, 6, 8, 9, 16, 41, 55,
a onda im se pridružuju znaci:
3, 6, -8, 9, -16, 41, 55.
Brojevi se onda rangiraju uz zadržavanje predznaka:
1, 2, -3, 4, -5, 6, 7.
Suma pozitivnih rangova = 20
Suma negativnih rangova = 8.
- manja vrednost (8) se poredi sa tabličnom vrednošću
Wilcoxon-ov test sume rangova
poređenje dva nezavisna uzorka koji ne
mogu da budu svedeni na jedan set podataka
Primer:
Uzorak fotografskog otpadnog materijala
analiziran je na sadržaj Ag AAS-metodom i
dobijeni su sledeći rezultati: 9,8; 10,2; 10,7; 9,5
i 10,5 g/cm3. Posle određenog hemijskog
tretmana fotografski otpad je ponovo analiziran
istim postupkom i dobijeni su rezultati: 7,7; 9,7;
8,0; 9,9 i 9,0 g/cm3.
D a li prim enjeni hem ijski tretm an
značajnog sniženja sadržaja A g?
H 0 : D va seta pripadaju istoj populaciji
dovodi
do
prvo: rangiranje svih rezultata:
T1 S1
n 1 n 1 1
2
;
T2 S 2
n 2 n 2 1
2
n 1 = n 2 = 5;
n i (n i + 1) / 2 = 15
T 1 = 3; T 2 = 22 3 se poredi sa tabličnim
vrednostim a (jednosm erni test): T n 4
odbacuje se H 0 da dva seta pripadaju istoj
populaciji tj. hem ijski tretm an sm anjuje sadržaj A g
NEPARAMETRIJSKA ANOVA
Jednofaktorska (više nezavisnih uzoraka):
- (prošireni medijana-test)
- Kruskal-Wallis-ov test: koristi rangove umesto
“sirovih” podataka; “snažniji” od proširenog
medijana-testa
χ2
Više zavisnih uzoraka:
- Friedman-ov test
N ep a ra m etrijsk e reg resio n e m eto d e
n ajjed n o stav n ija tzv . T h eil-o v a "n ep o tp u n a"
m eto d a
P retp o stav k a: serija tačak a (x 1 ,y 1 ), (x 2 , y 2 ) ...
k o je se p o d ešav aju p o m o ću p rav e y = a + b x .
P rv i k o rak : ran g iran je tačak a u n izu rastu ćih
x -v red n o sti.
izraču n av an ja se u v ek v rše sa p arn im b ro jem
tačak a
Za svaki par tačaka (xi, yi) (xj, yj), gde je
j = n/2+i, nagib bij linije koja prolazi kroz te
tačke može da se izračuna kao:
bij = (yj - yi) / (xj - xi).
medijana izračunatih vrednosti predstavlja
nagib regresione prave
Sa ovom vrednošću b izračunavaju se a
vrednosti, koje se zatim poređaju u rastući
niz čija medijana predstavlja najbolju
izračunatu vrednost odsečka na y-osi.
Theil-ova potpuna metoda:
Nagib se računa kao medijana nagiba za svaki
par tačaka (1 ≤ i, j ≤ n)
odsečak isto kao kod nepotpune metode
više računanja
Prednosti Theil-ovih metoda:
• ne pretpostavljaju greške samo u y-vrednostima
• ne pretpostavljaju normalnu raspodelu grešaka
• neosetljive na ekstremne vrednosti (outliers)
A comparison of best fit lines for data with outliers
(Glaister, P. Int. J. Math. Educ. Sci. Technol. 2005, 36, 110–117)
Kolmogorov-Smirnov-ljev test
Za testiranje normalnosti raspodele
Poredi krivu kumulativne frekvencije sa
krivom pretpostavljene raspodele
Podaci se transformišu u standardnu formu
(izračunavaju se z-vrednosti)
z
x