SORAH_Neparametrijski_testovi

Download Report

Transcript SORAH_Neparametrijski_testovi

NEPARAMETRIJSKI TESTOVI
 P aram etrijsk e m eto d e: m erljiv i p o d aci
k o ji se n o rm aln o d istrib u iraju
 N ep aram etrijsk e m eto d e:

n ije v ažn o d a li rezu ltati p o d ležu
n o rm aln o j rasp o d eli,

često rezu ltati n isu izražen i m ern im
jed in icam a v eć frek v en cijam a
"statistik a slo b o d n a o d d istrib u cije"
"sn ag a" n ep aram etrijsk ih testo v a
<
"sn ag a" p aram etrijsk ih testo v a
Pogodne za:
 preliminarna ispitivanja malog broja
merenja
 brza izračunavanja (često bez tablica)
 raspodela značajno odstupa od
normalne
Mera centralne tendencije: obično medijana
Merilo disperzije: interkvartilni interval
P rim er 1. U tvrđeno je da nivo proteina krvne
plazm e kod 20 m uškaraca i 20 žena iznosi
(m g/100 m L ):
M : 3 2 1 4 3 2 9 13 11 3 18 2 4 6 2
1 8 5 1 14
Ž : 6 5 2 1 7 2 2 11 2 1 1 3 11 3 2
3 2 1 4 8.
K akve inform acije o razlici izm eđu nivoa
ovog proteina kod m uškaraca i žena m ožete
dobiti na osnovu ovih rezultata?
2
M: 1, 1, 1, 2, 2, 2, 2, 3, 3, 3,
4, 4, 5, 6, 8, 9, 11, 13, 14, 18
3,5
8,5
2
Z: 1, 1, 1, 1, 2, 2, 2, 2, 2, 2,
3, 3, 3, 4, 5, 6, 7, 8, 11, 11
5,5
2,5
Rezultati se prikazuju u obliku tablice:
min. niži medijana viši
max
kvartil
kvartil
M: 1
2
3,5
8,5
18
Ž: 1
2
2,5
5,5
11
 može i grafički
 nesimetrična distribucija  metode koje
podrazumevaju normalnu raspodelu nisu
pogodne
 medijane slične
 interval vrednosti značajno širi za muškarce
 proveriti pogodnim testom da li je ta
razlika statistički značajna
Test predznaka (The sign test)
 najjednostavnija od svih neparametrijskih
metoda
 nalik t-testu
 može da se primeni na nekoliko načina
Primer 2. Neki farmaceutski preparat treba da
ima medijanu sadržaja aktivne komponente
od 8%. Ispitivanja uzastopnih šarži dala su
sledeće rezultate:
7,3; 7,1; 7,9; 9,1; 8,0; 7,1; 6,8; 7,3%. Da li se
podaci značajno razlikuju od postulirane
medijane na nivou značajnosti od P = 0,05?
 parametrijska metoda → t-test
 neparametrijski postupak:
P ( k )  ( nk ) p k q ( n  k ) p = q = 1/2
P(6) = 7C6 × (1/2)6 × (1/2)1 = 7/128;
P(7) = 1/128  P(6 ili više "-") = 8/128
- dvosmerni test: P(6 ili više identičnih
znakova) = 16/128 = 0,125 > 0,05
 Ne može da se odbaci H0
 M ože da se koristi i za poređenje dva seta
rezultata;
 da ukaže na trend
P rim er 3. N ivo horm ona u krvnoj plazm i pacijenta
m eren je u isto vrem e tokom 10 dana. D obijeni su
sledeći rezultati:
Dan
1
ng/mL 5,8
2
3
4
5
6
7
8
9
10
7,3
4,9
6,1
5,5
5,5
6,0
4,9
6,0
5,0
Da li ovi rezultati ukazuju na trend u koncentraciji hormona?
 Parametrijska metoda: linearna regresiona analiza i
provera da li se nagib dobijene prave značajno
razlikuje od 0
 neparametrijska metoda – jednostavnija:
H0: ne postoji trend u rezultatima.
Postupak: podaci se podele u dva jednaka seta, pri
čemu se zadrži njihov redosled:
5,8
7,3
4,9
6,1
5,5
5,5
6,0
4,9
6,0
5,0
+
+
0
+
+
4 rezultata, svi pozitivni
P 4 ista znaka od 4 = 2 × 1/16 = 0,125 > 0,05
H0: nema trenda u rezultatima ne može da se odbaci
na nivou značajnosti od P = 0,05.
T est h om ogen og n iza
(W ald -W olfow itz runs test)
 da li pojave im aju "+ " ili " -" znak
 da li se ovi znaci javljaju u
sekvenci.
slučajnoj
P rim er 4.
L inearna regresiona jednačina je prim enjena za
podešavanje prave od 12 kalibracionih tačaka. Z naci
rezultujućih y -ostataka u nizu rastućih x -vrednosti
su: + + + + ------+ + . D a li je bolje prihvatiti
krivolinijsko podešavanje tačaka?
Nul-hipoteza: sekvenca + i - znakova je
slučajna.
N = broj "+" znakova = 6
M = broj "–" znakova = 6
broj nizova = 3 (i jedan znak predstavlja niz)
Tablica: na nivou značajnosti od P = 0,05 broj
nizova mora da bude < 4 da bi nulta hipoteza
bila odbačena
 ODBACUJEMO NUL-HIPOTEZU
 KRIVOLINIJSKA ZAVISNOST
T est ek vivalen tn ih p arova
(W ilcoxon signed rank test)
V ilkoksonov test ekvivalentnih parova =
V ilkoksonov test predznaka i ranga =
V ilkoksonov test ranga sa predznakom

da li su individualna m erenja veća ili m anja
od m edijane, a veličina ovih devijacija se ne
uzim a u obzir;
Primer.
Nivo Pb u krvi (u pg/mL) sedmoro dece iznosi:
104; 79; 98; 150; 87; 136 i 101. Mogu li ovakvi
podaci pripadati istoj populaciji, za koju je
pretpostavljeno da je simetrična, sa medijanom
(srednjom vrednošću) od 95 pg/mL?
Odstupanja od medijane iznose:
9, -16, 3, 55, -8, 41, 6.
Ove vrednosti se poređaju u rastući niz
bez obzira na znak:
3, 6, 8, 9, 16, 41, 55,
a onda im se pridružuju znaci:
3, 6, -8, 9, -16, 41, 55.
Brojevi se onda rangiraju uz zadržavanje predznaka:
1, 2, -3, 4, -5, 6, 7.
Suma pozitivnih rangova = 20
Suma negativnih rangova = 8.
- manja vrednost (8) se poredi sa tabličnom vrednošću
Wilcoxon-ov test sume rangova
 poređenje dva nezavisna uzorka koji ne
mogu da budu svedeni na jedan set podataka
Primer:
Uzorak fotografskog otpadnog materijala
analiziran je na sadržaj Ag AAS-metodom i
dobijeni su sledeći rezultati: 9,8; 10,2; 10,7; 9,5
i 10,5 g/cm3. Posle određenog hemijskog
tretmana fotografski otpad je ponovo analiziran
istim postupkom i dobijeni su rezultati: 7,7; 9,7;
8,0; 9,9 i 9,0 g/cm3.
D a li prim enjeni hem ijski tretm an
značajnog sniženja sadržaja A g?
H 0 : D va seta pripadaju istoj populaciji
dovodi
do
prvo: rangiranje svih rezultata:
T1  S1 
n 1 n 1  1
2
;
T2  S 2 
n 2 n 2  1
2
n 1 = n 2 = 5;
n i (n i + 1) / 2 = 15
T 1 = 3; T 2 = 22  3 se poredi sa tabličnim
vrednostim a (jednosm erni test): T n  4
 odbacuje se H 0 da dva seta pripadaju istoj
populaciji tj. hem ijski tretm an sm anjuje sadržaj A g
NEPARAMETRIJSKA ANOVA
 Jednofaktorska (više nezavisnih uzoraka):
- (prošireni medijana-test)
- Kruskal-Wallis-ov test: koristi rangove umesto
“sirovih” podataka; “snažniji” od proširenog
medijana-testa
 χ2
Više zavisnih uzoraka:
- Friedman-ov test
N ep a ra m etrijsk e reg resio n e m eto d e
 n ajjed n o stav n ija tzv . T h eil-o v a "n ep o tp u n a"
m eto d a
 P retp o stav k a: serija tačak a (x 1 ,y 1 ), (x 2 , y 2 ) ...
k o je se p o d ešav aju p o m o ću p rav e y = a + b x .
 P rv i k o rak : ran g iran je tačak a u n izu rastu ćih
x -v red n o sti.
 izraču n av an ja se u v ek v rše sa p arn im b ro jem
tačak a
 Za svaki par tačaka (xi, yi) (xj, yj), gde je
j = n/2+i, nagib bij linije koja prolazi kroz te
tačke može da se izračuna kao:
bij = (yj - yi) / (xj - xi).
 medijana izračunatih vrednosti predstavlja
nagib regresione prave
 Sa ovom vrednošću b izračunavaju se a
vrednosti, koje se zatim poređaju u rastući
niz čija medijana predstavlja najbolju
izračunatu vrednost odsečka na y-osi.
Theil-ova potpuna metoda:
 Nagib se računa kao medijana nagiba za svaki
par tačaka (1 ≤ i, j ≤ n)
 odsečak isto kao kod nepotpune metode
 više računanja
Prednosti Theil-ovih metoda:
• ne pretpostavljaju greške samo u y-vrednostima
• ne pretpostavljaju normalnu raspodelu grešaka
• neosetljive na ekstremne vrednosti (outliers)
A comparison of best fit lines for data with outliers
(Glaister, P. Int. J. Math. Educ. Sci. Technol. 2005, 36, 110–117)
Kolmogorov-Smirnov-ljev test
Za testiranje normalnosti raspodele
Poredi krivu kumulativne frekvencije sa
krivom pretpostavljene raspodele
Podaci se transformišu u standardnu formu
(izračunavaju se z-vrednosti)
z
x
