Kolmemõõtmeline sagedustabel

Download Report

Transcript Kolmemõõtmeline sagedustabel

Analüüsid diskreetsete muutujatega
Andmed tekivad loendamise, mitte mõõtmise teel.
Ära hakka jõuga allutama pidevate muutujate meetoditele!
emaseid
isaseid
214
131
Ühemõõtmeline sagedustabel, siin 2 x 1,
lahtrite arv reas ei mõjuta mõõtmelisust.
Ühemõõtmelise puhul testime klasside arvukuse suhte erinemist
etteantust, 1:1 või muu:
erineb 1:1 st: (2 = 19,9; p<0,0001), ei erine 0,6:0,4-st,
(2 = 0.59; p=0,44)
Kahemõõtmeline sagedustabel:
uurime seost kahe muutuja vahel:
emaseid
isaseid
musti
59
103
valgeid
155
28
enne uurime, mida tähendab, et seost ei ole.
Arvutame äärejaotused:
emaseid
isaseid
musti
59
103
162 (0.470)
valgeid
155
28
183 (0.530)
214 (0.624)
131 (0.376)
seos puudub kui lahtrite sagedused on rea ja veeru sagduste korrutised
emaseid
isaseid
musti
0.293
0.177
0.470
valgeid
0.331
0.199
0.530
0.624
0.376
Sama absoluutarvudega:
emaseid
isaseid
musti
101
61
162
valgeid
113
70
183
214
131
Oodatavad sagedused juhuks, kui samade äärejaotuste korral seost
poleks, sellises tabelis pole soo ja värvi vahel assotsiatsiooni
(mitte korrelatsioon!), tabel on homogeenne,
homogeensusest hälbimust iseloomustab odds ratio (riskide suhe)
Asi on sama, sõltumata sellest, kumba pidi vaadata, sest:
(a/b)/(a/c) = (a/c)/(b/d) = ab/cd
kui seost pole, on odds ratio 1,
ühe arvuga saab iseloomustada vaid 2x2 tabeli puhul.
Hii-ruut-test kahemõõtmelises tabelis testib reaalse tabeli erinevust
sellisest samade äärejaotustega tabelist, milles seos puudub.
- seega eri asja kui ühemõõtmelises, st assotsiatsiooni
olemasolu.
Loomulikult ei pea kõik arvud võrdsed olema, ka siin ei ole:
200
100
50
25
emaseid
isaseid
musti
59
103
162 (0.470)
valgeid
155
28
183 (0.530)
214 (0.624)
131 (0.376)
emaseid
isaseid
musti
101
61
162
valgeid
113
70
183
214
131
Kahemõõtmeline sagedustabel:
uurime seost kahe muutuja vahel:
emaseid
isaseid
musti
59
103
valgeid
155
28
kahe muutuja vahel on seos, ehk statistiliselt oluline assotsiatsioon,
(2 = 85,0; p<0,0001).
(59/103)/(155/28) = 0.103: musta “risk” olla emane on väiksem.
Hii-ruut-testi eeldus:
ühegi lahtri oodatav sagedus ei tohi olla alla ühe ja
selliseid lahtrid, mille oodatav sagedus on alla viie, ei tohi
olla üle 20%.
emaseid
isaseid
musti
100
100
valgeid
100
1
emaseid
isaseid
musti
100
2
valgeid
2
1
Eelduste suhtes on vähem tundlik analoogiline G-test,
üldse pole tundlik Fisheri test,
viimast saab aga vaid erijuhul kasutada, kui äärejaotused on
kontrollitavad:
emane must
emane valge
isane must
24
8
isane valge
12
16
- vaid 2x2 tabelis.
Kolmemõõtmeline sagedustabel - risttahukas;
hii-ruuduga - kas seos on või mitte, aga sellest vähe!
Log-lineaarne analüüs ja interaktsioonid:
Source
year
sugu
year*sugu
para
year*para
sugu*para
year*sugu*para
DF
Chi-Square
Pr > ChiSq
1
1
1
1
1
1
1
11.81
10.29
4.53
295.32
2.64
45.55
0.21
0.0006
0.0013
0.0334
<.0001
0.1042
<.0001
0.6483
sugu*para:
jaotus parasiteerituteks ja mitteparasiteerituteks pole
soost sõltumatu;
jaotus emasteks ja isasteks pole soost sõltumatu;
sugu*para*aasta:
1) seos aasta ja parasiteerituse vahel pole soost sõltumatu;
2) seos soo ja aasta vahel pole parasiteeritusest sõltumatu;
3) seos soo ja parasiteerituse vahel pole aastast sõltumatu.
Puudub jaotus sõltuvaks ja sõltumatuks muutujaks!
Seepst pole sageli asjalik - mõttetult keeruline
sugu*aasta ei pruugi üldse huvitada!
Enamasti huvitab vaid jaotus ühe tunnuse järgi,
seda uurimegi, võtame sõltuvaks muutujaks,
ülejäänud sõltumatud!
Kui binaarne (kaheväärtuseline)
- logistiline regressioon!
P=exp(bx+k)/(1+exp(bx+k))
log(P/(1-P) = bx+k;
1.0
logit(P) = bx + k.
tõenäosus
0.8
0.6
0.4
0.2
0.0
bx  k
e
P
bx  k
1 e
P=exp(bx+k)/(1+exp(bx+k))
parameetrite tõlgendus (x=0 kohal –k/b):
1.2
1.0
0.8
1.2
1.0
b=1
k=0
0.8
0.6
0.6
0.4
0.4
0.2
0.2
0.0
0.0
-0.2
-10
-6
-2
2
6
1.2
1.0
0.8
0.6
10
-0.2
-10
1.2
b= -1
k=0
1.0
0.8
0.6
b=0,5
k=0
-6
-2
General linear models (ANOVA, ANCOVA....)
ja generalized linear model – muud jaotused,
võimaldab teha samu asju:
-kaasata mitu sõltumatut muutujat;
-kaasata interakstioone;
- nested, repeated, random.
aga palju noorem – pole veel alati programmides;
lisaks binaarsele muutujale vaatleme ühte erijuhtu –
Poissoni jaotusega muutujat.
Loendamise teel saadud väärtus:
- putukaid taimel;
kui vähe - diskreetne;
kui palju - pidev;
vahepeal keerulisem.
Poissoni jaotus:
viskame teri malelauale, uurime, palju ühes ruudus,
vt pilti;
väike müü: erilise kujuga;
suur müü: läheneb normaaljaotusele.
iseloomulik: dispersioon võrdne keskväärtusega.
kui ei ole: underdispersed või overdispersed, bioloogilised põhjused.