Transcript slaidid

Katseandmete analüüs II
http://www.ut.ee/~tammarut/stat.htm
2013
Kui osaled vähemalt kolmes praktikumis, siis ei pea analüüsimiseks
kasutatud programmi valdamist eraldi õppejõule tõestama!
Hii-ruut test (2)
Seoste leidmine diskreetsete tunnuste vahel
Sugu
Värv
emane
punane
emane
sinine
isane
sinine
...
...
Basic statistics >
Tables and banners >
Options:
 Expected frequences
 Percentages of total count
 Pearson Chi-square
Summary Frequency Table (Naidisandmed)
sugu(2) x värv(2)
sugu värv
värv
Chi-square: 3.20000, df=1, p=.023
Table:
sinine
punane
Row
Totals
Count
emane
27
20
7
Total Percent
40.00% 14.00%54.00%
Count
isane
23
5
18
Total Percent
10.00% 36.00%46.00%
All Grps
Count
25
25
50
Total Percent
50.00% 50.00%
sugu
emane
isane
All Grps
värv
sinine
13
12
25
värv
punane
13
12
25
Row
Totals
27
23
50
Oodatavad sagedused
(kui assotsiatsiooni ei oleks)
Hii-ruut test (2)
Riskide suhte (odds ratio) arvutamine:
Sinine
Punane
Emane 20(a)
7(b)
Isane
18(d)
5(c)
Riskide suhe =
a/b
= 10.3
c/d
S.t. emaste risk olla sinine on palju kõrgem
kui isaste risk olla sinine
Logistiline regressioon
Binaarse tunnuse sõltuvus pidevast tunnusest
Advanced Linear/Nonlinear Models > Nonlinear estimation >
Quick Logit Regression
OK > Vali binaarne sõltuv ja pidev sõltumatu tunnus
OK > Summary
> Fitted 2D function (graafik + regressioonivõrrand)
Model: Logis tic regres sion (logit)
D ep. v ar:sugu Loss : Max lik elihood
Final los s: 131. 45586928 Chi²( 1)=1.9740 p=. 16004
N =194
C onst .B0
k aal
Es timate
-0. 685960
0.29580
Odds ratio (unit c h) 0.503606
1.34420
Odds ratio (range)
51. 55423
Logistiline regressioon
Binaarse tunnuse sõltuvus pidevast tunnusest
Tõenäosus et kala on
isane
y=exp(2,31+(-0,05)*x)/
(1+exp(2,31+(-0,05)*x))
1
0
10
C:2C:4
C:1
C:5 C:6 C:7
C:3
20
C:8
30
C:9
C:11
C:10
40
C:13
C:12
50
C:18
C:14C:15
C:16C:17 C:19
60
Kaal
70
80
C:20
90 100
Mitmese regressiooni võimalused
General Linear Models > Multiple regression
Regressioonisirge läbi 0-punkti:
Options > No intercept (aktiveerub
peale tunnuste valimist)
Tüüp I vs III:
Options > I või III
ANOVA võimalused
General Linear Models > Factorial ANOVA
Jäägid: Factorial Anova > Resids >
Save
ANOVA võimalused
General Linear Models > Factorial ANOVA
Gruppide paarikaupa võrdlused:
More results >
Post-hoc >
Tukey HSD
Siit vali grupid, mida tahad võrrelda
ANOVA võimalused
General Linear Models > Factorial ANOVA
Juhuslikud ja fikseeritud
faktorid:
General Linear Models >
Factorial ANOVA >
Options > Tüüp III SS-id
> Random factors
(vali juhuslik faktor)
Juhusliku faktori saab määrata vaid eelnevalt analüüsi kaasatud
tunnuste hulgast!
Korduvmõõtmistega ANOVA
ANOVA > Repeated measures ANOVA
Variables: vali sõltuvad ja grupeeriv tunnus
Whithin effects: 4 (s.t. korduvmõõtmiste arv)
Andmetabel peab välja nägema selline (iga rida on üks isend)
parasiitide hulk
(sõltuvad tunnused)
Grupeeriv
tunnus
isend
isend
jne
Korduvmõõtmistega ANOVA
ANOVA > Repeated measures ANOVA
Variables: vali sõltuvad ja grupeeriv tunnus
Whithin effects: 4 (s.t. korduvmõõtmiste arv)
Korduvmõõtmiste arvu
määramine
Siia korduvmõõtmiste
arv (nt 4)
Siia võid kirjutada
korduvmõõdetava
faktori nime (nt aeg,
eksperiment, jne).
Kui sa seda ei määra, siis
ilmub tulemustesse R1
faktor, mis pole iseenesest
vale.
Korduvmõõtmistega ANOVA
ANOVA > Repeated measures ANOVA
Tulemuste tabel:
All Effects:
R epeated Measures Analy s is of Variance (Anov a k orduv naide)
Sigma-res trict ed paramet erization
Ef f ect iv e hy pothes is dec omposit ion
SS
Effect
Intercept
145.0417
0.0417
Toit
Error
5.6667
AEG e.(R1)
0.4583
22.1250
AEG*Toit
Error
1.6667
Degr. of
Freedom
1
1
4
3
3
12
MS
F
145.0417 102.3824
0.0417 0.0294
1.4167
0.1528 1.1000
7.3750 53.1000
0.1389
p
0.000537
0.872158
0.386972
0.000000
Korduvmõõtmistega ANOVA
ANOVA > Repeated measures ANOVA
All Effects/Graphs:
6.0
5.5
5.0
4.5
4.0
3.5
3.0
2.5
2.0
1.5
1.0
0.5
0.0
-0.5
F(3, 12) =53,100, p=,00000
ussikesed
seemned
1
2
3
AEG
4
Mittelineaarne seos
Võtta teiseks sõltumatuks tunnuseks x2
Polynomial regression teeb seda automaatselt
Valemi saad: More results > Report > Print pred. Equation
180
160
Liigirikkus
140
120
100
80
Kumer seos x ja y vahel
60
40
Pildile käib x mitte x2!
20
0
0
2
4
6
8
10 12 14 16 18 20
Ala suurus
y = 62,6 + 16,7x 0,7x2
Peakomponentanalüüs
Multivariate exploratory techniques >
Principal components > (Vali tunnused, mida ühendada) > OK
> Factor coordinates of cases (uued väärtused)
> cases > save case statistics (peakomponent otse
andmetabelisse)
> variables > eigenvectors (uue sirge parameetrid)
110
r = 0,73; N = 10; p = 0,016
100
90
Viljakus
80
70
60
50
40
30
20
10
-5
-4
-3
-2
-1
0
1
Peakomponent (vanus)
2
3
Poisson’i jaotus
12
Jaotuse testimine:
Statistics >
Distribution fitting >
Discrete distributions:
Poisson
*Väga väikese N puhul
testimine mõttetu!
Distribution: Poisson
Chi-Square = 1.58,
df = 5, p = 0,9
10
8
6
4
2
0
0
1
2
3
4
5
6
7
8
9
10
11
Kui p<0,05, siis jaotus erineb
Poissoni omast oluliselt
Grupikeskmiste võrdlemine Poissoni jaotuse puhul:
Advanced lin/nonlin. models >
Generalized linear models >
ANOVA (distribution: Poisson)
12