Transcript slaidid

Katseandmete analüüs
I osa
http://www.ut.ee/~tammarut/stat.htm
Vanemuise 46-202
Alustamine
Tunnuste lisamine ja kopeerimine
Väärtustele ridade lisamine ja
kopeerimine
t-testid, parameetrilised korrelatsioonid
mitteparameetrilised testid
tunnuse jaotuse kontrollimine
Tunnuse väärtustest histogrammi koostamine
Kahe pideva tunnuse omavahelise seose
joonis
Faktortunnuse erinevate tasemete vaheliste
jooniste koostamine
Andmete sisestamine
Sorteerimine
Arvutamine:
nt. logaritmimiseks:
v3=log(v2)
või eri tunnuste
kombineerimiseks:
v5=‘kaal’/’vanus’
Tunnuste selekteerimine:
Tools >...Include cases:
sugu=‘isane’
and vanus=4
Sama teeb ka nupp:
File > New...
Tunnusenimed: double-click nimereale
Kirjeldavad statistikud
Statistics >
Basic statistics and tables >
Descriptive statistics > Advanced
Märgi ära huvipakkuvad statistikud, nt:
keskväärtus (Mean)
mediaan (Median)
mood (Mode)
standardhälve (Standard Deviation (SD))
dispersioon (Variance)
standardviga (Std. err. of mean (SE))
usalduspiirid (Conf. Limits for mean)
variatsioonikoefitsient (Coefficient of Variation; Stat.7 puudub)
kvartiilid (Lower and upper quartiles)
Histogramm
Graphs > Histograms >
Advanced
Variables: vali uuritav tunnus
Graph type: regular / multiple / double-Y
7
30%
6
Fit type: Off / Normal / ...
5
20%
4
15% 15%
3
No of obs
Show percentages (% tulpade kohale)
5
10%
2
5% 5%
1
emaste kaal
isaste kaal
4
0
1
2
3
4
5
6
7
Statistics: Descriptive (Kirjeldavad
3
statistikud joonisele)
12
50%
2
No of obs
10
Intervals: Categories... (Tulpade arvu
8
1
6
No of obs
4
2
0
muutmine)
0
15%
1
15%
10%
10%
SELECT
CASES
2
Sel Cond
3
4
5
6
7
T-test
Statistics >
Basic statistics and tables >
t-test, independent, by groups
Meid huvitavad statistikud:
t-value
df
p
3.59
18
0.002
7
Mean
Mean±SE
Mean±SD
6
5
4
kaal
3
2
1
0
emane
isane
T-testi aken
Variables: Vali uuritavad tunnused
Dependent e sõltuv e response-tunnus
(t-testis tunnus, mille erinevust testitakse)
Independent e sõltumatu e faktortunnus
(t-testis grupid, mida omavahel võrreldakse)
Quick
Advanced Options
Summary (testitulemused) Levene’s test
(dispersioonide
Box plot (graafik)
erinevuse testimine)
Categorized Normal Plots
(normaaljaotuse testimine)
7
Mean
Mean±SE
Mean±SD
6
kaal
5
4
Eelduste testimiseks
3
2
1
0
emane
isane
Ühesuunaline ANOVA (dispersioonanalüüs)
Statistics >
ANOVA > One-way ANOVA
Variables: Vali sõltuv ja sõltumatu (grupeeriv) muutuja;
Vajuta OK > All effects (tulemuste tabel)
> More results > Summary > Whole model R
(Adjusted R2 - mudeli seletusvõime näitaja)
Effect
SS
Intercept
194.94
vanus
Error
MS
F
1
194.94
96.62
<0.0001
23.7
2
11.85
5.87
0.012
34.3
17
2.02
ndf (mudeli
vabadusastmed)
d.f.
ddf (vea
vabadusastmed)
p
Eelduste testimine:
More results>Assumptions
Plot means vs std deviations
Mitteparameetriline ANOVA
8
 Mediaanitest
 Kruskal-Wallise ANOVA
6
kaal
Statistics >
Nonparametrics >
Comparing multiple independent samples
Median
25%-75%
Min-Max
7
5
4
3
2
1
0
emane
Summary: Kruskal-Wallis ANOVA & Median Test
Multiple comparisons of mean ranks (mis grupid erinesid?)
Tulemused (meid huvitavad H, N ja p):
Kruskal-Wallis ANOVA by Ranks; kaal (Näidisandmed)
Independent (grouping) variable: sugu
Kruskal-Wallis test: H ( 1, N= 20) =7.179669 p =0.0276
isane
Korrelatsioonid
Pearson (parameetriline)
r(X,Y)
0.61
Statistics >
Basic stat > Correlation matrices
r2
0.37
t
3.28
p
0.0042
N
20
Options:
Display detailed table of results
Spearman (mitteparameetriline)
Statistics >
Nonparametrics >
Correlations
Compute: Detailed report
Spearman R
vanus
& kaal
N
Spearman
t(N-2)
P-level
R
20
0.59
3.12
0.0059
Lineaarne regressioon
Statistics >
Advanced Linear/Nonlinear Models >
General Linear Models >
Simple regression (1 sõltumatu muutuja)
või Multiple regression (>1 sõltumatu muutuja)
või Factorial regression (>1 sõltumatu muutuja + koosmõjud)
Variables: vali sõltuv ja
sõltumatu (predictor e ennustav) muutuja
OK
Whole Model R (Mudeli üldise seletusvõime hindamiseks):
Multiple Multiple
R
R2
Adjusted
R2
0,89
0,75
0,79
SS
df
MS
Model Model Model
148,34
3
49,45
SS
df
MS
Resid. Resid. Resid.
38,86
16
2,43
All effects (Erinevate sõltumatute tunnuste
mõju hindamiseks):
SS
d.f
MS
F
p
Intercept
147,7466
1
147,7466
60,82710
0,000001
Vanus
45,7470
1
45,7470
18,83399
0,000507
Kaal
9,6427
1
9,6427
3,96990
0,063666
Vanus*kaal
7,1408
1
7,1408
2,93988
0,105718
Error
38,8634
16
2,4290
F
20,36
p
0,00010
Eelduste paikapidavuse hindamine:
Jääkide jaotus: Resids > Residuals
Regressioonivõrrand:
y = a + bx
5
Report > Pred.equation
Või:
Graphs > Scatterplots >
Advanced (linnuke Regression
equation ette)
Jääkide sõltuvus keskväärtustest:
Või:
Resids > Obs & Resids
More results > Coefficients
(„Param.“ lahtrist saate
algoordinaadi ja b)
No. of obs.
4
3
2
1
0
-6
-5
-4
-3
-2
-1
0
1
2
3
4
5
X <= Category Boundary
5
4
3
Raw Residuals
2
1
0
-1
-2
-3
-4
-5
0
1
2
3
4
5
6
Observ ed Values
7
8
9
10
11
Graafik regressiooni & korrelatsiooni illustreerimiseks
Graphs > Scatterplots > Advanced
Korrelatsiooni puhul
vali statistikud (Statistics > Corr. and p),
Regressiooni puhul
regressioonivalem (Statistics > Regression (fit) equasion) ja
regressioonisirge usalduspiiridega (Regression bands > Confidence)
Konditsioon = 9,16 - 1,12 * kaal;
0,95 Conf.Int.
12
r2 = 0,3891;
r = -0,6238;
p = 0,0033
10
8
Negatiivne
seos
6
4
Kondit sioon
2
0
0
1
2
3
4
kaal
5
6
7
8
Mitmesuunaline (Multiway) ANOVA
Kaks (või rohkem) faktortunnust
Statistics > ANOVA >
Factorial ANOVA
Variables > Vali 1 sõltuv muutuja ja
vähemalt 2 sõltumatut faktorit
OK > All effects
SS
d.f
MS
F
p
Intercept
768,15
1
768,15
136,85
sugu
0,04
1
0,04
0,01
0,94
vanus
0,24
1
0,24
0,04
0,84
sugu*vanus
97,15
1
97,15
17,3
0,00074
Error
89,81
16
5,61
<0,0001
Joonis 2 faktori interaktsiooni illustreerimiseks
1. ANOVA tulemusteaknas All effects/Graphs
2. Kliki interaktsiooni-rida aktiivseks > OK
F(1, 16)=17,308, p=,00074
Veresuhkur
14
13
12
11
10
9
8
7
6
5
4
3
2
1
sinine
punane
emane
isane
ANCOVA e. Kovariatsioonanalüüs
Statistics >
Advanced Linear/Nonlinear Models >
General Linear Models >
Analysis of covariance
SS
d.f.
MS
Variables > Vali sõltuv
tunnus, huvialune
faktortunnus ja pidev
kovariaat
OK > All effects
F
p
Intercept
423,20
1
423,20
115,67
<0,0001
kaal
125,00
1
125,00
34,16
<0,0001
sugu
52,16
1
52,16
14,25
0,0015
62,20
17
3,66
Error
LS Means e. kovariaadi mõjust puhastatud keskmised:
ANCOVA tulemusteaknas:
Means > Least squares means
sugu; LS Means;
0,95 confidence intervals
Current effect: F(1, 17)=14,255, p=,00151
Veresuhkur
11
10
9
8
7
6
5
4
3
2
1
emane
isane
sugu
veresuhkur
mean
emane
7,915385
isane
3,684615
Graafiku toimetamine
Double-click graafiku peal avab toimetamise akna
Skaala muutmine: Axis scaling (X või Y) > Mode >
Manual Edit step > Mode > Manual
Tunnusenime muutmine: Axis title (X või Y)
Tulpade muutmine: Plot Bars (tulpade värv ja muster)
Plot Histogram (tulpade arv ja vahed)
Graafikule kirjutamine:
Menüüribast Insert > Text > joonisele ilmub kast
„Custom text“, mida saab toimetada.
Graafiku toimetamine
Soovitud väärtuste märkimiseks joonisel:
graafiku toimetamise aknas:
Axis: Scale values (“linnuke” custom labels ette)
> Edit custom labels...
Kirjuta lisatavad väärtused ja neile vastavad tekstid, “linnuke” Grid ette
ja toimeta märkimisjoon silmatorkavamaks:
Gridlines...
Toimetatud graafiku Word-i saamiseks klõps parema hiireklahviga ja
Copy graph (ja Paste Word-is)
või
Save graph (.wmf, .jpg formaadis ja
Insert > Picture > From file Word-is)
Tulemuste toortabeli Word-i saamiseks kopeeri ja kleebi Report aknast.
Andmete importimine ja eksportimine
Kopeerimine ja kleepimine teisest programmist.
Importimine Exelist:
File > Open... > Import selected
sheet to a workbook
Eksportimine teistesse formaatidesse (tekstifail, SPSS,
SAS, LOTUS, .pdf):
File > Save as... > soovitavaks formaadiks
kohandamise dialoogaken, nt. Exeli puhul...
Tulemuste haldamine
File > Output Manager > …
1. Workbook – kõik analüüsid, joonised, jne
paigutatakse ühte kausta, mida on
lihtne sirvida
2. Report – kõik tulemid paigutatakse ühte tekstifaili,
mida on vajadusel kerge toimetada ja kuhu
saab lisada omapoolseid kommentaare,
märkuseid, vms (workbook seda ei võimalda)
Tulemused paigutatakse Workbook’i
Tulemused paigutatakse Report’i