Transcript slaidid
Katseandmete analüüs I osa http://www.ut.ee/~tammarut/stat.htm Vanemuise 46-202 Alustamine Tunnuste lisamine ja kopeerimine Väärtustele ridade lisamine ja kopeerimine t-testid, parameetrilised korrelatsioonid mitteparameetrilised testid tunnuse jaotuse kontrollimine Tunnuse väärtustest histogrammi koostamine Kahe pideva tunnuse omavahelise seose joonis Faktortunnuse erinevate tasemete vaheliste jooniste koostamine Andmete sisestamine Sorteerimine Arvutamine: nt. logaritmimiseks: v3=log(v2) või eri tunnuste kombineerimiseks: v5=‘kaal’/’vanus’ Tunnuste selekteerimine: Tools >...Include cases: sugu=‘isane’ and vanus=4 Sama teeb ka nupp: File > New... Tunnusenimed: double-click nimereale Kirjeldavad statistikud Statistics > Basic statistics and tables > Descriptive statistics > Advanced Märgi ära huvipakkuvad statistikud, nt: keskväärtus (Mean) mediaan (Median) mood (Mode) standardhälve (Standard Deviation (SD)) dispersioon (Variance) standardviga (Std. err. of mean (SE)) usalduspiirid (Conf. Limits for mean) variatsioonikoefitsient (Coefficient of Variation; Stat.7 puudub) kvartiilid (Lower and upper quartiles) Histogramm Graphs > Histograms > Advanced Variables: vali uuritav tunnus Graph type: regular / multiple / double-Y 7 30% 6 Fit type: Off / Normal / ... 5 20% 4 15% 15% 3 No of obs Show percentages (% tulpade kohale) 5 10% 2 5% 5% 1 emaste kaal isaste kaal 4 0 1 2 3 4 5 6 7 Statistics: Descriptive (Kirjeldavad 3 statistikud joonisele) 12 50% 2 No of obs 10 Intervals: Categories... (Tulpade arvu 8 1 6 No of obs 4 2 0 muutmine) 0 15% 1 15% 10% 10% SELECT CASES 2 Sel Cond 3 4 5 6 7 T-test Statistics > Basic statistics and tables > t-test, independent, by groups Meid huvitavad statistikud: t-value df p 3.59 18 0.002 7 Mean Mean±SE Mean±SD 6 5 4 kaal 3 2 1 0 emane isane T-testi aken Variables: Vali uuritavad tunnused Dependent e sõltuv e response-tunnus (t-testis tunnus, mille erinevust testitakse) Independent e sõltumatu e faktortunnus (t-testis grupid, mida omavahel võrreldakse) Quick Advanced Options Summary (testitulemused) Levene’s test (dispersioonide Box plot (graafik) erinevuse testimine) Categorized Normal Plots (normaaljaotuse testimine) 7 Mean Mean±SE Mean±SD 6 kaal 5 4 Eelduste testimiseks 3 2 1 0 emane isane Ühesuunaline ANOVA (dispersioonanalüüs) Statistics > ANOVA > One-way ANOVA Variables: Vali sõltuv ja sõltumatu (grupeeriv) muutuja; Vajuta OK > All effects (tulemuste tabel) > More results > Summary > Whole model R (Adjusted R2 - mudeli seletusvõime näitaja) Effect SS Intercept 194.94 vanus Error MS F 1 194.94 96.62 <0.0001 23.7 2 11.85 5.87 0.012 34.3 17 2.02 ndf (mudeli vabadusastmed) d.f. ddf (vea vabadusastmed) p Eelduste testimine: More results>Assumptions Plot means vs std deviations Mitteparameetriline ANOVA 8 Mediaanitest Kruskal-Wallise ANOVA 6 kaal Statistics > Nonparametrics > Comparing multiple independent samples Median 25%-75% Min-Max 7 5 4 3 2 1 0 emane Summary: Kruskal-Wallis ANOVA & Median Test Multiple comparisons of mean ranks (mis grupid erinesid?) Tulemused (meid huvitavad H, N ja p): Kruskal-Wallis ANOVA by Ranks; kaal (Näidisandmed) Independent (grouping) variable: sugu Kruskal-Wallis test: H ( 1, N= 20) =7.179669 p =0.0276 isane Korrelatsioonid Pearson (parameetriline) r(X,Y) 0.61 Statistics > Basic stat > Correlation matrices r2 0.37 t 3.28 p 0.0042 N 20 Options: Display detailed table of results Spearman (mitteparameetriline) Statistics > Nonparametrics > Correlations Compute: Detailed report Spearman R vanus & kaal N Spearman t(N-2) P-level R 20 0.59 3.12 0.0059 Lineaarne regressioon Statistics > Advanced Linear/Nonlinear Models > General Linear Models > Simple regression (1 sõltumatu muutuja) või Multiple regression (>1 sõltumatu muutuja) või Factorial regression (>1 sõltumatu muutuja + koosmõjud) Variables: vali sõltuv ja sõltumatu (predictor e ennustav) muutuja OK Whole Model R (Mudeli üldise seletusvõime hindamiseks): Multiple Multiple R R2 Adjusted R2 0,89 0,75 0,79 SS df MS Model Model Model 148,34 3 49,45 SS df MS Resid. Resid. Resid. 38,86 16 2,43 All effects (Erinevate sõltumatute tunnuste mõju hindamiseks): SS d.f MS F p Intercept 147,7466 1 147,7466 60,82710 0,000001 Vanus 45,7470 1 45,7470 18,83399 0,000507 Kaal 9,6427 1 9,6427 3,96990 0,063666 Vanus*kaal 7,1408 1 7,1408 2,93988 0,105718 Error 38,8634 16 2,4290 F 20,36 p 0,00010 Eelduste paikapidavuse hindamine: Jääkide jaotus: Resids > Residuals Regressioonivõrrand: y = a + bx 5 Report > Pred.equation Või: Graphs > Scatterplots > Advanced (linnuke Regression equation ette) Jääkide sõltuvus keskväärtustest: Või: Resids > Obs & Resids More results > Coefficients („Param.“ lahtrist saate algoordinaadi ja b) No. of obs. 4 3 2 1 0 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 X <= Category Boundary 5 4 3 Raw Residuals 2 1 0 -1 -2 -3 -4 -5 0 1 2 3 4 5 6 Observ ed Values 7 8 9 10 11 Graafik regressiooni & korrelatsiooni illustreerimiseks Graphs > Scatterplots > Advanced Korrelatsiooni puhul vali statistikud (Statistics > Corr. and p), Regressiooni puhul regressioonivalem (Statistics > Regression (fit) equasion) ja regressioonisirge usalduspiiridega (Regression bands > Confidence) Konditsioon = 9,16 - 1,12 * kaal; 0,95 Conf.Int. 12 r2 = 0,3891; r = -0,6238; p = 0,0033 10 8 Negatiivne seos 6 4 Kondit sioon 2 0 0 1 2 3 4 kaal 5 6 7 8 Mitmesuunaline (Multiway) ANOVA Kaks (või rohkem) faktortunnust Statistics > ANOVA > Factorial ANOVA Variables > Vali 1 sõltuv muutuja ja vähemalt 2 sõltumatut faktorit OK > All effects SS d.f MS F p Intercept 768,15 1 768,15 136,85 sugu 0,04 1 0,04 0,01 0,94 vanus 0,24 1 0,24 0,04 0,84 sugu*vanus 97,15 1 97,15 17,3 0,00074 Error 89,81 16 5,61 <0,0001 Joonis 2 faktori interaktsiooni illustreerimiseks 1. ANOVA tulemusteaknas All effects/Graphs 2. Kliki interaktsiooni-rida aktiivseks > OK F(1, 16)=17,308, p=,00074 Veresuhkur 14 13 12 11 10 9 8 7 6 5 4 3 2 1 sinine punane emane isane ANCOVA e. Kovariatsioonanalüüs Statistics > Advanced Linear/Nonlinear Models > General Linear Models > Analysis of covariance SS d.f. MS Variables > Vali sõltuv tunnus, huvialune faktortunnus ja pidev kovariaat OK > All effects F p Intercept 423,20 1 423,20 115,67 <0,0001 kaal 125,00 1 125,00 34,16 <0,0001 sugu 52,16 1 52,16 14,25 0,0015 62,20 17 3,66 Error LS Means e. kovariaadi mõjust puhastatud keskmised: ANCOVA tulemusteaknas: Means > Least squares means sugu; LS Means; 0,95 confidence intervals Current effect: F(1, 17)=14,255, p=,00151 Veresuhkur 11 10 9 8 7 6 5 4 3 2 1 emane isane sugu veresuhkur mean emane 7,915385 isane 3,684615 Graafiku toimetamine Double-click graafiku peal avab toimetamise akna Skaala muutmine: Axis scaling (X või Y) > Mode > Manual Edit step > Mode > Manual Tunnusenime muutmine: Axis title (X või Y) Tulpade muutmine: Plot Bars (tulpade värv ja muster) Plot Histogram (tulpade arv ja vahed) Graafikule kirjutamine: Menüüribast Insert > Text > joonisele ilmub kast „Custom text“, mida saab toimetada. Graafiku toimetamine Soovitud väärtuste märkimiseks joonisel: graafiku toimetamise aknas: Axis: Scale values (“linnuke” custom labels ette) > Edit custom labels... Kirjuta lisatavad väärtused ja neile vastavad tekstid, “linnuke” Grid ette ja toimeta märkimisjoon silmatorkavamaks: Gridlines... Toimetatud graafiku Word-i saamiseks klõps parema hiireklahviga ja Copy graph (ja Paste Word-is) või Save graph (.wmf, .jpg formaadis ja Insert > Picture > From file Word-is) Tulemuste toortabeli Word-i saamiseks kopeeri ja kleebi Report aknast. Andmete importimine ja eksportimine Kopeerimine ja kleepimine teisest programmist. Importimine Exelist: File > Open... > Import selected sheet to a workbook Eksportimine teistesse formaatidesse (tekstifail, SPSS, SAS, LOTUS, .pdf): File > Save as... > soovitavaks formaadiks kohandamise dialoogaken, nt. Exeli puhul... Tulemuste haldamine File > Output Manager > … 1. Workbook – kõik analüüsid, joonised, jne paigutatakse ühte kausta, mida on lihtne sirvida 2. Report – kõik tulemid paigutatakse ühte tekstifaili, mida on vajadusel kerge toimetada ja kuhu saab lisada omapoolseid kommentaare, märkuseid, vms (workbook seda ei võimalda) Tulemused paigutatakse Workbook’i Tulemused paigutatakse Report’i