Transcript slaidid
Katseandmete analüüs II http://www.ut.ee/~tammarut/stat.htm 2013 Kui osaled vähemalt kolmes praktikumis, siis ei pea analüüsimiseks kasutatud programmi valdamist eraldi õppejõule tõestama! Hii-ruut test (2) Seoste leidmine diskreetsete tunnuste vahel Sugu Värv emane punane emane sinine isane sinine ... ... Basic statistics > Tables and banners > Options: Expected frequences Percentages of total count Pearson Chi-square Summary Frequency Table (Naidisandmed) sugu(2) x värv(2) sugu värv värv Chi-square: 3.20000, df=1, p=.023 Table: sinine punane Row Totals Count emane 27 20 7 Total Percent 40.00% 14.00%54.00% Count isane 23 5 18 Total Percent 10.00% 36.00%46.00% All Grps Count 25 25 50 Total Percent 50.00% 50.00% sugu emane isane All Grps värv sinine 13 12 25 värv punane 13 12 25 Row Totals 27 23 50 Oodatavad sagedused (kui assotsiatsiooni ei oleks) Hii-ruut test (2) Riskide suhte (odds ratio) arvutamine: Sinine Punane Emane 20(a) 7(b) Isane 18(d) 5(c) Riskide suhe = a/b = 10.3 c/d S.t. emaste risk olla sinine on palju kõrgem kui isaste risk olla sinine Logistiline regressioon Binaarse tunnuse sõltuvus pidevast tunnusest Advanced Linear/Nonlinear Models > Nonlinear estimation > Quick Logit Regression OK > Vali binaarne sõltuv ja pidev sõltumatu tunnus OK > Summary > Fitted 2D function (graafik + regressioonivõrrand) Model: Logis tic regres sion (logit) D ep. v ar:sugu Loss : Max lik elihood Final los s: 131. 45586928 Chi²( 1)=1.9740 p=. 16004 N =194 C onst .B0 k aal Es timate -0. 685960 0.29580 Odds ratio (unit c h) 0.503606 1.34420 Odds ratio (range) 51. 55423 Logistiline regressioon Binaarse tunnuse sõltuvus pidevast tunnusest Tõenäosus et kala on isane y=exp(2,31+(-0,05)*x)/ (1+exp(2,31+(-0,05)*x)) 1 0 10 C:2C:4 C:1 C:5 C:6 C:7 C:3 20 C:8 30 C:9 C:11 C:10 40 C:13 C:12 50 C:18 C:14C:15 C:16C:17 C:19 60 Kaal 70 80 C:20 90 100 Mitmese regressiooni võimalused General Linear Models > Multiple regression Regressioonisirge läbi 0-punkti: Options > No intercept (aktiveerub peale tunnuste valimist) Tüüp I vs III: Options > I või III ANOVA võimalused General Linear Models > Factorial ANOVA Jäägid: Factorial Anova > Resids > Save ANOVA võimalused General Linear Models > Factorial ANOVA Gruppide paarikaupa võrdlused: More results > Post-hoc > Tukey HSD Siit vali grupid, mida tahad võrrelda ANOVA võimalused General Linear Models > Factorial ANOVA Juhuslikud ja fikseeritud faktorid: General Linear Models > Factorial ANOVA > Options > Tüüp III SS-id > Random factors (vali juhuslik faktor) Juhusliku faktori saab määrata vaid eelnevalt analüüsi kaasatud tunnuste hulgast! Korduvmõõtmistega ANOVA ANOVA > Repeated measures ANOVA Variables: vali sõltuvad ja grupeeriv tunnus Whithin effects: 4 (s.t. korduvmõõtmiste arv) Andmetabel peab välja nägema selline (iga rida on üks isend) parasiitide hulk (sõltuvad tunnused) Grupeeriv tunnus isend isend jne Korduvmõõtmistega ANOVA ANOVA > Repeated measures ANOVA Variables: vali sõltuvad ja grupeeriv tunnus Whithin effects: 4 (s.t. korduvmõõtmiste arv) Korduvmõõtmiste arvu määramine Siia korduvmõõtmiste arv (nt 4) Siia võid kirjutada korduvmõõdetava faktori nime (nt aeg, eksperiment, jne). Kui sa seda ei määra, siis ilmub tulemustesse R1 faktor, mis pole iseenesest vale. Korduvmõõtmistega ANOVA ANOVA > Repeated measures ANOVA Tulemuste tabel: All Effects: R epeated Measures Analy s is of Variance (Anov a k orduv naide) Sigma-res trict ed paramet erization Ef f ect iv e hy pothes is dec omposit ion SS Effect Intercept 145.0417 0.0417 Toit Error 5.6667 AEG e.(R1) 0.4583 22.1250 AEG*Toit Error 1.6667 Degr. of Freedom 1 1 4 3 3 12 MS F 145.0417 102.3824 0.0417 0.0294 1.4167 0.1528 1.1000 7.3750 53.1000 0.1389 p 0.000537 0.872158 0.386972 0.000000 Korduvmõõtmistega ANOVA ANOVA > Repeated measures ANOVA All Effects/Graphs: 6.0 5.5 5.0 4.5 4.0 3.5 3.0 2.5 2.0 1.5 1.0 0.5 0.0 -0.5 F(3, 12) =53,100, p=,00000 ussikesed seemned 1 2 3 AEG 4 Mittelineaarne seos Võtta teiseks sõltumatuks tunnuseks x2 Polynomial regression teeb seda automaatselt Valemi saad: More results > Report > Print pred. Equation 180 160 Liigirikkus 140 120 100 80 Kumer seos x ja y vahel 60 40 Pildile käib x mitte x2! 20 0 0 2 4 6 8 10 12 14 16 18 20 Ala suurus y = 62,6 + 16,7x 0,7x2 Peakomponentanalüüs Multivariate exploratory techniques > Principal components > (Vali tunnused, mida ühendada) > OK > Factor coordinates of cases (uued väärtused) > cases > save case statistics (peakomponent otse andmetabelisse) > variables > eigenvectors (uue sirge parameetrid) 110 r = 0,73; N = 10; p = 0,016 100 90 Viljakus 80 70 60 50 40 30 20 10 -5 -4 -3 -2 -1 0 1 Peakomponent (vanus) 2 3 Poisson’i jaotus 12 Jaotuse testimine: Statistics > Distribution fitting > Discrete distributions: Poisson *Väga väikese N puhul testimine mõttetu! Distribution: Poisson Chi-Square = 1.58, df = 5, p = 0,9 10 8 6 4 2 0 0 1 2 3 4 5 6 7 8 9 10 11 Kui p<0,05, siis jaotus erineb Poissoni omast oluliselt Grupikeskmiste võrdlemine Poissoni jaotuse puhul: Advanced lin/nonlin. models > Generalized linear models > ANOVA (distribution: Poisson) 12