ANALIZA VARIJANCE ANOVA An o

Download Report

Transcript ANALIZA VARIJANCE ANOVA An o

ANALIZA VARIJANCE
ANOVA
Analysis of variance
Analysis of means using variance
Materijal za kolegij “Statističko učenje”
(prof. dr. sc. Bojana Dalbelo Bašić)
Poslijediplomski studij FER, 19. 04. 2005.
1
Prof. dr. sc. Marija Pecina, Agronomski fakultet Sveučilišta u Zagrebu
ANALIZA VARIJANCE


ANOVA je tehnika upotrebe razlika između
prosjeka uzoraka u zaključivanju o
postojanju (ili ne) razlika između prosjeka
populacija
Jedinstveni postupak kojim je moguće
raščlaniti i procijeniti varijabilnosti
uvjetovane različitim čimbenicima –
izvorima
2
Prof. dr. sc. Marija Pecina, Agronomski fakultet Sveučilišta u Zagrebu
Pretpostavke za
ANOVA-u
– Opažaji (observations) su
normalno distribuirani unutar
svake populacije
– Varijance populacija su jednake –
homogene (homogeneity of
variance or homoscedasticity)
– Opažaji su neovisni
3
Prof. dr. sc. Marija Pecina, Agronomski fakultet Sveučilišta u Zagrebu
ANALIZA VARIJANCE
Svrha:
Usporedba većeg broja prosječnih
vrijednosti odjednom
Nulta hipoteza H0:
prosjeci svih populacija su jednaki
H 0 : 1   2   3  ...   n
H 0 : x1  x2  x3  ...  xn
Alternativna hipoteza H1:
nisu svi prosjeci populacija jednaki
Prof. dr. sc. Marija Pecina, Agronomski fakultet Sveučilišta u Zagrebu
4
ANALIZA VARIJANCE
UKUPNA VARIJABILNOST
između grupa
unutar grupa (error)
5
Prof. dr. sc. Marija Pecina, Agronomski fakultet Sveučilišta u Zagrebu
Kalkulacija:

Definirati Sume kvadrata (Sum of
Squares - SS)





SStotal
SSgrupa
SSerror
Izračunati stupnjeve slobode (degrees
of freedom - df)
Izračunati srednje kvadrate tj.
varijance (mean squares MS) i F
vrijednost
6
Prof. dr. sc. Marija Pecina, Agronomski fakultet Sveučilišta u Zagrebu
Kont.
Kalkulacija SS:
SS total  ( X  X .. ) 2

SS grupa  n X j  X ..

2
SS error  SS total  SS grupa
7
Prof. dr. sc. Marija Pecina, Agronomski fakultet Sveučilišta u Zagrebu
između grupa < unutar grupa
8
Prof. dr. sc. Marija Pecina, Agronomski fakultet Sveučilišta u Zagrebu
između grupa > unutar grupa
9
Prof. dr. sc. Marija Pecina, Agronomski fakultet Sveučilišta u Zagrebu
između grupa > unutar grupa
signifikantno!
10
Prof. dr. sc. Marija Pecina, Agronomski fakultet Sveučilišta u Zagrebu
Zadatak: Jednosmjerna analiza varijance > ANOVA 1
Nulta hipoteza:
H 0 :  A  B
H 0 : x A  xB
grupa A
grupa B
Ukupno
19
23
14
19
15
19
17
21
20
18
Σx
85,0
100,0
185,0

17,0
20,0
18,5
n
5
5
10
11
Prof. dr. sc. Marija Pecina, Agronomski fakultet Sveučilišta u Zagrebu
SS   ( x  x )
grupa A
grupa B
19
23
14
19
15
19
17
21
20
18
Σx
85,0
100,0
185,0

17,0
20,0
18,5
n
5
5
10
2
Ukupno
SSukupno  19  18,5  14  18,5  ...  18  18,5  64,5
2
2
2
SSizmedu. grupa  5  17  18,5  5  20  18,5  22,5
2
2
SSunutar. grupa  19  17   ...  20  17   23  20  ...  18  20  42,0
2
2
2
2
12
Prof. dr. sc. Marija Pecina, Agronomski fakultet Sveučilišta u Zagrebu

x

SS   x 
n
grupa A
grupa B
19
23
14
19
15
19
17
21
20
18
Σx
85,0
100,0
185,0

17,0
20,0
18,5
n
5
5
10
2
2

Ukupno

2
185
SS ukupno  19 2  14 2  ...  182 
 64,5
10
 852 100 2  1852
 
SS izmedu. grupa  

 22,5
5 
10
 5
SS unutar. grupa  SS ukupno  SS izmedu. grupa  64,5  22,5  4213,0
Prof. dr. sc. Marija Pecina, Agronomski fakultet Sveučilišta u Zagrebu
Tablica analize varijance:
= SS : df
Izvori
varijabilnosti
df
SS
s2
F exp
4.29
Ukupno
9
64.5
Između grupa
1
22.5
22.50
Unutar grupa
8
42.0
5.25
= 22.50 : 5.25
Ftab0.05
ns
5.32
Ftab0.01
11.26
očitati iz prvog
stupca i osmog
14
reda F tablica
Prof. dr. sc. Marija Pecina, Agronomski fakultet Sveučilišta u Zagrebu
Zaključak iza F testa u
ANOVA-i 1:




F exp < F tab
H0 se prihvaća
grupe A i B pripadaju istoj populaciji
prosjeci grupa A i B se ne razlikuju
signifikantno
15
Prof. dr. sc. Marija Pecina, Agronomski fakultet Sveučilišta u Zagrebu
grupe A i B grafički
B
B
A
A
14
15
A
16
17
18
A
B
B
A
A
19
20
B
21
B
22
23
16
A - B= Dexp
nsu Zagrebu
Prof. dr. sc. Marija Pecina, Agronomski fakultet Sveučilišta
Jedan dio ukupne varijabilnosti pripada razlikama
između grupa (tretiranje, gnojidba...),
a ostatak varijabilnosti pripada razlikama unutar grupa
(error)
120
100
80
X
60
prinos
40
20
0
Sorta 1
Sorta 2
Sorta 3
Sorta 4
17
Prof. dr. sc. Marija Pecina, Agronomski fakultet Sveučilišta u Zagrebu
PITANJA ... PREDAAAH...
The Biologist, the Statistician, the
Mathematician, and the Computer Scientist
A biologist, a statistician, a mathematician, and a
computer scientist are on a photo-safari in Africa.
They drive out into the savannah in their jeep, stop,
and scour the horizon with their binoculars.
The biologist: "Look! There's a herd of zebras! And
there, in the middle: a white zebra! It's fantastic!
There are white zebras! We'll be famous!"
The statistician: "It's not significant. We only know
there's one white zebra."
The mathematician: "Actually, we know there exists a
zebra which is white on one side."
The computer scientist: "Oh no! A special case!"
18
Prof. dr. sc. Marija Pecina, Agronomski fakultet Sveučilišta u Zagrebu
Podjela pokusa:

prema strukturi tretiranja (članova pokusa)
– jednofaktorijalni
– višefaktorijalni (2 ili 3)

prema strukturi dizajna (osnovni planovi)
– potpuno slučajni raspored
– slučajni blokni raspored
– latinski kvadrat
19
Prof. dr. sc. Marija Pecina, Agronomski fakultet Sveučilišta u Zagrebu
EKSPERIMENTIRANJE - Problemi i ciljevi
koje je moguće riješiti pokusnom tehnikom






hoće li uvođenje nekog novog agrotehničkog
zahvata dati bolji učinak od do tada korištenog
je li nova sorta ili hibrid prinosniji (bolji po kvaliteti i
sl.) od dosadašnjih
u kojem roku sijati ili saditi da se postigne optimalni
rezultat
koji pesticid (ili u kojoj dozi) primijeniti u suzbijanju
različitih štetočinja
koje količine gnojiva treba primijeniti i kojih
formulacija
koji je optimalni sklop (br. biljaka po jedinici
površine) za pojedine kulture
20
Prof. dr. sc. Marija Pecina, Agronomski fakultet Sveučilišta u Zagrebu
Razlog za eksperimentiranje
= varijabilnost eksperimentalnog materijala
Članovi pokusa = Tretiranja
 su planirane promjene čiji se efekti (varijable)
prate i mjere u pokusu
(sorte, hibridi, gnojidbe, sklopovi, gnojiva,
insekticidi, rokovi sjetve/sadnje, obrade tla…)
Varijabla = Svojstvo koje se prati ili mjeri u
pokusu
(prinos i komponente prinosa, sadržaji šećera, suhe
tvari, K, Na, Mg, …, amilaza, sedimentacija,
klijavost, broj korjenovih kvržica, broj štetnika,
napad bolesti, …)
21
Prof. dr. sc. Marija Pecina, Agronomski fakultet Sveučilišta u Zagrebu
Eksperiment = kreacija uvjeta u
kojima istraživač prati promjene


Randomizacija = slučajnost u rasporedu
osigurava objektivnost i jednaku šansu svakom
članu da bude izabran
Repeticija = dio pokusnog medija (površina) u
kojem su zastupljeni svi članovi pokusa
(randomizirani) samo jedanput na jednakoj veličini
osnovne parcele
svrha = kontrola heterogenosti pokusnog medija
(mikrodepresije, plodnost, topografija, prethodna
kultura…) i smanjenje pogreške pokusa
22
Prof. dr. sc. Marija Pecina, Agronomski fakultet Sveučilišta u Zagrebu
Primjer:
VIP projekt (MPŠVG & World bank)
1999-2001.
Optimalna gnojidba – uvjet
ekološki i ekonomski opravdane
poljoprivredne proizvodnje na
obiteljskim gospodarstvima
glavni istraživač:
prof. dr. sc. Mirjana Herak Ćustić
23
Prof. dr. sc. Marija Pecina, Agronomski fakultet Sveučilišta u Zagrebu
VIP projekt
Članovi pokusa:
 negnojeno (kontrola)
 5 kg /m2 stajski gnoj
 50 g/m2 NPK (5:20:30)
 100 g/m2 NPK (5:20:30)
 150 g/m2 NPK (5:20:30)
Elementi pokusa:
 vrsta:
radič
 plan pokusa:
latinski kvadrat 5x5
 lokacije:
Lika

Žumberak
 trajanje:
3 godine
 varijable ili svojstva: prinos, sadržaj minerala (P, K,
Ca, Mg, Fe), nitrata kadmija, olova (u tlu i biljci)
Prof. dr. sc. Marija Pecina, Agronomski fakultet Sveučilišta u Zagrebu
24
25
Prof. dr. sc. Marija Pecina, Agronomski fakultet Sveučilišta u Zagrebu
26
Prof. dr. sc. Marija Pecina, Agronomski fakultet Sveučilišta u Zagrebu
27
Prof. dr. sc. Marija Pecina, Agronomski fakultet Sveučilišta u Zagrebu
28
Prof. dr. sc. Marija Pecina, Agronomski fakultet Sveučilišta u Zagrebu
29
Prof. dr. sc. Marija Pecina, Agronomski fakultet Sveučilišta u Zagrebu
30
Prof. dr. sc. Marija Pecina, Agronomski fakultet Sveučilišta u Zagrebu
POTPUNO SLUČAJNI RASPORED
Completely Randomized Design
(CRD)
* randomizacija
n-1
Izvori
varijabilnosti
Ukupno
Tretiranja
Pogreška
(Error, Ostatak)
SS
MS = SS/n-1
rt-1
SS
t-1
SST
SST / t-1
t (r-1)
SSE =
SS - SST
SSE / t(r-1)
Fexp
MST / MSE
31
Prof. dr. sc. Marija Pecina, Agronomski fakultet Sveučilišta u Zagrebu
SLUČAJNI BLOKNI RASPORED
Randomized Complete Block Design
(RCBD)
*randomizacija
*repeticija (blok=repeticija)
Izvori varijabilnosti
Ukupno
Repeticije
Tretiranja
Pogreška
(Error, Ostatak)
n-1
SS
MS = SS/n-1
(varijance s2)
Fexp
rt-1
SS
r-1
SSR
SSR / r-1
MSR / MSE
t-1
SST
SST / t-1
MST / MSE
(r-1) (t-1)
SSE =
SS-SSR-SST
SSE/(r-1)(t-1)
32
Prof. dr. sc. Marija Pecina, Agronomski fakultet Sveučilišta u Zagrebu
LATINSKI KVADRAT
Latin Square
*randomizacija
(LSQ)
*repeticija vodoravna
*repeticija okomita
n-1
Izvori
varijabilnosti
Ukupno
SS
MS = SS/n-1
(varijance s2)
Fexp
rt-1
SS
Vod.
Repeticije
rv-1
SSRv
SSRv / rv-1
MSRv / MSE
Okom.
Repeticije
ro-1
SSRo
SSRo / rv-1
MSRo / MSE
Tretiranja
t-1
SST
SST / t-1
MST / MSE
Pogreška
(Error,
Ostatak)
(r-2) (t-1) SSE =
SS-SSRv-SSRo-SST
SSE/(r-2) (t-1)
33
Prof. dr. sc. Marija Pecina, Agronomski fakultet Sveučilišta u Zagrebu
PRIMJER računski !!
(SAS ispis)
ANOVA na podacima o sadržaju K2O (‰) u biljci iz pokusa sa 4
gnojidbe (A, B, C i D) na radiču:
data plan;
input tret$ o_rep v_rep var;
cards;
A
1
1
A
3
2
A
2
3
A
4
4
B
2
1
B
1
2
B
4
3
B
3
4
C
3
1
C
4
2
C
1
3
C
2
4
D
4
1
D
2
2
D
3
3
D
1
4
;
47
52
62
51
50
54
67
57
57
53
69
57
54
65
74
59
/* analiza CRD */
proc anova;
class tret o_rep v_rep;
model var = tret;
means tret /lsd alpha =0.05;
run;
/* analiza RCBD */
proc anova;
class tret o_rep v_rep;
model var = tret v_rep;
means tret /lsd alpha =0.05;
run;
/* analiza LSQ */
proc anova;
class tret o_rep v_rep;
model var = tret v_rep o_rep;
means tret /lsd alpha =0.05;
run;
Prof. dr. sc. Marija Pecina, Agronomski fakultet Sveučilišta u Zagrebu
34
The ANOVA Procedure
Class Level Information
Class
Levels
tret
o_rep
v_rep
4
4
4
Number of observations
Values
A B C D
1 2 3 4
1 2 3 4
16
35
Prof. dr. sc. Marija Pecina, Agronomski fakultet Sveučilišta u Zagrebu
The SAS System
10:56 Tuesday, March 22, 2005
3
The ANOVA Procedure CRD
Dependent Variable: var
Source
DF
Model
3
Error
12
Corrected Total 15
R-Square
0.243560
Source
tret
Sum of
Squares
208.0000000
646.0000000
854.0000000
Coeff Var
12.65021
DF
3
Root MSE
7.337120
Anova SS
208.0000000
Mean Square
69.3333333
53.8333333
F Value
1.29
Pr > F
0.3232
F Value
1.29
Pr > F
0.3232
var Mean
58.00000
Mean Square
69.3333333
36
Prof. dr. sc. Marija Pecina, Agronomski fakultet Sveučilišta u Zagrebu
The SAS System
10:56 Tuesday, March 22, 2005
The ANOVA Procedure
6
RCBD
Dependent Variable: var
Source
Model
Error
Corrected Total
R-Square
0.918033
Source
tret
v_rep
DF
6
9
15
Coeff Var
4.808391
DF
3
3
Sum of
Squares
784.0000000
70.0000000
854.0000000
Root MSE
2.788867
Anova SS
208.0000000
576.0000000
Mean Square
130.6666667
7.7777778
F Value
16.80
Pr > F
0.0002
F Value
8.91
24.69
Pr > F
0.0046
0.0001
var Mean
58.00000
Mean Square
69.3333333
192.0000000
37
Prof. dr. sc. Marija Pecina, Agronomski fakultet Sveučilišta u Zagrebu
The SAS System
10:56 Tuesday, March 22, 2005
9
The ANOVA Procedure LSQ
Dependent Variable: var
Source
Model
Error
Corrected Total
R-Square
0.954918
Source
tret
v_rep
o_rep
DF
9
6
15
Sum of
Squares
815.5000000
38.5000000
854.0000000
Coeff Var
4.367438
DF
3
3
3
Mean Square
90.6111111
6.4166667
Root MSE
2.533114
Anova SS
208.0000000
576.0000000
31.5000000
F Value
14.12
Pr > F
0.0022
var Mean
58.00000
Mean Square
69.3333333
192.0000000
10.5000000
F Value
10.81
29.92
1.64
Pr > F
0.0078
0.0005
0.2779
38
Prof. dr. sc. Marija Pecina, Agronomski fakultet Sveučilišta u Zagrebu
Drinking and Eating
Statisticaly Significant
The Japanese eat very little fat and suffer fewer heart attacks than
the British or the Americans.
On the other hand, the French eat a lot of fat and also suffer fewer
heart attacks than the British or the Americans.
The Japanese drink very little red wine and suffer fewer heart
attacks than the British or the Americans.
The Italians drink excessive amounts of red wine and also suffer
fewer heart attacks than the British or the Americans.
Conclusion: Eat and drink whatever you like. It's speaking English
that kills you.
The end
Prof. dr. sc. Marija Pecina, Agronomski fakultet Sveučilišta u Zagrebu
39
THE END !
40
Prof. dr. sc. Marija Pecina, Agronomski fakultet Sveučilišta u Zagrebu