變異數分析 ANOVA Analysis of Variance 變異數分析 • ANOVA – Analysis of variance. – 一組資料發生總變異,依可能發生變異的來源 分割成幾個部份,測量這些變異來源,可了解 各變異間是否有差異。 ANOVA • 平均數考驗方法 – 變異數分析=平均數差異的統計方法 – 探討類別變項對於連續變項的影響,平均數的差異成 為主要分析重點 – 超過兩個以上的平均數的考驗。 – 運用F考驗來檢驗平均數間的變異量是否顯著的高於隨 機變異量,又稱為變異數分析。 – 平均數間的變異數(組間變異)除以隨機變異得到的 比值(F值),來取代平均數差異與隨機差異的比值(t 或Z值)

Download Report

Transcript 變異數分析 ANOVA Analysis of Variance 變異數分析 • ANOVA – Analysis of variance. – 一組資料發生總變異,依可能發生變異的來源 分割成幾個部份,測量這些變異來源,可了解 各變異間是否有差異。 ANOVA • 平均數考驗方法 – 變異數分析=平均數差異的統計方法 – 探討類別變項對於連續變項的影響,平均數的差異成 為主要分析重點 – 超過兩個以上的平均數的考驗。 – 運用F考驗來檢驗平均數間的變異量是否顯著的高於隨 機變異量,又稱為變異數分析。 – 平均數間的變異數(組間變異)除以隨機變異得到的 比值(F值),來取代平均數差異與隨機差異的比值(t 或Z值)

變異數分析
ANOVA
Analysis of Variance
變異數分析
• ANOVA
– Analysis of variance.
– 一組資料發生總變異,依可能發生變異的來源
分割成幾個部份,測量這些變異來源,可了解
各變異間是否有差異。
ANOVA
• 平均數考驗方法
– 變異數分析=平均數差異的統計方法
– 探討類別變項對於連續變項的影響,平均數的差異成
為主要分析重點
– 超過兩個以上的平均數的考驗。
– 運用F考驗來檢驗平均數間的變異量是否顯著的高於隨
機變異量,又稱為變異數分析。
– 平均數間的變異數(組間變異)除以隨機變異得到的
比值(F值),來取代平均數差異與隨機差異的比值(t
或Z值)
基本名詞
• 實驗單位(experimental unit)=實驗設計中所衡量
的基本對象。
• 因子(factor)=衡量實驗單位的不同條件。
• 水準(level)=各因子所表現出的不同程度。
• 處理(treatment)=各因子的水準之特定組合。
• Example
• 假設將12塊田地予以隨機分成A、B、C三組,其中兩塊
施以甲肥料﹙A﹚與乙肥料﹙B﹚,第三塊田則不施肥
﹙C﹚,其產量結果如下,試求:
– 請問本題之實驗單位﹙experimental unit﹚、因子﹙factor﹚、水
準﹙level﹚為何?
A
B
C
75
74
60
70
78
64
66
72
65
69
68
55
變異數分析的基本假設
• 1.每個反應變數的母體均為常態分配。
• 2.每個母體的變異數均相等。
• 3.抽自各母體的各組隨機樣本互為獨立。
• 一因子變異數分析(one factor ANOVA):
– 只關心一個因子。
• 二因子變異數分析(two factor ANOVA):
– 同時探討兩個因子。
k種處理方式完全隨機化設計的資料結構
• 總變異=組間變異+組內變異(殘差)
• 總平方和=組間平方和+組內平方和(殘差平方和)
• SST=SSB+SSW(SSE)
SStotal=SSb+SSw
• SST:依變項觀察值的變異。全體樣本在依變項得分的變
異情形,即總離均差平方和。。
• SSB:導因於自變項影響的變異。組間離均差平方和。
• SSW:導因於自變項以外的變異,(隨機變異)。組內
離均差平方和。=SSE
• 各離均差平方和平均化後,得到均方和(MS),即為變
異數的概念。
k
nj
k
k
nj
j
i
2
(
X

X
)

n
(
X

X
)

(
X

X
)
j
j
 ij
 j
 ij
2
j
i
2
j
一般情形之完全隨機化設計的ANOVA表
F
F=MSB / MSE
完全隨機化設計的F檢定
H 0 : 1   2     K
F
MSB
 F (k  1, n  k )
MSE
reject H0
Example
•假設將12塊田地予以隨機分成A、B、C三組,其中兩塊施以甲肥料
﹙A﹚與乙肥料﹙B﹚,第三塊田則不施肥﹙C﹚,其產量結果如下,
試求:
•1.請說明ANOVA的基本假設?
•2.建立ANOVA表?
•3.檢定施肥與否對產量是否有影響﹙α=0.05﹚?
•4.本題為one factor ANOVA,or two factor ANOVA?
A
B
C
75
74
60
70
78
64
66
72
65
69
68
55
• Example
– 某工廠欲了解4部機器的性能觀察其每小時產量,得到以下資料:
•
•
•
•
﹙a﹚請問本題之因子﹙factor﹚、水準﹙level﹚為何?
﹙b﹚本題為one factor ANOVA,or two factor ANOVA?
﹙c﹚建立ANOVA表?
﹙d﹚檢定4部機器的產量是否有差異α=0.05﹚[F0.05(3,18)=3.16]?
機器
A
B
C
D
產量
10
14
17
12
15
18
16
15
8
21
14
17
12
15
15
15
17
16
15
15
15
18
• Example
– 我們想了解甘藷的品種之蛋白質含量,今找出常見的三種甘藷品
種,從每品種中任取四塊,並測定其蛋白質含量,得下表。請比
較三種甘藷的蛋白質含量有無差異。 ﹙α=0.05﹚
品種
A
7
8
5
4
B
9
8
6
5
C
10
13
11
10
事前比較(Priori comparison)
•
•
•
基於理論或研究者的特定需求所進行的平均數考驗,
又稱計畫性比較。
事前比較有其特定目的,因此不針對多次比較所累積
的第一類型錯誤的膨脹機率進行校正。
事前比較運用t-test即可: t分數的計算改用是對誤差
較佳的估計值。此時的自由度為N-K,查表D。
t obt 
X1  X 2
 SS1  SS2  1
1 

  
 n1  n2  2  n1 n2 

X1  X 2
1
1 
sW2   
 n1 n2 
事後比較(Posteriori comparison)
•
•
基於統計決策所所進行平均數考驗之後續考驗
(follow-up test)
在獲得顯著的F值之後所進行的多重比較,稱
為事後比較(posteriori comparisons)
• 實驗性錯誤(experiment-wise error):
– 使整個研究的第一類型錯誤維持衡定,此種第一類型
錯誤稱為實驗性錯誤。(如HSD法)。
– 多組比較,用同一個臨界值(基於同一個誤差源)。
• 比較性錯誤(comparison-wise error):
– 關心每一對配對比較的第一類型錯誤的一致性。(如
N-K法)。
– 不同的組合,有不同的臨界值(基於不同的誤差)。
Scheff’s methed
• 事後比較,適用於n不相等的多重比較
• 此一方法對分配常態性與變異一致性兩項假定之
違反頗不敏感,且所犯第一類型錯誤(type I
error)的機率較小。可以說是各種方法中最嚴格、
檢定力最低的一種多重比較。
Scheff’s methed
•Cohen(1996)甚至認為Scheffe執行前不一定要
執行F整體考驗
•因為如果F考驗不顯著,Scheffe考驗亦不會顯著
•但是如果F整體考驗顯著,那麼Scheffe檢定則可以
協助研究者尋找出整體考驗下的各種組合效果
(Y j  Yk ) 2
F
p 1
 1
1 

MS within

 n j nk 


隨機集區設計
(randomized block design)
• 將某影響因子分割成很多集區,成為實驗單位再
隨機分派到不同處置(treatment),每個處置都有
相同集區,進而去除此影響因子對測量值之影響。
• 集區(block)是一些欲控制影響因子之分層,如年
齡,體重,社會經濟地位等。
不同抽菸狀態及孕婦體重與嬰兒之出生體重(克)的關係
處置
集區
(公斤)
不抽
1包/天
1+包/天
總和
平均
45-49
3,175
2,750
1,730
7,655
2,552
50-54
3,232
2,835
2,466
8,533
2,884
55-59
3,240
3,062
2,509
8,811
2,937
60-64
3,420
3,076
2,608
9,104
3,035
65-69
3,459
3,340
2,778
9,577
3,192
70-74
3,515
3,416
2,920
9,851
3,284
總和
20,041
18,479
15,011
53,531
平均
3,340
3,080
2,502
2,974
ANOVA表
來源
平方和
自由度
均方
F檢定
處置
2,213,804
2
1,106,902
41.3
集區
1,037,042
5
207,408
殘餘
267,765
10
26,777
總和
3,518,621
17
將總平方和分割成三部份:來自集區,來自處置,來自殘餘未知部份
• Example
– 從A、B、C三種教學方式的學生中各抽取,之樣本共
20位同學,對其實施測驗,得下表成績與等級,試檢
定三種教學方法是否有差異?
A
B
C
成績
等級
成績
等級
成績
等級
74
7
78
9
68
5
88
15
80
10
83
13
82
12
65
4
50
1
93
19
57
3
91
17
55
2
89
16
84
14
70
6
77
8
94
20
81
11
92
18