Chap 5 因子設計簡介 Factorial Design : 對探討多個因子效應的研究,實驗的設計上 安排所有可能的因子水準組合都被測1試過,且實驗順序為隨 機,稱為 因子設計。 因子設計的試驗結果可分析出二種對反應值的影響: 主效應及交互作用。  主效應 (Main Effect):某因子水準的變化對觀察值的影響  因子間的交互作用 (Interaction between the factors):某因子 對反應值的影響狀況隨著另一因子水準的變化而有不同的表 象,此時稱二因子間有交互作用 。

Download Report

Transcript Chap 5 因子設計簡介 Factorial Design : 對探討多個因子效應的研究,實驗的設計上 安排所有可能的因子水準組合都被測1試過,且實驗順序為隨 機,稱為 因子設計。 因子設計的試驗結果可分析出二種對反應值的影響: 主效應及交互作用。  主效應 (Main Effect):某因子水準的變化對觀察值的影響  因子間的交互作用 (Interaction between the factors):某因子 對反應值的影響狀況隨著另一因子水準的變化而有不同的表 象,此時稱二因子間有交互作用 。

Chap 5 因子設計簡介
Factorial Design : 對探討多個因子效應的研究,實驗的設計上
安排所有可能的因子水準組合都被測1試過,且實驗順序為隨
機,稱為 因子設計。
因子設計的試驗結果可分析出二種對反應值的影響:
主效應及交互作用。
 主效應 (Main Effect):某因子水準的變化對觀察值的影響
 因子間的交互作用 (Interaction between the factors):某因子
對反應值的影響狀況隨著另一因子水準的變化而有不同的表
象,此時稱二因子間有交互作用 。
交互作用之例:
A30
20
BB+
A+
52
40
BB+
No interaction
A40
20
A+
12
50
with interaction
反應均值
反應均值
B-
B+
B+
BA-
A+
A-
A+
不同型態交互作用之例:
員工生產力
低
小
50
大
72
高
74
75
低
高
小
50
53
大
52
75
Factorial
低
小
50
大
40
高
55
75
3
交互作用之另一種表示方式:
若二因子皆為數量型因子,且反應值對二因子的關係式可以寫
成下列迴歸式,其圖形稱為反應曲面。
ˆ  b b X b X b X X
Y
0
1
1
2
2
3
1
2
主效應由 b1及 b2決定,交互作用效應由 b3決定;
若 b3=0,無交互作用,反應曲面為一平面,等高線圖是一組平行直線;
ˆ  b b X b X b X X
Y
0
1
1
2
2
3
1
2
若 b3≠0,交互作用是明顯的,如圖。所對應之主效應就沒有
太多的實質意義,此時討論各別的效應可能無多大意義。
Factorial
5
因子設計的優勢 :
(1) 可同時試驗幾種因子自身的效應,比每次試驗一因子的設計
更為有效。
(2) 可得到因子間相互的效應。
(3) 增加各因子重複次數,減少試驗誤差。
(4) 估計一因子在其它因子不同水準下的效應。
Factorial
6
5-3 二因子之因子設計
假設二因子為 A 及 B,各有 a 個及 b 個水準,在所有可能的
ab 個組合下,各重複 n 次試驗, n>1
Model
Yijk = μ + τi +βj+ (τβ)ij + εijk ,
i= 1,...,a, j= 1,…,b
k=1,…,n
εijk ~ N(0, σ2)
μ
τi
βj
(τβ)
整體平均數
因子 A 第 i 項水準的影響力
因子 B 第 j 項水準的影響力
交互效應
 i  0.
 i  0.
註:此設計亦為一 Completely Randomized Design
分析
(1) 檢定因子間的 interaction
T est
H 0 : ( )1  ( ) 2  ...  ( ) ab  0
H1 : ( )i  0 for at least onei
(2) 檢定 main effect
T est
H 0 :  1   2  ...    0
H 1 :   0 for at least one i
T est
H 0 : 1   2  ...    0
H 1 :   0 for at least one i
註 : ANOVA中, SST = SSA + SSB + SSAB + SSE
(3) 檢查模式的適合性
a. 同變異性 (觀察殘差圖)
b. 常態性:Normality test & normal prob. Plot
(4) 當 ANOVA 的結果是顯著時,進一步分析:
Case I、 交互作用不顯著
對各因子,分別執行 multiple comparison
Case II、 交互作用顯著
視情況選擇下列任一分析:
1. 所有因子 A 與 因子 B 的組合間,互作比較。
2. 固定某因子的水準,對另一因子分析。
3. 若二因子皆為數量因子,可尋找觀察值對因子的
關係式
EXAMPLE (3x2 factorial balanced design)
IRS 研究表格複雜程度與交表時間對所得稅作業時間的影響
Factors :複雜程度(3 levels),交表時間(2 levels)
對 6 種組合的處理,各取 3 筆資料 ( 3 replicates)
Data :
Submission Time
Complexity
Early
On time
simple
24
34
32
49
56
39
s. complex
54
40
56
82
70
73
h. complex
56
66
73
93
82
80
(sas報表:Tax_fac, Tax_Normality)
1. ANOVA
ANOVA table for Tax report
Source
sumit
compx
S*C
Error
Total
df
1
2
2
12
17
SS
1984.5
4009
39
676
6708.5
MS
1984.5
2004.5
19.5
56.3
F
35.23
35.58
0.35
P-Value
<.0001
<.0001
0.7142
二因子間的交互作用不顯著,二因子的主效應是顯著的
2. 各組平均數圖形
3. Tukey’s HSD 對對比較
Tukey Grouping
Mean
compx
A
75.000
3
B
62.500
2
C
39.000
1
由 Tukey HSD法知三種表格的作業時間是完全不同的。
4. 模式檢視
對殘差的S-W 檢定之p-值 = 0.1167,資料是一常態資料。
由殘差圖知資料未違背同變異數的假設。
(見附圖)
5. 總結:
(1)資料滿足同變異性及常態性,故可使用 ANOVA。
(2)繳表時間與表格之複雜度對其填表之費時無交互作用。
(3)在不同時間繳交稅表,其填表之費時有顯著不同,提早
繳表者其填表之費時較短,均值分別為48.3及67.3。
(4)三種表格之複雜度對其填表之費時皆有顯著不同,愈複
雜費時愈多,均值分別為39,62.5及75。
(5) 平均費時的估計: ij  yij  t/2;12
56.3
3
(6) 平均費時差異的估計:
i.   j.  yi.  y j.  t/2;12 56.3
2
3
(7)提早繳表使用簡單格式者,費時最少,平均費時30
及時繳表使用高度複雜格式者,費時最多,平均費時85
各狀況之平均費時及標準差如下
Sub time
Complexity
Early
On time
simple
30±5.29
48±8.54
s. complex
50±8.72
75±6.24
h. complex
65±8.54
85±7.00
Factorial
14
附圖
Tests for Normality
Test
Statistic
p Value
Shapiro-Wilk
W
0.913
Pr < W
0.117
KolmogorovSmirnov
D
0.12
Pr > D
>0.150
Cramer-von Mises
Anderson-Darling
WSq
ASq
0.06
0.45
Pr > W>0.250
Sq
Pr > A0.243
Sq
Factorial
15
EXAMPLE 5.1 (3x3 factorial randomize design)
目的 : 1. 研究材質和溫度對電池壽命的影響。
2. 是否有一材質的電池,在任何溫度下,皆保持較長壽命?
Factors : 材質--- 3 levels,溫度--- 3 levels
對 9 種組合的處理,各隨機作 4 次實驗 ( 4 replicates)
Data :
Material
type
1
2
3
130
74
150
159
138
168
15
155
180
188
126
110
160
Temperature
70
34
40
80
75
136
122
106
115
174
120
150
139
125
20
82
25
58
96
82
70
58
70
45
104
60
1. 變異數分析
ANOVA Table
Source
type
tempr
Interaction
Error
Total
df
2
2
4
27
35
SS
10684
39119
9614
18231
77647
MS
5342
19558
2403
675
F
7.91
28.97
3.56
P-Value
0.002
<.0001
0.0186
由 ANOVA table 得到下列結論:
1. 在α=0.05水準下,material types 與 temperatures 之間對壽
命影響的交互作用顯著 (p值=0.0186)。
2. 在α=0.01水準下,material type 和 temperature 對電池壽命
的主效應是顯著的 (p值分別為0.002 及 <0.0001)
2. 模式檢視
a.
對殘差的S-W 檢定之p-值=0.6117,常態機率圖接近一直線,由此
判定資料未違背常態性假設。
b. 由殘差圖來看資料未違背同變異數的假設。
所以,此資料適用 ANOVA 的結果
Tests for Normality
Test
Shapiro-Wilk
Statistic
W
0.976057
p Value
Pr < W
0.6117
Factorial
18
殘差圖
Factorial
19
3. 交互作用
以下是平均數圖 -- (此圖解釋了交互作用現象)
Average Battery Life for different temperature and material
ANOVA 的結果顯示溫度、材質各別地對電池壽命都有影響,但是
因為交互作用的效應也達到顯著,表示主因素的影響是互相牽制
的。對不同材質,溫度對電池壽命的影響是不同的;在不同的溫
度下,各材質的影響也不同。由平均值圖形可明顯地看出來,這
將引導下一步的 multiple comparison。
4. Multiple Comparisons
由於二因子間的交互作用顯著,分析各因子單獨效應是不具
實際意義,可進行所有因子組合的比較,或固定某一因子,
比較另一因子的效應。針對本例,我們進行下面分析:
a) 在固定溫度下,進行不同材質的比較;
b) 對各材質尋找溫度對壽命的影響。
a)、對一固定溫度,比較不同材質下電池壽命之差異
( 使用 ANOVA中的 Linear model, 選 material 為 Classification 變數,
temperature 為 group 變數 )
由Tukey HSD 對對比較法得到:
溫度= 125及15時,在α=0.05下,材質對電池壽命之影響不顯著。
溫度= 70 時,在α=0.05下, type1 之平均壽命最低,與其它二材質有
顯著差異, type2 與 type3 則無顯著差異
溫度 = 15
溫度 = 70
溫度 = 155
Tukey Grouping
Mean
N
Material
Tukey Grouping
Mean
N
Material
Tukey Grouping
Mean
N
Material
A
155.75
4
2
A
145.75
4
3
A
85.50
4
3
A
144.00
4
3
A
119.75
4
2
A
57.50
4
1
A
134.75
4
1
B
57.25
4
1
A
49.50
4
2
Factorial
22
各情況的平均數整理如下表:
材質
溫 度
15
70
a
57.25
a
155
57.5
a
Type 1
134.75
Type 2
155.75 a 119.75 b
49.5 a
Type 3
144a 145.75 b
85.5 a
註:同一溫度,上標字母不同的二組差異顯著
結論:在常溫(70oF)儲存下,Type2與Type3的電池壽命無顯著
差異,且明顯地比Type1長壽, Type1的電池應不是一理想的
電池。整體而言,Type3 的電池是較長壽的。
Factorial
23
b)、針對各材質,研究溫度對電池壽命之影響 (p190)
註: 由平均圖,猜測溫度對電池壽命是一次或二次關係式
(SAS/EG:使用 ANOVA中的 Linear model, ,選 temprt 為
quantitative 變數,material 為 group 變數,模式的選擇含
temprt 之一次及二次)
對各材質,溫度對電池壽命的影響可以下列估計式來表
示 : (依據下二頁報表)
Type1: y = 132 – 0.702 t ,t:溫度,y:壽命
Type2: y = 176 - 0.966 t
Type3: y = 162 - 0.532 t
電池壽命皆隨溫度上升而減少,下降的斜率分別是0.702,
0.966與0.532,Type3的電池壽命是比較穩定的。
Factorial
24
材質 1 (二次不適用,改用一次)
Parameter
Estimate
Intercept
169.3801653
26.39008857
6.42
0.0001
-2.5014463
0.96892047
-2.58
0.0296
0.0128512
0.00674942
1.90
0.0893
temprt
temprt*temprt
Standard Error t Value Pr > |t|
Parameter
Estimate
Standard Error
t Value
Pr > |t|
Intercept
132.3257576
20.02810489
6.61
<.0001
temprt
-0.7022727
0.24081938
-2.92
0.0154
材質 2
(二次不適用,改用一次)
Parameter
Estimate
Standard Error
t Value
Pr > |t|
Intercept
159.6239669
15.74782536
10.14
<.0001
temprt
-0.1733471
0.57818640
-0.30
0.7711
temprt*temprt
-0.0056612
0.00402760
-1.41
0.1934
Parameter
Estimate
Standard Error
t Value
Pr > |t|
Intercept
175.9469697
11.14327180
15.79
<.0001
-0.9659091
Factorial
0.13398751
-7.21
<.0001
temprt
25
材質 3
(二次不適用,改用一次)
Parameter
Estimate
Standard Error
t Value
Pr > |t|
Intercept
132.7623967
18.01817433
7.37
<.0001
0.9028926
0.66154298
1.36
0.2055
-0.0102479
0.00460826
-2.22
0.0532
temprt
temprt*temprt
Parameter
Estimate
Standard Error
t Value
Pr > |t|
Intercept
162.3106061
14.37150465
11.29
<.0001
temprt
-0.5318182
0.17280401
-3.08
0.0117
Factorial
26
Analysis for 2 factorial design
NS
Interaction
AxB
Significant
分別檢定
A B 影響力
固定A
討論 B 之差異
A B 各別的
Multiple comparison
對 A B 所有組合
作對對比較
固定B
討論 A 之差異
Factorial
27
EXAMPLE
教育心理學家想測試學前訓練及父母教育程度這兩個
因素對小孩字彙發展的影響,所以在相同文化歷史背景的孩子當中,
選出 50 個二年級的女學生,接受圖型的字彙測試,測試成績依照此
二因素來分類。結果如下:
Data :
學前訓練
無
有
二人
65
76
94
71
72
87
79
85
96
87
86
83
74
64
父母教育狀況
一人
63
69
94
74
74
78
82
75
72
80
74
75
90
72
Factorial
無
64
60
63
67
87
81
72
77
65
66
66
70
80
88
80
75
78
74
28
 欲檢定學前訓練及父母的教育程度這兩個因素對成績的影響
 在Model內放 nursery 、 parental 及 nursery*parental
 對應於 nursery*parental的 p-值=0.0425,結論是二因素
對成績交互作用顯著
 對應於 nursery的 p-值=0.0231,對應於 parental的 p-值
=0.0011,學前訓練對成績的影響是顯著的,而父母的教育程度
對成績影響是顯著。
 二因素成績平均的圖形可印証交互作用顯著
 未受學前訓練且父母均未受教育的小孩成績顯著比其它小孩
低,其它各組間成績無顯著差異
Factorial
29
訓練 雙親
成績
LSMEAN
no
Least Squares Means for effect 訓練*雙親
Pr > |t| for H0: LSMean(i)=LSMean(j)
Dependent Variable: 成績
0
0
64.4
1
0
1
75. 6
2
0
2
84.5
3
i/
j
1
0
78. 4
4
1
1
1
77.9
5
2
0.0531
1
2
87.0
6
3
0.0167
1.0000
4
0.0035
1.0000
1.0000
5
0.0030
1.0000
1.0000
1.0000
6
0.0006
0.3098
1.0000
1.0000
1
2
3
4
5
6
0.0531
0.0167
0.0035
0.0030
0.0006
1.0000
1.0000
1.0000
0.3098
1.0000
1.0000
1.0000
1.0000
1.0000
Factorial
0.7822
0.7822
30
5.3.7
單一觀察值
當每一狀況只有一觀察值時,資料不足以估計誤差,有下列
二種分析法:
1. 假設 model 為 no interaction model.
Yij = μ + τi +βj+ εij ,
i= 1,...,a,
j= 1,…,b
2. 假設 interaction term 為一特定型式; (τβ)ij = γτiβj
Yij = μ + τi +βj+ γτiβj + εij ,
i= 1,...,a,
j= 1,…,b
分析 : SST = SSA + SSB + SSN + SSE
SSN 是 nonadditivity 交互作用力的平方和, d.f. = 1
EXAMPLE 5.2 (2-factorial with one observation in each cell)
化學產品的雜質受壓力和溫度二因子所影響 .資料如下表 .
Factors : 溫度--- 3 levels, 壓力--- 5 levels
Temperature
100
125
150
25
5
3
1
30
4
1
1
Pressure
35
6
4
3
40
3
2
1
45
5
3
2
解:
ANOVA table
Source
Temp.
Press.
Nonadd.
Error
Total
df
2
4
1
7
14
SS
23.33
11.6
0.0985
1.9015
36.93
MS
11.67
2.9
0.0985
0.2716
F
42.97
10.68
0.36
P-Value
0.0001
0.0042
0.5674
假設 interaction term 為 γτiβj,檢定出壓力和溫度對雜質影響顯著。