事後比較

Download Report

Transcript 事後比較

統計3-4-1
閻自安 講授
目錄
統計檢定表
考驗步驟
基本架構
多重比較
基本原理
SPSS操作實例
基本假設
統計檢定表
檢定變項的相關 or 變項的差異?
檢定變項的相關
檢定變項的差異
接受多次測驗?
是
分析
幾個變項?
2個
2以上
迴歸
相關係數
t檢定 典型或因素
分析
幾個群體?
2個
2以上
相依樣本 相依樣本
ANOVA
t檢定
否
分析
幾個群體?
2個
2以上
獨立樣本 獨立樣本
ANOVA
t檢定
ANOVA的適用
架構
適用
三分變項
背景變項
以上
學歷
個人
音樂智慧
年級
…
學校規模
團體
ANOVA
ANOVA
節奏能力
所在區域
…
類別變項
連續變項
ANOVA的適用
架構
ANOVA
適用
三分變項
以上
實驗變項
音樂智慧
實驗A
實驗B
ANOVA
節奏能力
控制組
類別變項
連續變項
ANOVA的基本原理
one-way ANOVA(analysis of variance)

研究者欲探討類別變項對於連續變項的影響,
平均數的差異成為主要分析重點

自變項超過兩個以上的平均數,運用F考驗來檢驗
平均數間的變異量,是否顯著的高於隨機變異量

2個
變項
則用
T考
驗
例如:自變項—年級(國一、國二、國三)
依變項—節奏能力測驗成績
如果自變項再加入「性別」,則為two-way ANOVA
ANOVA的基本原理
one-way ANOVA(analysis of variance)

原理:以平均數間的變異數(組間變異)除以隨機變異
得到的比值(F值),來取代平均數差異與隨機差異的
比值(t或Z值),可同時檢驗三個平均數的差異。
F=MSb/MSw

F值愈大
平均數
愈有差異
F值越大,表示組平均數的分散情形較誤差變異來
得大,若大於研究者設定的臨界值,研究者即可獲得
拒絕H0、接受H1的結論。
ANOVA的基本假設
(一)常態性假設
假設樣本是抽取自常態化母群體,當樣本數越大,
常態化的假設越不易違反。
(二)變異數同質性假設(homogeneity
of variance)
必須樣本的其他參數保持恆定,如果樣本的
變異數不同質,將造成推論上的偏誤。
ANOVA的基本假設
(三)可加性假設(additivity)
各種變異來源的變異量須相互獨立,且可以進行
累積與加減,稱為可加性假設。
(四)球面性假設(sphericity)
適用於相依樣本的變異數分析,不同的受試者在
不同水準間配對或重複測量,其變動情形應具有一致性。
獨立樣本ANOVA
舉例
獨立樣本
待
5
小
時
三個群體
分組
群體1
待
10
小
時
待
20
小
時
群體2
互不相關
ANOVA
語言發展
測驗成績
群體3
類別變項
連續變項
ANOVA
適用
2分以上
變項
獨立樣本ANOVA之步驟
F檢定公式
組間變異
MS b
F =
MS w
組內變異
SSb  n j ( X j  X G )
MS b 

df b
k 1
2
SSb    X  / n   X  / N
2
2
組間變異平方和
=所有平均數和
每個群體平均數之
差的平方和
獨立樣本ANOVA之步驟
F檢定公式
組間變異
MS b
F =
MS w
組內變異
SS w  ( X ij  X j )
MS w 

df w
N (k  1)
2
    X  / n
SS w   X
2
2
組內變異平方和
=群體內每個特定
值和此群體平均數
之差的平方和
獨立樣本ANOVA之步驟
F檢定公式
F =
組間變異
MS b
MS w
SStotal  ( X ij  X G )
MS total 

df total
N 1
MStotal  MSb  MS w
組內變異
2
總變異平方和=
組間變異平方和
+
組內變異平方和
變異量拆解(補充)
SStotal = SSb + SSw

SStotal:Y變項觀察值的變異(全體樣本在Y變項得分
的變異情形,即總離均差平方和)

SSb:「導因於X變項影響的變異」(組間離均差
平方和,sum of squares between groups)

SSw:「導因於X變項以外的變異」(隨機變異)
(組內離均差平方和,sum of squares within groups)
獨立樣本ANOVA之步驟
陳述假設
H0: μ1 = μ2
= μ3
H1: μ1 ≠ μ2
≠ μ3
設定顯著水準(α=?)
初步研究(.05)
選擇檢定方式
獨立樣本ANOVA
嚴謹研究(.01)
獨立樣本ANOVA之步驟
計算統計值(F值公式)
例如:
F = MSb / MSw = 566.54/64.39
= 8.799 = t2
來源
組間
組內
總和
SS
1133.07
1738.40
2871.47
df
2
27
29
MS
566.54
64.39
F
8.799
SPSS會
自動計算
只
需
觀
察
此
值
獨立樣本ANOVA之步驟
查表決定臨界值
例如:自由度 df (K-1,N-K) = df(2,27)
查附錄A-表A3 臨界值(α=.05) 3.36
比較t值與臨界值
F=8.799
臨界值=3.36
做決定
拒絕 H0 接受 μ1≠μ2 ≠μ3
F值
超過
臨界值
P <.05
達顯著
SPSS
軟體會
統計出P
值
獨立樣本ANOVA之步驟
為何兩個以上的平均數比較要用F檢定?
F檢定:1次比較三對平均數
μ1=μ2 =μ3
α仍維持為 .05
T檢定:需分成3次比較兩對平均數
μ1=μ2 、 μ1=μ3 、 μ2 =μ3
α變為 1-(1-.05)3 = .14
第
一
類
型
誤
差
變
大
了
多重比較
整體考驗(overall test)

當F<.05,拒絕H0假設,表示至少有
兩組平均數之間有顯著差異。

整體考驗顯著後
必須檢驗哪幾個平均數之間顯著有所不同,
即多重比較(multiple comparison)
μ1≠μ2
or μ1≠μ3 or μ2 ≠μ3
多重比較
種類:
事前比較(priori comparisons):
多重比較在進行F考驗之前進行
事後比較(posteriori comparisons):
在獲得顯著的F值之後所進行的多重比較
常見問題
第一類型錯誤膨脹問題
當比較次數越多,犯下決策錯誤的可能性就更高
變異數同質假設問題
SPSS
可
處理
多個平均數的比較必須在變異數同質假設維繫的
情況下,才有相同的標準誤;如果各組變異數不同質
時,多重比較的顯著性考驗還必須對變異數不同質進
行調整處理
事前比較
時機

在進行研究之前,研究者即基於理論的推理或個人
特定的需求,事先另行建立研究假設,以便能夠進
行特定的兩兩樣本平均數的考驗

事前比較所處理的是個別比較的假設考驗,在顯著
水準的處理上,屬於比較面顯著水準,而不需考慮
實驗面的顯著水準

可直接應用t考驗,針對特定的水準,進行平均數
差異考驗
事後比較(常用)
變異數同質(當各組樣本數相同)

Tukey’s HSD法:
SPSS
第二常用
方法
較寬鬆
適合於等組,將所有的配對比較視為一體,使整個
研究的第一類型錯誤維持衡定

LSD法:
又稱為Fisher擔保t檢定(Fisher’s protected t-test),
適用成對比較,不等組情況
事後比較(常用)
Scheffe’s methed(嚴謹)
SPSS
第一常用
方法

適用於n不相等的多重比較技術

此方法所犯第一類型錯誤的機率較小。可以說是各種
方法中最嚴格的一種多重比較。

亦即如果F考驗不顯著,Scheffe考驗亦不會顯著
但是F考驗顯著,Scheffe檢定不一定顯著
SPSS操作
課堂作業練習 (課堂獨立樣本ANOVA)
流程:
分析—比較平均數法—單因子變異數分析
將「語言測驗」輸入依變數清單、「群體」輸入因子
按「選項」--勾選「變異數同質性」
按「Post Hoc」—勾選「Scheffe」或 「T3」
考驗:
觀察N、M、SD、變異數同質、F值、P值、事後比較
SPSS操作
SPSS操作
先考驗
變異數是否同質
SPSS報表
描述性統計量
語言測驗
個數
5小時組
10小時組
20小時組
總和
10
10
10
30
平均數
76.60
85.20
91.60
84.47
標準差
11.96
6.20
3.41
9.95
標準誤
3.78
1.96
1.08
1.82
平均數的 95% 信賴區間
下界
上界
68.04
85.16
80.77
89.63
89.16
94.04
80.75
88.18
最小值
56
78
87
56
變異數
同質
變異數同質性檢定
語言測驗
Levene 統計量
3.252
分子自由度
2
P >.05
未達顯著
σ1=σ2=σ3
分母自由度
27
最大值
98
99
96
99
顯著性
.054
SPSS操作
假設變異數同質
假設變異數不同質
SPSS報表
變異數分析
語言測驗
組間
組內
總和
平方和
1133.067
1738.400
2871.467
自由度
2
27
29
平均平方和
566.533
64.385
F 檢定
8.799
顯著性
.001
多重比較
依變數: 語言測驗
Scheffe 法
(I) 群體
5小時組
(J) 群體
平均差異 (I-J)
10小時組
-8.60
20小時組
-15.00*
10小時組
5小時組
8.60
20小時組
-6.40
20小時組
5小時組
15.00*
10小時組
6.40
*. 在 .05 水準上的平均差異很顯著。
95% 信賴區間
下界
上界
.074
-17.89
.69
.001
-24.29
-5.71
.074
-.69
17.89
.222
-15.69
2.89
20小時組=10小時組
.001
5.71
24.29
.222
-2.89
15.69
20小時組>5小時組
標準誤
顯著性
3.59
3.59
3.59
3.59
3.59
3.59
APA表格
表1:不同群體語言測驗分數之變異數分析摘要表
依
變項
語言
測驗
自
變項
個數
平均數
標準差
5小時
10
76.60
11.96
10小時
10
85.20
6.20
20小時
10
91.60
3.41
F值
P值
事後比較
8.80
.00
20小時組
>5小時組
SPSS操作
單因子獨立樣本ANOVA (單因子獨立樣本)
流程1:
分析—比較平均數法—單因子變異數分析
將Y變項輸入依變數清單(數學成就)
X變項輸入因子(家庭狀況)
按「選項」--勾選「變異數同質性、平均數圖」
如變異數同質,按「Post Hoc」—勾選「Scheffe」,
如變異數不同質,勾選「T2、T3、…或…」
考驗:觀察N、平均數、標準差、變異數同質
、F值、P值、事後比較
SPSS操作
單因子獨立樣本ANOVA (單因子獨立樣本)
流程2:
分析—一般線性模式—單變量
將依變項輸入依變數(數學成就)
二因子放兩個自變項
共變數分析放共變量
自變項輸入固定因子(家庭狀況)
按「選項」--「描述統計、效果項、觀察檢定、同質性檢定」
按「Post Hoc」—勾選「Scheffe或其他T3」
考驗:觀察N、平均數、標準差、變異數同質、F值、P值、
事後比較、校正後的R2、統計考驗力
SPSS操作
SPSS操作
SPSS報表
敘述統計
依變數: MAT H
SES
平均數
單親家庭
90.7000
他人照顧
81.8000
雙親家庭
75.5000
總和
82.6667
標準差
4.7621
7.2694
9.9582
9.7179
P>.05
未顯著
個數
10
10
10
30
變異數
同質
(相等)
可以選用
Scheff’e
誤差變異量的 L ev en e 檢定等式a
依變數: MAT H
F 檢定
分子自由度
分母自由度
顯著性
1.293
2
27
.291
檢定各組別中依變數誤差變異量的虛無假設是 相等的。
a. 設計: Intercept+SES
SPSS操作
假設變異數同質
假設變異數不同質
SPSS報表
受試者間效應項 的檢定
依變數: MATH
來源
型 III 平方和 自由度 平均平方和
校正後的模式
1166.467 b
2
583.233
Intercept
205013.333
1 205013.333
SES
1166.467
2
583.233
誤差
1572.200
27
58.230
總和
207752.000
30
校正後的總數
2738.667
29
a. 使用 alpha = .05 計算
b. R 平方 = .426 (調過後的 R 平方 = .383)
F 檢定
10.016
3520.773
10.016
淨相關 Eta
顯著性
平方
Noncent. 參數
.001
.426
20.032
.000
.992
3520.773
.001
.426
20.032
F=10.02 P<.05 達顯著
可以察看事後比較結果
觀察的檢
定能力a
.973
1.000
.973
Eta2 = .426
SES可以解
釋數學成績
42.6%
SPSS報表
多重比較
依變數: MATH
Sch effe 法
(I) SES
單親家庭
他人照顧
雙親家庭
Dunnett T3
單親家庭
他人照顧
雙親家庭
(J) SES
他人照顧
雙親家庭
單親家庭
雙親家庭
單親家庭
他人照顧
他人照顧
雙親家庭
單親家庭
雙親家庭
單親家庭
他人照顧
平均數差
異 (I-J)
8.9000*
15.2000*
-8.9000*
6.3000
-15.2000*
-6.3000
8.9000*
15.2000*
-8.9000*
6.3000
-15.2000*
-6.3000
以觀察的平均數為基礎。
*. 在水準 .05 上的平均數差異顯著。
標準誤
3.4126
3.4126
3.4126
3.4126
3.4126
3.4126
3.4126
3.4126
3.4126
3.4126
3.4126
3.4126
單親家庭>
他人照顧、雙親家庭
95% 信賴區間
顯著性
下限
上限
.048 6.123E-02
17.7388
.001
6.3612
24.0388
.048
-17.7388 -6.123E-02
.201
-2.5388
15.1388
.001
-24.0388
-6.3612
.201
-15.1388
2.5388
.015
1.6172
16.1828
.002
5.7169
24.6831
變異數不同質,
.015
-16.1828
-1.6172
.320 才察看T3事後比較,
-4.0323
16.6323
.002
-24.6831
-5.7169
否則免看!
.320
-16.6323
4.0323
APA表格
表1:不同家庭背景學生數學成績之變異數分析摘要表
依
變項
數學
自
變項
個數 平均數
標準差
1.單親家庭
10
90.70
4.76
2.他人照顧
10
81.80
7.27
3.雙親家庭
10
75.50
9.96
F值
P值
事後比較
10.02
.00
1>2、3
SPSS練習
音樂智慧問卷 (音樂智慧-練習用)
案例:
自變項—行政區、年級
依變項—六種音樂智慧
考驗:
觀察N、平均數、標準差、t值、p值、與eta值
SPSS練習
學習經驗問卷 (學習經驗問卷)
案例:
自變項--家庭狀況
依變項--數學成就/壓力懼怕/…………./整體投入動機
考驗:觀察N、平均數、標準差、變異數同質、F值、
P值、事後比較、校正後的R2、統計考驗力
ANOVA
• ANOVA的自變項與依變項為何
種量尺的資料?
• 哪種事後比較法比較嚴謹?
• 何謂解釋量與統計考驗力?
延伸閱讀資料
Salkind, N. J. (2009)。愛上統計學,p.183-199。史
玲玲、張振華譯。臺北:五南。
余民寧(1995)。心裡與教育統計學,p.385-462。
台北:三民。
吳明隆、涂金堂(2005)。SPSS與統計應用分析,
p.379-442。台北:五南。
違反變異數同質假定的多重比較
Dunnett’s T3法

調整臨界值來達成族系與實驗面的錯誤機率,使型
一機率控制在一定的水準下
vˆ jk 
qj 

s 2j
nj
( q j  qk ) 2
q 2j
qk2

n j  1 nk  1
s 2j 表示有nj個人的第j組變異數,表示各平均數變
異誤估計數
Games-Howell法
原理

jk
計算出調整自由度 v̂ 後,直接與查自於Studentized
range distribution的qcv臨界值相比,來決定顯著性

當各組人數大於50時Games-Howell法所求出的機率估
計會較T3法正確,類似於Dunnett另外提出的C法
| Y j  Yk |
1
2
( q j  qk )
 qcv
Dunnett method

類似於Scheff法,適用於實驗研究中

當實驗具有k個平均數,k-1個為實驗控制,一個對
照組,每一個實驗組需與對照組比較,因此需進行
k-1次配對比較,第一類型錯誤的設定,是以整體實
驗的成敗為考量,為一種experiment-wise error。

杜納法基於t分配的機率原理,檢定k-1個實驗組的
平均數與單一控制組的平均數之間的差異顯著性,
屬於非正交比較(non-orthogonal comparison)。