第12 章

Transcript 第12 章

第 12 章
間斷變項資料推論
方法
Reference


生物統計學書名:生物統計學 - SPSS資料分
析與研究設計概念 (2008/01 二版)
(Chapter 12)
資料檔 [Download]

連續數字變項：平均數和變異數的檢定。

間斷變項：中位數和變項分布情形的檢
定。使用次數分布表、列聯表
(contingency table)或雙向表(two-way
tables)。

卡方檢定 ( test 或Chi-square test)：使用
2 分布當作推論依據。
一組類別變項資料檢定法

檢定：檢驗類別變項的適合度(goodness
of fit)。
二項分布檢定法

檢定母體機率  的時機：
(1) 任何分布母體的獨立隨機樣本。
(2) 類別變項只有二互斥(exclusive)層
次。
(3) n  20使用二項分布。
(4) n > 20使用 Z 分布。
(5) 符號檢定法是 p=0.5 的特例。

小樣本檢定母體機率 P 的步驟：
(1) 設定 P 的假設值 P0。
(2) 雙尾檢定假設：
H 0 : P  P0
H 1 : P  P0
右尾檢定的假設：
H 0 : P  P0
H1 : P  P0
左尾檢定的假設：
H 0 : P  P0
H1 : P  P0
(3) 選定顯著水準α，常選 0.05。
(4) n  20，成功次數 k，檢定統計量 d。
左尾判定值 P ( k  d)：
P(k  d ) 
d

n
k
Ck ( P0 ) (1 
k 0
右尾判定值 P(k  d ) ：
P(k  d )  1  P(k  d  1)
P0 )
nk
(5) 雙尾檢定的決策法則：

P( k  d ) 
2
或

P( k  d ) 
2
左尾檢定決策法則：
P( k  d )  
右尾檢定決策法則：
P( k  d )  
(6) 依據接受 H0 或 H1 的條件作成結論。
例
題
卡方適合度檢定法

使用卡方適合度檢定(chi-square goodnessof-fit test)的時機：
(1) 任何分布母體的獨立隨機樣本。
(2) 類別變項分成 k 個互斥(exclusive) 層
次。
(3) 檢定類別變項的分布形態。
(4) 每層次期望次數不得少於 5 次，否
則須進行合併。

檢定步驟：
(1) 選定顯著水準α，常選 0.05。
(2) 使用 2 分布右尾檢定。
(3) 建立假設 H0 和 H1：
H 0 : 觀測值符合某種特殊分布形態
H1 : 觀測值不符合某種特殊分布形態
(4) 製作簡單或分組次數分布表，得到各
層次觀測值次數 O1，i = 1,2…k。
(5) 計算各層次理論機率值，期望次數是：
Ei  nPi
(6) 代入Pearson 近似式，得到判定值 
02  
(Oi  Ei ) 2
Ei
2
0：
(7) 自由度 df：
df  k  1
(8) 右尾檢定臨界值 U：
U  (12  , df )
(9) 二種判斷接受或拒絕 H0 的方法：
(a)  02 在接受區，接受 H0 ，不考慮
2

β型錯誤； 0 在拒絕區，拒 H0 ，
接受 H1 ，是可以接受的結果。
(b) 右尾檢定拒絕 H0 的條件：
02  U
或
P(   
2
2
0)

(10) 依據接受 H0 或 H1 的條件作成結論。
如上例題
K-S檢定法

使用K-S檢定(Kolomogorov-Smirnov test )
的時機：
(1) 任何分布母體的獨立隨機樣本。
(2) 是連續變項。
(3) 用分組次數分布表檢定變項分布形態。
(4) 也適用於序位變項。

檢定的步驟：
(1) 選定顯著水準α，常選 0.05。
(2) 使用雙尾中的右尾檢定。
(3) 建立假設 H0 和 H1：。
H 0 : 觀測值符合某種特殊分布形態
H1 : 觀測值不符合某種特殊分布形態
(4) 製作分組次數分布表，組最大值 di，
組觀次數 fi，累積次數 Fi，i  1, 2 , k
(5) 計算累積次數 Fi 的相對次數 RFi。
(6) 常態分布的假設，代入公式：
Zi 
di  x

機率函數 Pi 是：
Pi  P( Z  Zi )
(7) 判定值 KM：
KM  max | RFi  Pi |
(8) 查附錄 H 得到右尾檢定臨界值 U。
拒絕 H0 的決策法則：
KM  U
(9) KM 在接受區，接受 H0，不考慮β型
錯誤；KM 在拒絕區，拒絕 H0 ，接
受 H1，是可以接受的結果。
(10) 依據接受 H0 或 H1 的條件作成結論。
例
題
二組類別變項資料檢定法

檢定：卡方檢定法。
列聯表

列聯表(contingency table)或雙向表(twoway tables)：二變項的次數分布表，參
閱表 12.1。
表中，i =1,2…..k ，j = 12……q：
ri   fij
c j   fij
 ri   c j  n

格 (Cell) 的期望次數 Eij：
ri c j
Eij =   n
n n
ri  c j

n

期望次數雙向表，參閱表12.2。

比較格(Cell)觀測次數與期望次數差異大
小，判斷二類別變項層次間的關聯性或
同質性。
卡方獨立性或同質性檢定法

使用卡方獨立性或同質性檢定的時機：
(1) 變項 A 含 k 層次，變項 B 含 q 層次。
或變項A依k個母體分類，變項B依q
種處理分類。
(2) 卡方獨立性檢定：推論二變項間的
關聯性，獨立或不獨立。
(3) 卡方同質性檢定(chi-square
homogeneity test)：推論 k 個母體在
B變項的分布形態，同質性
(homogeneity)或不具同質性(no
homogeneity)。
(4) 同質性與獨立性檢定步驟完全相同。
(5) 限制條件：期望次數 Eij 皆大於1次，
而且 Eij 小於 5 次的個數不能超過 Eij
總個數 ( i  j )的 20%。

使用卡方獨立性或同質性檢定的步驟：
(1) 選定顯著水準α，常選 0.05。
(2) 使用 2 分布右尾檢定。
(3) 建立假設：
(a) 獨立性檢定的假設和：
H 0 : 二變項獨立或無關
H1 : 二變項不獨立或有關
(b) 同質性檢定的假設 H0 和 H1：
H 0 : 各母體同質性或中位數相同
H1 : 各母體不同質性或中位數不相同
(4) 製作觀測次數雙向表(參閱表12.1)，
i = 1,2…k，j = 1,2…q。
(5) 製作期望次數雙向表(參閱表12.2)，
i = 1,2…k，j = 1,2…q。
2

(6) 代入公式，得到判定值 0 ：
 
2
0
( fij  Eij )
2
Eij
(7) 自由度 df：
df  (k  1)(q  1)
(8) 右尾檢定臨界值 U：
U
2
(1 , df )
(9) 二種判斷接受或拒絕 H0 的方法：
(a)  在接受區，接受 H0，不考慮β
2
型錯誤；  0 在拒絕區，拒絕虛
H0 ，接受 H1，是可以接受的結
果。
2
0
(b) 右尾檢定拒絕 H0 的條件：
02  U
或
P(   
2
2
0)

(10)依據接受 H0 或 H1 的條件作成結論。
Yates修正檢定法

使用卡方Yates修正式檢定的時機：
(1)與卡方獨立性或同質性檢定時機相同。
(2) 增加限制條件：k =q= 2。
(3) 檢定結果由於限制條件過於保守，所
以不容易拒絕

檢定步驟：
(1) 除判定值與自由度外，其餘與卡方獨
立性或同質性檢定步驟相同。
(2) 判定值  02 ：
 
2
0
1

 | Oij  Eij |  
2

Eij
i  1, 2 、 j  1, 2
(3) 自由度 df ：
df  1
2
費氏精確檢定法

使用費氏精確檢定(Fisher’s exact test)的
時機：
(1) 與卡方Yates修正式時機相同。
(2) 小樣本以致違背「期望次數 Eij 皆大
於1次，而且 Eij 小於 5 次的個數不超
過 Eij 總個數 ( i  j ) 20%」的限制條
件。
(3) 檢定結果由於限制條件過於保守，所
以不容易拒絕虛無假設 H0。

檢定步驟：
(1)選定顯著水準α，常選 0.05。
(2)雙尾檢定假設：
H 0 : 二變項各格獨立、無關或同質性
H1 : 二變項各格不獨立、有關或不同質性

單尾檢定的假設
H 0 : 二變項某分類增加或優於 ( 減少或劣於 )
H1 : 二變項某分類減少或劣於 ( 增加或優於 )
(3)製作觀測次數雙向表(參閱表12.1)，i
= 1,2， j = 1,2。
(4)在行總和以及列總和不改變情況下，
將觀測次數調高或調低。
(5)判定值 Pl：
c1 !c2 !r1 !r2 !
Pl 
f1l ! f 2l ! f3l ! f 4l !n!
(6)總判定值 P0：
P0   Pl
(7)雙尾或單尾檢定拒絕 H0 的決策法則：
P0  
(8)依據接受 H0 或 H1 的條件作成結論。
麥氏卡方檢定法
使用麥氏卡方檢定(McNemar’s Chisquare test)的時機：
(1) 成對隨機本，前後測皆包含2個分類
層次。
(2) 推論二變項間關聯性(association)或
分類比例是否相同。
 檢定步驟：

(1) 選定顯著水準α，常選 0.05。
(2) 使用 2 分布右尾檢定。
(3) 建立假設 H0 和 H1 ：
H 0 : 二變項比例相同
H1 : 二變項比例不同
(4) 製作觀測次數雙向表(參閱表12.1)，i
= 1,2，j = 1,2。
2
2
(5) 代入公式，得到判定值  0 或  0c：
2
(
f

f
)
02  12 21
f12  f 21
f12  f 21  10
2
(|
f

f
|

1)
02c  12 21
f12  f 21
(6) 自由度 df：
df  1
(7) 右尾檢定臨界值 U：
U  (12  , df )
(8) 二種判斷接受或拒絕 H0 的方法：
(a) 
2
0 在接受區，接受 H0，不考慮β
2
型錯誤；在拒絕區，拒絕
H0，
0

接受 H1，是可以接受的結果。
(b) 右尾檢定拒絕 H0 的條件：
 U
2
0
或
P(  2  02 )  
(9) 依據接受 H0 或 H1 的條件作成結論。
例
題
表 12.11
男女生期望次數雙向表
22  20
 8.8
50
 02  U (19.55  5.991)
例題
總結
(1)類別資料的檢定：依據簡單次數分布表、
分組次數分布表或雙向表的分類次數，
檢驗類別或分組連續變項的分布形態、
二變項間的關聯性或同質性。
(2) 使用卡方分布右尾檢定時，必須注意
「期望次數 Eij 皆大於 1 次，而且 Eij 小
於 5 次的個數不超過 Eij 總個數( i  j )
20%」的限制條件。
(3) df 等於 1 時，獨立樣本使用 Yates 修正
式檢定法，成對樣本使用麥氏卡方檢定
法(McNemar’s Chi-square test)。
(4) 樣本數太少，不能滿足限制條件，使用
費氏精確檢定法(Fisher’s exact test)。

第12 章

Transcript 第12 章

Directory