Transcript 第12 章

第 12 章
間斷變項資料推論
方法
Reference


生物統計學 書名:生物統計學 - SPSS資料分
析與研究設計概念 (2008/01 二版)
(Chapter 12)
資料檔 [Download]

連續數字變項:平均數和變異數的檢定。

間斷變項:中位數和變項分布情形的檢
定。使用次數分布表、列聯表
(contingency table)或雙向表(two-way
tables)。

卡方檢定 ( test 或Chi-square test):使用
2 分布當作推論依據。
一組類別變項資料檢定法

檢定:檢驗類別變項的適合度(goodness
of fit)。
二項分布檢定法

檢定母體機率  的時機:
(1) 任何分布母體的獨立隨機樣本。
(2) 類別變項只有二互斥(exclusive)層
次。
(3) n  20使用二項分布。
(4) n > 20使用 Z 分布。
(5) 符號檢定法是 p=0.5 的特例。

小樣本檢定母體機率 P 的步驟:
(1) 設定 P 的假設值 P0。
(2) 雙尾檢定假設:
H 0 : P  P0
H 1 : P  P0
右尾檢定的假設:
H 0 : P  P0
H1 : P  P0
左尾檢定的假設:
H 0 : P  P0
H1 : P  P0
(3) 選定顯著水準α,常選 0.05。
(4) n  20,成功次數 k,檢定統計量 d。
左尾判定值 P ( k  d):
P(k  d ) 
d

n
k
Ck ( P0 ) (1 
k 0
右尾判定值 P(k  d ) :
P(k  d )  1  P(k  d  1)
P0 )
nk
(5) 雙尾檢定的決策法則:

P( k  d ) 
2
或

P( k  d ) 
2
左尾檢定決策法則:
P( k  d )  
右尾檢定決策法則:
P( k  d )  
(6) 依據接受 H0 或 H1 的條件作成結論。
例
題
卡方適合度檢定法

使用卡方適合度檢定(chi-square goodnessof-fit test)的時機:
(1) 任何分布母體的獨立隨機樣本。
(2) 類別變項分成 k 個互斥(exclusive) 層
次。
(3) 檢定類別變項的分布形態。
(4) 每層次期望次數不得少於 5 次 ,否
則須進行合併。

檢定步驟:
(1) 選定顯著水準α,常選 0.05。
(2) 使用 2 分布右尾檢定。
(3) 建立假設 H0 和 H1:
H 0 : 觀測值符合某種特殊分布形態
H1 : 觀測值不符合某種特殊分布形態
(4) 製作簡單或分組次數分布表,得到各
層次觀測值次數 O1,i = 1,2…k。
(5) 計算各層次理論機率值,期望次數是:
Ei  nPi
(6) 代入Pearson 近似式,得到判定值 
02  
(Oi  Ei ) 2
Ei
2
0:
(7) 自由度 df:
df  k  1
(8) 右尾檢定臨界值 U:
U  (12  , df )
(9) 二種判斷接受或拒絕 H0 的方法:
(a)  02 在接受區,接受 H0 ,不考慮
2

β型錯誤; 0 在拒絕區,拒 H0 ,
接受 H1 ,是可以接受的結果。
(b) 右尾檢定拒絕 H0 的條件:
02  U
或
P(   
2
2
0)

(10) 依據接受 H0 或 H1 的條件作成結論。
如上例題
K-S檢定法

使用K-S檢定(Kolomogorov-Smirnov test )
的時機:
(1) 任何分布母體的獨立隨機樣本。
(2) 是連續變項。
(3) 用分組次數分布表檢定變項分布形態。
(4) 也適用於序位變項。

檢定的步驟:
(1) 選定顯著水準α,常選 0.05。
(2) 使用雙尾中的右尾檢定。
(3) 建立假設 H0 和 H1:。
H 0 : 觀測值符合某種特殊分布形態
H1 : 觀測值不符合某種特殊分布形態
(4) 製作分組次數分布表,組最大值 di,
組觀次數 fi,累積次數 Fi,i  1, 2 , k
(5) 計算累積次數 Fi 的相對次數 RFi。
(6) 常態分布的假設,代入公式:
Zi 
di  x

機率函數 Pi 是:
Pi  P( Z  Zi )
(7) 判定值 KM:
KM  max | RFi  Pi |
(8) 查附錄 H 得到右尾檢定臨界值 U。
拒絕 H0 的決策法則:
KM  U
(9) KM 在接受區,接受 H0,不考慮β型
錯誤;KM 在拒絕區,拒絕 H0 ,接
受 H1,是可以接受的結果。
(10) 依據接受 H0 或 H1 的條件作成結論。
例
題
二組類別變項資料檢定法

檢定:卡方檢定法。
列聯表

列聯表(contingency table)或雙向表(twoway tables):二變項的次數分布表,參
閱表 12.1。
表中,i =1,2…..k ,j = 12……q:
ri   fij
c j   fij
 ri   c j  n

格 (Cell) 的期望次數 Eij:
ri c j
Eij =   n
n n
ri  c j

n

期望次數雙向表,參閱表12.2。

比較格(Cell)觀測次數與期望次數差異大
小,判斷二類別變項層次間的關聯性或
同質性。
卡方獨立性或同質性檢定法

使用卡方獨立性或同質性檢定的時機:
(1) 變項 A 含 k 層次,變項 B 含 q 層次。
或變項A依k個母體分類,變項B依q
種處理分類。
(2) 卡方獨立性檢定: 推論二變項間的
關聯性,獨立或不獨立。
(3) 卡方同質性檢定(chi-square
homogeneity test):推論 k 個母體在
B變項的分布形態,同質性
(homogeneity)或不具同質性(no
homogeneity)。
(4) 同質性與獨立性檢定步驟完全相同。
(5) 限制條件:期望次數 Eij 皆大於1次,
而且 Eij 小於 5 次的個數不能超過 Eij
總個數 ( i  j )的 20%。

使用卡方獨立性或同質性檢定的步驟:
(1) 選定顯著水準α,常選 0.05。
(2) 使用 2 分布右尾檢定。
(3) 建立假設:
(a) 獨立性檢定的假設和:
H 0 : 二變項獨立或無關
H1 : 二變項不獨立或有關
(b) 同質性檢定的假設 H0 和 H1:
H 0 : 各母體同質性或中位數相同
H1 : 各母體不同質性或中位數不相同
(4) 製作觀測次數雙向表(參閱表12.1),
i = 1,2…k,j = 1,2…q。
(5) 製作期望次數雙向表(參閱表12.2),
i = 1,2…k,j = 1,2…q。
2

(6) 代入公式,得到判定值 0 :
 
2
0
( fij  Eij )
2
Eij
(7) 自由度 df:
df  (k  1)(q  1)
(8) 右尾檢定臨界值 U:
U
2
(1 , df )
(9) 二種判斷接受或拒絕 H0 的方法:
(a)  在接受區,接受 H0,不考慮β
2
型錯誤;  0 在拒絕區,拒絕虛
H0 ,接受 H1,是可以接受的結
果。
2
0
(b) 右尾檢定拒絕 H0 的條件:
02  U
或
P(   
2
2
0)

(10)依據接受 H0 或 H1 的條件作成結論。
Yates修正檢定法

使用卡方Yates修正式檢定的時機:
(1)與卡方獨立性或同質性檢定時機相同。
(2) 增加限制條件:k =q= 2。
(3) 檢定結果由於限制條件過於保守,所
以不容易拒絕

檢定步驟:
(1) 除判定值與自由度外,其餘與卡方獨
立性或同質性檢定步驟相同。
(2) 判定值  02 :
 
2
0
1

 | Oij  Eij |  
2

Eij
i  1, 2 、 j  1, 2
(3) 自由度 df :
df  1
2
費氏精確檢定法

使用費氏精確檢定(Fisher’s exact test)的
時機:
(1) 與卡方Yates修正式時機相同。
(2) 小樣本以致違背「期望次數 Eij 皆大
於1次,而且 Eij 小於 5 次的個數不超
過 Eij 總個數 ( i  j ) 20%」的限制條
件。
(3) 檢定結果由於限制條件過於保守,所
以不容易拒絕虛無假設 H0。

檢定步驟:
(1)選定顯著水準α,常選 0.05。
(2)雙尾檢定假設:
H 0 : 二變項各格獨立、無關或同質性
H1 : 二變項各格不獨立、有關或不同質性

單尾檢定的假設
H 0 : 二變項某分類增加或優於 ( 減少或劣於 )
H1 : 二變項某分類減少或劣於 ( 增加或優於 )
(3)製作觀測次數雙向表(參閱表12.1),i
= 1,2, j = 1,2。
(4)在行總和以及列總和不改變情況下,
將觀測次數調高或調低。
(5)判定值 Pl:
c1 !c2 !r1 !r2 !
Pl 
f1l ! f 2l ! f3l ! f 4l !n!
(6)總判定值 P0:
P0   Pl
(7)雙尾或單尾檢定拒絕 H0 的決策法則:
P0  
(8)依據接受 H0 或 H1 的條件作成結論。
麥氏卡方檢定法
使用麥氏卡方檢定(McNemar’s Chisquare test)的時機:
(1) 成對隨機本,前後測皆包含2個分類
層次。
(2) 推論二變項間關聯性(association)或
分類比例是否相同。
 檢定步驟:

(1) 選定顯著水準α,常選 0.05。
(2) 使用 2 分布右尾檢定。
(3) 建立假設 H0 和 H1 :
H 0 : 二變項比例相同
H1 : 二變項比例不同
(4) 製作觀測次數雙向表(參閱表12.1),i
= 1,2,j = 1,2。
2
2
(5) 代入公式,得到判定值  0 或  0c:
2
(
f

f
)
02  12 21
f12  f 21
f12  f 21  10
2
(|
f

f
|

1)
02c  12 21
f12  f 21
(6) 自由度 df:
df  1
(7) 右尾檢定臨界值 U:
U  (12  , df )
(8) 二種判斷接受或拒絕 H0 的方法:
(a) 
2
0 在接受區,接受 H0,不考慮β
2
型錯誤; 在拒絕區,拒絕
H0,
0

接受 H1,是可以接受的結果。
(b) 右尾檢定拒絕 H0 的條件:
 U
2
0
或
P(  2  02 )  
(9) 依據接受 H0 或 H1 的條件作成結論。
例
題
表 12.11
男女生期望次數雙向表
22  20
 8.8
50
 02  U (19.55  5.991)
例 題
總結
(1)類別資料的檢定:依據簡單次數分布表、
分組次數分布表或雙向表的分類次數,
檢驗類別或分組連續變項的分布形態、
二變項間的關聯性或同質性。
(2) 使用卡方分布右尾檢定時,必須注意
「期望次數 Eij 皆大於 1 次,而且 Eij 小
於 5 次的個數不超過 Eij 總個數( i  j )
20%」的限制條件。
(3) df 等於 1 時,獨立樣本使用 Yates 修正
式檢定法,成對樣本使用麥氏卡方檢定
法(McNemar’s Chi-square test)。
(4) 樣本數太少,不能滿足限制條件,使用
費氏精確檢定法(Fisher’s exact test)。