Transcript 第12 章
第 12 章 間斷變項資料推論 方法 Reference 生物統計學 書名:生物統計學 - SPSS資料分 析與研究設計概念 (2008/01 二版) (Chapter 12) 資料檔 [Download] 連續數字變項:平均數和變異數的檢定。 間斷變項:中位數和變項分布情形的檢 定。使用次數分布表、列聯表 (contingency table)或雙向表(two-way tables)。 卡方檢定 ( test 或Chi-square test):使用 2 分布當作推論依據。 一組類別變項資料檢定法 檢定:檢驗類別變項的適合度(goodness of fit)。 二項分布檢定法 檢定母體機率 的時機: (1) 任何分布母體的獨立隨機樣本。 (2) 類別變項只有二互斥(exclusive)層 次。 (3) n 20使用二項分布。 (4) n > 20使用 Z 分布。 (5) 符號檢定法是 p=0.5 的特例。 小樣本檢定母體機率 P 的步驟: (1) 設定 P 的假設值 P0。 (2) 雙尾檢定假設: H 0 : P P0 H 1 : P P0 右尾檢定的假設: H 0 : P P0 H1 : P P0 左尾檢定的假設: H 0 : P P0 H1 : P P0 (3) 選定顯著水準α,常選 0.05。 (4) n 20,成功次數 k,檢定統計量 d。 左尾判定值 P ( k d): P(k d ) d n k Ck ( P0 ) (1 k 0 右尾判定值 P(k d ) : P(k d ) 1 P(k d 1) P0 ) nk (5) 雙尾檢定的決策法則: P( k d ) 2 或 P( k d ) 2 左尾檢定決策法則: P( k d ) 右尾檢定決策法則: P( k d ) (6) 依據接受 H0 或 H1 的條件作成結論。 例 題 卡方適合度檢定法 使用卡方適合度檢定(chi-square goodnessof-fit test)的時機: (1) 任何分布母體的獨立隨機樣本。 (2) 類別變項分成 k 個互斥(exclusive) 層 次。 (3) 檢定類別變項的分布形態。 (4) 每層次期望次數不得少於 5 次 ,否 則須進行合併。 檢定步驟: (1) 選定顯著水準α,常選 0.05。 (2) 使用 2 分布右尾檢定。 (3) 建立假設 H0 和 H1: H 0 : 觀測值符合某種特殊分布形態 H1 : 觀測值不符合某種特殊分布形態 (4) 製作簡單或分組次數分布表,得到各 層次觀測值次數 O1,i = 1,2…k。 (5) 計算各層次理論機率值,期望次數是: Ei nPi (6) 代入Pearson 近似式,得到判定值 02 (Oi Ei ) 2 Ei 2 0: (7) 自由度 df: df k 1 (8) 右尾檢定臨界值 U: U (12 , df ) (9) 二種判斷接受或拒絕 H0 的方法: (a) 02 在接受區,接受 H0 ,不考慮 2 β型錯誤; 0 在拒絕區,拒 H0 , 接受 H1 ,是可以接受的結果。 (b) 右尾檢定拒絕 H0 的條件: 02 U 或 P( 2 2 0) (10) 依據接受 H0 或 H1 的條件作成結論。 如上例題 K-S檢定法 使用K-S檢定(Kolomogorov-Smirnov test ) 的時機: (1) 任何分布母體的獨立隨機樣本。 (2) 是連續變項。 (3) 用分組次數分布表檢定變項分布形態。 (4) 也適用於序位變項。 檢定的步驟: (1) 選定顯著水準α,常選 0.05。 (2) 使用雙尾中的右尾檢定。 (3) 建立假設 H0 和 H1:。 H 0 : 觀測值符合某種特殊分布形態 H1 : 觀測值不符合某種特殊分布形態 (4) 製作分組次數分布表,組最大值 di, 組觀次數 fi,累積次數 Fi,i 1, 2 , k (5) 計算累積次數 Fi 的相對次數 RFi。 (6) 常態分布的假設,代入公式: Zi di x 機率函數 Pi 是: Pi P( Z Zi ) (7) 判定值 KM: KM max | RFi Pi | (8) 查附錄 H 得到右尾檢定臨界值 U。 拒絕 H0 的決策法則: KM U (9) KM 在接受區,接受 H0,不考慮β型 錯誤;KM 在拒絕區,拒絕 H0 ,接 受 H1,是可以接受的結果。 (10) 依據接受 H0 或 H1 的條件作成結論。 例 題 二組類別變項資料檢定法 檢定:卡方檢定法。 列聯表 列聯表(contingency table)或雙向表(twoway tables):二變項的次數分布表,參 閱表 12.1。 表中,i =1,2…..k ,j = 12……q: ri fij c j fij ri c j n 格 (Cell) 的期望次數 Eij: ri c j Eij = n n n ri c j n 期望次數雙向表,參閱表12.2。 比較格(Cell)觀測次數與期望次數差異大 小,判斷二類別變項層次間的關聯性或 同質性。 卡方獨立性或同質性檢定法 使用卡方獨立性或同質性檢定的時機: (1) 變項 A 含 k 層次,變項 B 含 q 層次。 或變項A依k個母體分類,變項B依q 種處理分類。 (2) 卡方獨立性檢定: 推論二變項間的 關聯性,獨立或不獨立。 (3) 卡方同質性檢定(chi-square homogeneity test):推論 k 個母體在 B變項的分布形態,同質性 (homogeneity)或不具同質性(no homogeneity)。 (4) 同質性與獨立性檢定步驟完全相同。 (5) 限制條件:期望次數 Eij 皆大於1次, 而且 Eij 小於 5 次的個數不能超過 Eij 總個數 ( i j )的 20%。 使用卡方獨立性或同質性檢定的步驟: (1) 選定顯著水準α,常選 0.05。 (2) 使用 2 分布右尾檢定。 (3) 建立假設: (a) 獨立性檢定的假設和: H 0 : 二變項獨立或無關 H1 : 二變項不獨立或有關 (b) 同質性檢定的假設 H0 和 H1: H 0 : 各母體同質性或中位數相同 H1 : 各母體不同質性或中位數不相同 (4) 製作觀測次數雙向表(參閱表12.1), i = 1,2…k,j = 1,2…q。 (5) 製作期望次數雙向表(參閱表12.2), i = 1,2…k,j = 1,2…q。 2 (6) 代入公式,得到判定值 0 : 2 0 ( fij Eij ) 2 Eij (7) 自由度 df: df (k 1)(q 1) (8) 右尾檢定臨界值 U: U 2 (1 , df ) (9) 二種判斷接受或拒絕 H0 的方法: (a) 在接受區,接受 H0,不考慮β 2 型錯誤; 0 在拒絕區,拒絕虛 H0 ,接受 H1,是可以接受的結 果。 2 0 (b) 右尾檢定拒絕 H0 的條件: 02 U 或 P( 2 2 0) (10)依據接受 H0 或 H1 的條件作成結論。 Yates修正檢定法 使用卡方Yates修正式檢定的時機: (1)與卡方獨立性或同質性檢定時機相同。 (2) 增加限制條件:k =q= 2。 (3) 檢定結果由於限制條件過於保守,所 以不容易拒絕 檢定步驟: (1) 除判定值與自由度外,其餘與卡方獨 立性或同質性檢定步驟相同。 (2) 判定值 02 : 2 0 1 | Oij Eij | 2 Eij i 1, 2 、 j 1, 2 (3) 自由度 df : df 1 2 費氏精確檢定法 使用費氏精確檢定(Fisher’s exact test)的 時機: (1) 與卡方Yates修正式時機相同。 (2) 小樣本以致違背「期望次數 Eij 皆大 於1次,而且 Eij 小於 5 次的個數不超 過 Eij 總個數 ( i j ) 20%」的限制條 件。 (3) 檢定結果由於限制條件過於保守,所 以不容易拒絕虛無假設 H0。 檢定步驟: (1)選定顯著水準α,常選 0.05。 (2)雙尾檢定假設: H 0 : 二變項各格獨立、無關或同質性 H1 : 二變項各格不獨立、有關或不同質性 單尾檢定的假設 H 0 : 二變項某分類增加或優於 ( 減少或劣於 ) H1 : 二變項某分類減少或劣於 ( 增加或優於 ) (3)製作觀測次數雙向表(參閱表12.1),i = 1,2, j = 1,2。 (4)在行總和以及列總和不改變情況下, 將觀測次數調高或調低。 (5)判定值 Pl: c1 !c2 !r1 !r2 ! Pl f1l ! f 2l ! f3l ! f 4l !n! (6)總判定值 P0: P0 Pl (7)雙尾或單尾檢定拒絕 H0 的決策法則: P0 (8)依據接受 H0 或 H1 的條件作成結論。 麥氏卡方檢定法 使用麥氏卡方檢定(McNemar’s Chisquare test)的時機: (1) 成對隨機本,前後測皆包含2個分類 層次。 (2) 推論二變項間關聯性(association)或 分類比例是否相同。 檢定步驟: (1) 選定顯著水準α,常選 0.05。 (2) 使用 2 分布右尾檢定。 (3) 建立假設 H0 和 H1 : H 0 : 二變項比例相同 H1 : 二變項比例不同 (4) 製作觀測次數雙向表(參閱表12.1),i = 1,2,j = 1,2。 2 2 (5) 代入公式,得到判定值 0 或 0c: 2 ( f f ) 02 12 21 f12 f 21 f12 f 21 10 2 (| f f | 1) 02c 12 21 f12 f 21 (6) 自由度 df: df 1 (7) 右尾檢定臨界值 U: U (12 , df ) (8) 二種判斷接受或拒絕 H0 的方法: (a) 2 0 在接受區,接受 H0,不考慮β 2 型錯誤; 在拒絕區,拒絕 H0, 0 接受 H1,是可以接受的結果。 (b) 右尾檢定拒絕 H0 的條件: U 2 0 或 P( 2 02 ) (9) 依據接受 H0 或 H1 的條件作成結論。 例 題 表 12.11 男女生期望次數雙向表 22 20 8.8 50 02 U (19.55 5.991) 例 題 總結 (1)類別資料的檢定:依據簡單次數分布表、 分組次數分布表或雙向表的分類次數, 檢驗類別或分組連續變項的分布形態、 二變項間的關聯性或同質性。 (2) 使用卡方分布右尾檢定時,必須注意 「期望次數 Eij 皆大於 1 次,而且 Eij 小 於 5 次的個數不超過 Eij 總個數( i j ) 20%」的限制條件。 (3) df 等於 1 時,獨立樣本使用 Yates 修正 式檢定法,成對樣本使用麥氏卡方檢定 法(McNemar’s Chi-square test)。 (4) 樣本數太少,不能滿足限制條件,使用 費氏精確檢定法(Fisher’s exact test)。