Transcript 事後比較
統計3-4-1 閻自安 講授 目錄 統計檢定表 考驗步驟 基本架構 多重比較 基本原理 SPSS操作實例 基本假設 統計檢定表 檢定變項的相關 or 變項的差異? 檢定變項的相關 檢定變項的差異 接受多次測驗? 是 分析 幾個變項? 2個 2以上 迴歸 相關係數 t檢定 典型或因素 分析 幾個群體? 2個 2以上 相依樣本 相依樣本 ANOVA t檢定 否 分析 幾個群體? 2個 2以上 獨立樣本 獨立樣本 ANOVA t檢定 ANOVA的適用 架構 適用 三分變項 背景變項 以上 學歷 個人 音樂智慧 年級 … 學校規模 團體 ANOVA ANOVA 節奏能力 所在區域 … 類別變項 連續變項 ANOVA的適用 架構 ANOVA 適用 三分變項 以上 實驗變項 音樂智慧 實驗A 實驗B ANOVA 節奏能力 控制組 類別變項 連續變項 ANOVA的基本原理 one-way ANOVA(analysis of variance) 研究者欲探討類別變項對於連續變項的影響, 平均數的差異成為主要分析重點 自變項超過兩個以上的平均數,運用F考驗來檢驗 平均數間的變異量,是否顯著的高於隨機變異量 2個 變項 則用 T考 驗 例如:自變項—年級(國一、國二、國三) 依變項—節奏能力測驗成績 如果自變項再加入「性別」,則為two-way ANOVA ANOVA的基本原理 one-way ANOVA(analysis of variance) 原理:以平均數間的變異數(組間變異)除以隨機變異 得到的比值(F值),來取代平均數差異與隨機差異的 比值(t或Z值),可同時檢驗三個平均數的差異。 F=MSb/MSw F值愈大 平均數 愈有差異 F值越大,表示組平均數的分散情形較誤差變異來 得大,若大於研究者設定的臨界值,研究者即可獲得 拒絕H0、接受H1的結論。 ANOVA的基本假設 (一)常態性假設 假設樣本是抽取自常態化母群體,當樣本數越大, 常態化的假設越不易違反。 (二)變異數同質性假設(homogeneity of variance) 必須樣本的其他參數保持恆定,如果樣本的 變異數不同質,將造成推論上的偏誤。 ANOVA的基本假設 (三)可加性假設(additivity) 各種變異來源的變異量須相互獨立,且可以進行 累積與加減,稱為可加性假設。 (四)球面性假設(sphericity) 適用於相依樣本的變異數分析,不同的受試者在 不同水準間配對或重複測量,其變動情形應具有一致性。 獨立樣本ANOVA 舉例 獨立樣本 待 5 小 時 三個群體 分組 群體1 待 10 小 時 待 20 小 時 群體2 互不相關 ANOVA 語言發展 測驗成績 群體3 類別變項 連續變項 ANOVA 適用 2分以上 變項 獨立樣本ANOVA之步驟 F檢定公式 組間變異 MS b F = MS w 組內變異 SSb n j ( X j X G ) MS b df b k 1 2 SSb X / n X / N 2 2 組間變異平方和 =所有平均數和 每個群體平均數之 差的平方和 獨立樣本ANOVA之步驟 F檢定公式 組間變異 MS b F = MS w 組內變異 SS w ( X ij X j ) MS w df w N (k 1) 2 X / n SS w X 2 2 組內變異平方和 =群體內每個特定 值和此群體平均數 之差的平方和 獨立樣本ANOVA之步驟 F檢定公式 F = 組間變異 MS b MS w SStotal ( X ij X G ) MS total df total N 1 MStotal MSb MS w 組內變異 2 總變異平方和= 組間變異平方和 + 組內變異平方和 變異量拆解(補充) SStotal = SSb + SSw SStotal:Y變項觀察值的變異(全體樣本在Y變項得分 的變異情形,即總離均差平方和) SSb:「導因於X變項影響的變異」(組間離均差 平方和,sum of squares between groups) SSw:「導因於X變項以外的變異」(隨機變異) (組內離均差平方和,sum of squares within groups) 獨立樣本ANOVA之步驟 陳述假設 H0: μ1 = μ2 = μ3 H1: μ1 ≠ μ2 ≠ μ3 設定顯著水準(α=?) 初步研究(.05) 選擇檢定方式 獨立樣本ANOVA 嚴謹研究(.01) 獨立樣本ANOVA之步驟 計算統計值(F值公式) 例如: F = MSb / MSw = 566.54/64.39 = 8.799 = t2 來源 組間 組內 總和 SS 1133.07 1738.40 2871.47 df 2 27 29 MS 566.54 64.39 F 8.799 SPSS會 自動計算 只 需 觀 察 此 值 獨立樣本ANOVA之步驟 查表決定臨界值 例如:自由度 df (K-1,N-K) = df(2,27) 查附錄A-表A3 臨界值(α=.05) 3.36 比較t值與臨界值 F=8.799 臨界值=3.36 做決定 拒絕 H0 接受 μ1≠μ2 ≠μ3 F值 超過 臨界值 P <.05 達顯著 SPSS 軟體會 統計出P 值 獨立樣本ANOVA之步驟 為何兩個以上的平均數比較要用F檢定? F檢定:1次比較三對平均數 μ1=μ2 =μ3 α仍維持為 .05 T檢定:需分成3次比較兩對平均數 μ1=μ2 、 μ1=μ3 、 μ2 =μ3 α變為 1-(1-.05)3 = .14 第 一 類 型 誤 差 變 大 了 多重比較 整體考驗(overall test) 當F<.05,拒絕H0假設,表示至少有 兩組平均數之間有顯著差異。 整體考驗顯著後 必須檢驗哪幾個平均數之間顯著有所不同, 即多重比較(multiple comparison) μ1≠μ2 or μ1≠μ3 or μ2 ≠μ3 多重比較 種類: 事前比較(priori comparisons): 多重比較在進行F考驗之前進行 事後比較(posteriori comparisons): 在獲得顯著的F值之後所進行的多重比較 常見問題 第一類型錯誤膨脹問題 當比較次數越多,犯下決策錯誤的可能性就更高 變異數同質假設問題 SPSS 可 處理 多個平均數的比較必須在變異數同質假設維繫的 情況下,才有相同的標準誤;如果各組變異數不同質 時,多重比較的顯著性考驗還必須對變異數不同質進 行調整處理 事前比較 時機 在進行研究之前,研究者即基於理論的推理或個人 特定的需求,事先另行建立研究假設,以便能夠進 行特定的兩兩樣本平均數的考驗 事前比較所處理的是個別比較的假設考驗,在顯著 水準的處理上,屬於比較面顯著水準,而不需考慮 實驗面的顯著水準 可直接應用t考驗,針對特定的水準,進行平均數 差異考驗 事後比較(常用) 變異數同質(當各組樣本數相同) Tukey’s HSD法: SPSS 第二常用 方法 較寬鬆 適合於等組,將所有的配對比較視為一體,使整個 研究的第一類型錯誤維持衡定 LSD法: 又稱為Fisher擔保t檢定(Fisher’s protected t-test), 適用成對比較,不等組情況 事後比較(常用) Scheffe’s methed(嚴謹) SPSS 第一常用 方法 適用於n不相等的多重比較技術 此方法所犯第一類型錯誤的機率較小。可以說是各種 方法中最嚴格的一種多重比較。 亦即如果F考驗不顯著,Scheffe考驗亦不會顯著 但是F考驗顯著,Scheffe檢定不一定顯著 SPSS操作 課堂作業練習 (課堂獨立樣本ANOVA) 流程: 分析—比較平均數法—單因子變異數分析 將「語言測驗」輸入依變數清單、「群體」輸入因子 按「選項」--勾選「變異數同質性」 按「Post Hoc」—勾選「Scheffe」或 「T3」 考驗: 觀察N、M、SD、變異數同質、F值、P值、事後比較 SPSS操作 SPSS操作 先考驗 變異數是否同質 SPSS報表 描述性統計量 語言測驗 個數 5小時組 10小時組 20小時組 總和 10 10 10 30 平均數 76.60 85.20 91.60 84.47 標準差 11.96 6.20 3.41 9.95 標準誤 3.78 1.96 1.08 1.82 平均數的 95% 信賴區間 下界 上界 68.04 85.16 80.77 89.63 89.16 94.04 80.75 88.18 最小值 56 78 87 56 變異數 同質 變異數同質性檢定 語言測驗 Levene 統計量 3.252 分子自由度 2 P >.05 未達顯著 σ1=σ2=σ3 分母自由度 27 最大值 98 99 96 99 顯著性 .054 SPSS操作 假設變異數同質 假設變異數不同質 SPSS報表 變異數分析 語言測驗 組間 組內 總和 平方和 1133.067 1738.400 2871.467 自由度 2 27 29 平均平方和 566.533 64.385 F 檢定 8.799 顯著性 .001 多重比較 依變數: 語言測驗 Scheffe 法 (I) 群體 5小時組 (J) 群體 平均差異 (I-J) 10小時組 -8.60 20小時組 -15.00* 10小時組 5小時組 8.60 20小時組 -6.40 20小時組 5小時組 15.00* 10小時組 6.40 *. 在 .05 水準上的平均差異很顯著。 95% 信賴區間 下界 上界 .074 -17.89 .69 .001 -24.29 -5.71 .074 -.69 17.89 .222 -15.69 2.89 20小時組=10小時組 .001 5.71 24.29 .222 -2.89 15.69 20小時組>5小時組 標準誤 顯著性 3.59 3.59 3.59 3.59 3.59 3.59 APA表格 表1:不同群體語言測驗分數之變異數分析摘要表 依 變項 語言 測驗 自 變項 個數 平均數 標準差 5小時 10 76.60 11.96 10小時 10 85.20 6.20 20小時 10 91.60 3.41 F值 P值 事後比較 8.80 .00 20小時組 >5小時組 SPSS操作 單因子獨立樣本ANOVA (單因子獨立樣本) 流程1: 分析—比較平均數法—單因子變異數分析 將Y變項輸入依變數清單(數學成就) X變項輸入因子(家庭狀況) 按「選項」--勾選「變異數同質性、平均數圖」 如變異數同質,按「Post Hoc」—勾選「Scheffe」, 如變異數不同質,勾選「T2、T3、…或…」 考驗:觀察N、平均數、標準差、變異數同質 、F值、P值、事後比較 SPSS操作 單因子獨立樣本ANOVA (單因子獨立樣本) 流程2: 分析—一般線性模式—單變量 將依變項輸入依變數(數學成就) 二因子放兩個自變項 共變數分析放共變量 自變項輸入固定因子(家庭狀況) 按「選項」--「描述統計、效果項、觀察檢定、同質性檢定」 按「Post Hoc」—勾選「Scheffe或其他T3」 考驗:觀察N、平均數、標準差、變異數同質、F值、P值、 事後比較、校正後的R2、統計考驗力 SPSS操作 SPSS操作 SPSS報表 敘述統計 依變數: MAT H SES 平均數 單親家庭 90.7000 他人照顧 81.8000 雙親家庭 75.5000 總和 82.6667 標準差 4.7621 7.2694 9.9582 9.7179 P>.05 未顯著 個數 10 10 10 30 變異數 同質 (相等) 可以選用 Scheff’e 誤差變異量的 L ev en e 檢定等式a 依變數: MAT H F 檢定 分子自由度 分母自由度 顯著性 1.293 2 27 .291 檢定各組別中依變數誤差變異量的虛無假設是 相等的。 a. 設計: Intercept+SES SPSS操作 假設變異數同質 假設變異數不同質 SPSS報表 受試者間效應項 的檢定 依變數: MATH 來源 型 III 平方和 自由度 平均平方和 校正後的模式 1166.467 b 2 583.233 Intercept 205013.333 1 205013.333 SES 1166.467 2 583.233 誤差 1572.200 27 58.230 總和 207752.000 30 校正後的總數 2738.667 29 a. 使用 alpha = .05 計算 b. R 平方 = .426 (調過後的 R 平方 = .383) F 檢定 10.016 3520.773 10.016 淨相關 Eta 顯著性 平方 Noncent. 參數 .001 .426 20.032 .000 .992 3520.773 .001 .426 20.032 F=10.02 P<.05 達顯著 可以察看事後比較結果 觀察的檢 定能力a .973 1.000 .973 Eta2 = .426 SES可以解 釋數學成績 42.6% SPSS報表 多重比較 依變數: MATH Sch effe 法 (I) SES 單親家庭 他人照顧 雙親家庭 Dunnett T3 單親家庭 他人照顧 雙親家庭 (J) SES 他人照顧 雙親家庭 單親家庭 雙親家庭 單親家庭 他人照顧 他人照顧 雙親家庭 單親家庭 雙親家庭 單親家庭 他人照顧 平均數差 異 (I-J) 8.9000* 15.2000* -8.9000* 6.3000 -15.2000* -6.3000 8.9000* 15.2000* -8.9000* 6.3000 -15.2000* -6.3000 以觀察的平均數為基礎。 *. 在水準 .05 上的平均數差異顯著。 標準誤 3.4126 3.4126 3.4126 3.4126 3.4126 3.4126 3.4126 3.4126 3.4126 3.4126 3.4126 3.4126 單親家庭> 他人照顧、雙親家庭 95% 信賴區間 顯著性 下限 上限 .048 6.123E-02 17.7388 .001 6.3612 24.0388 .048 -17.7388 -6.123E-02 .201 -2.5388 15.1388 .001 -24.0388 -6.3612 .201 -15.1388 2.5388 .015 1.6172 16.1828 .002 5.7169 24.6831 變異數不同質, .015 -16.1828 -1.6172 .320 才察看T3事後比較, -4.0323 16.6323 .002 -24.6831 -5.7169 否則免看! .320 -16.6323 4.0323 APA表格 表1:不同家庭背景學生數學成績之變異數分析摘要表 依 變項 數學 自 變項 個數 平均數 標準差 1.單親家庭 10 90.70 4.76 2.他人照顧 10 81.80 7.27 3.雙親家庭 10 75.50 9.96 F值 P值 事後比較 10.02 .00 1>2、3 SPSS練習 音樂智慧問卷 (音樂智慧-練習用) 案例: 自變項—行政區、年級 依變項—六種音樂智慧 考驗: 觀察N、平均數、標準差、t值、p值、與eta值 SPSS練習 學習經驗問卷 (學習經驗問卷) 案例: 自變項--家庭狀況 依變項--數學成就/壓力懼怕/…………./整體投入動機 考驗:觀察N、平均數、標準差、變異數同質、F值、 P值、事後比較、校正後的R2、統計考驗力 ANOVA • ANOVA的自變項與依變項為何 種量尺的資料? • 哪種事後比較法比較嚴謹? • 何謂解釋量與統計考驗力? 延伸閱讀資料 Salkind, N. J. (2009)。愛上統計學,p.183-199。史 玲玲、張振華譯。臺北:五南。 余民寧(1995)。心裡與教育統計學,p.385-462。 台北:三民。 吳明隆、涂金堂(2005)。SPSS與統計應用分析, p.379-442。台北:五南。 違反變異數同質假定的多重比較 Dunnett’s T3法 調整臨界值來達成族系與實驗面的錯誤機率,使型 一機率控制在一定的水準下 vˆ jk qj s 2j nj ( q j qk ) 2 q 2j qk2 n j 1 nk 1 s 2j 表示有nj個人的第j組變異數,表示各平均數變 異誤估計數 Games-Howell法 原理 jk 計算出調整自由度 v̂ 後,直接與查自於Studentized range distribution的qcv臨界值相比,來決定顯著性 當各組人數大於50時Games-Howell法所求出的機率估 計會較T3法正確,類似於Dunnett另外提出的C法 | Y j Yk | 1 2 ( q j qk ) qcv Dunnett method 類似於Scheff法,適用於實驗研究中 當實驗具有k個平均數,k-1個為實驗控制,一個對 照組,每一個實驗組需與對照組比較,因此需進行 k-1次配對比較,第一類型錯誤的設定,是以整體實 驗的成敗為考量,為一種experiment-wise error。 杜納法基於t分配的機率原理,檢定k-1個實驗組的 平均數與單一控制組的平均數之間的差異顯著性, 屬於非正交比較(non-orthogonal comparison)。