Transcript 常見的統計迷思與謬誤
統計在社會科學領域研究之應用 常見的統計迷思與謬誤 楊志強 博士 國立台北教育大學教育學系教授 [email protected] http://tea.ntue.edu.tw/~cyang 全球僅5%國家沒開放 2010/1/24 <<台灣新生報>> 550cc以上重型機車騎 士表示,全球沒有開放重型機車行駛高 速公路的國家,大約只剩百分之五,這 百分之五的國家,有一些是沒有高速公 路,有一些則是屬於共產國家,台灣不 應該再對開放重型機車行駛國道有所質 疑。 在立委王幸男十二日所舉辦的公聽會 上,有上百位重型機車騎士與會,向在 場的交通部官員說明政府應該開放 550cc以上大型重型機車行駛國道高速 公路的理由。 有一位騎士表示,現在沒有開放國道行 駛重型機車的國家,就只剩下一些太 平洋的島國,以及包括寮國、緬甸, 以及北韓等共產國家;重型機車的加 速性及靈活性絕對有能力行駛國道高 速公路,台灣應該立即無條件開放大 型重型機車行駛國道高速公路。 另一位騎士則提及,重型機車重 大事故幾乎都發生在一般道路, 他反問在場官員以什麼理由反對 重型機車行使國道高速公路? 500萬人煩躁不耐 台灣人很焦慮 2008/04/30 現代人文明病之一,就是太多壓力造成焦慮 症,來看這份針對國內成年人,所做的廣泛性 焦慮症調查。過去半年來,你是不是曾經浮躁 不耐煩,靜不下來不專心,或情緒容易激動, 全身無法放鬆,晚上又睡不好,如果有這六大 症狀中出現了三個,而且持續三個月都沒有改 善,就屬於廣泛性焦慮症,調查發現全台超過 500萬人是危險族群,其中有超過一百萬民眾, 六項症狀通通有,屬於重度患者,應該儘速就 醫治療,找出抒壓方法。 經濟好不好 網路關鍵字知道 2007/1/19 1 2 2007年上半年度 關鍵字廣告 租屋 旅行社 2007年全年度 關鍵字廣告 租屋 網頁設計 3 4 5 人力銀行 民宿 Wii 民宿 人力銀行 遊戲 6 7 8 9 租車 法拍屋 室內設計 手機 星光幫 二手車 旅行社 吃到飽 10 年菜 Wii 排名 <<中廣新聞網>> 經濟好不好,從網 友關心哪些事就知道。入口網站公布 了「2007年人氣關鍵字廣告排行榜」, 包括「二手車」、「吃到飽」等和省 錢有關的關鍵字首度擠入排行榜前十 名,顯示經濟壞、物價漲,民眾消費 是錙銖必較。 Quiz 如果對統計分析的應 用有興趣,先回答以 下幾個問題 Quiz 1 •衛生署公佈台灣地區約有5000人是屬 單腳肢體殘障。已知台灣地區約有 2,300萬人口。求台灣地區人民的平 均腳數? (5,0001) (22,995,000 2) 1.9997826 23,000,000 所以,根據統計: 我們發現台灣地區多數人腳的數目 超過平均值的! 算平均幹嘛? Quiz 2 五年級各班數學定期評量統計表 班別 平均 排序 甲班 60 1 乙班 60 1 丙班 59 3 五年級各班數學定期評量統計表 班別 人數 分數 平均 甲班 2 100, 20 60 乙班 2 60, 60 60 丙班 2 60, 58 59 丙班最差嗎? Quiz 3 下圖是否有某種明顯的特殊趨勢嗎? 當X軸與Y軸互換,並拉長X軸的座標尺度時… Quiz 4 y R=1 x R=1 R=1 R=1 Quiz 5 Mark Twin once said, “There are three kinds of lies: Lies, Damned lies, and Statistics.” 常見的統計迷思與謬誤 Question 1 • 本研究採用量化研究進行統計分析,經由 立意抽樣(judgment sampling),取得 樣本共1067名…… 統計學第一章第一節 Random Sampling Question 2 •本研究隨機選取30名學生實施問卷預試, 並用以進行項目分析、信度分析與效度分 析,以作為正式問卷之問項修正與篩選之 依據… 30名學生夠不夠? 量化的預試?質性的預試? Question 3 第一題 保留 專家1 1 專家2 1 專家3 修正 刪除 1 專家4 1 chi-square=8; df=6; p=0.238 •經卡方檢定,四位專家的看法無顯著差異,所以第一 題建議保留… 量化的專家效度?質性的專家效度? Question 4 • 本研究以探索性因素分析(Exploratory Factor Analysis)進行效度考驗。 • 以特徵值大於1為萃取依據,萃取出3個因 素… • 本研究工具原為4個構面設計,根據上述 證據,將問項進行調整,修正為3個構面, 再進行正式施測… 為何取特徵值>1?修正的理由? Question 5 構面 題數 Cronbach’s α 自信 5 0.87 焦慮 5 0.90 滿意 5 0.92 整體構面 15 0.65 可合併的理論或文獻基礎? Question 6 題項 負荷量 鄉土語言課要考試時,我會很緊張。 0.99 只要想到要上鄉土語言,我就會不由自主的緊張起來。 0.95 我會因為鄉土語言課時的表現不好而煩躁。 0.87 我會因為在鄉土語言課上表現不好的事感到難過。 0.97 上鄉土語言課,可以增加自己的鄉土語言能力。 0.82 上鄉土語言課,讓我感到很有興趣。 0.79 上鄉土語言課,讓我感到充實的感覺。 0.98 上鄉土語言課,讓我變得比較有自信。 0.94 上鄉土語言課能有很好的表現,是我很滿意的一件事。 0.87 累積變異量 64.29% 57.34% 可分開的理論或文獻基礎? Question 7 層面名稱 題數 人數 平均數 標準差 整體組織績效 23 1062 105.95 16.51 目標達成 7 1062 32.52 4.93 行政效率 6 1062 27.29 4.72 工作滿意 5 1062 23.50 4.28 組織適應 5 1062 22.86 4.64 Question 8 題項 平均數 標準差 排序 上鄉土語言課,讓我感到很有興趣。 3.56 0.48 2 上鄉土語言課,讓我感到充實的感覺。 3.43 0.54 3 上鄉土語言課,讓我變得比較有自信。 3.14 0.56 4 上鄉土語言課能有很好的表現,是我很 滿意的一件事。 4.12 2.12 1 Question 9 題項 平均數 標準差 上鄉土語言課,讓我感到很有興趣。 3.56 0.48 上鄉土語言課,讓我感到充實的感覺。 3.43 0.54 上鄉土語言課,讓我變得比較有自信。 3.14 0.56 上鄉土語言課能有很好的表現,是我很 滿意的一件事。 5.12 0.98 Question 10 Levene's Test for Equality of Variances Equal variances assumed Equal variances not assumed F Sig. t df 0.555 68 0.35 4 Sig. (2-tailed) 0.581 0.554 0.557 67.68 0.579 統計分析 不是多數決 探索?驗證? Question 11 有沒有事前比較? y:角色模糊 婚姻狀況 n M SD 已婚(1) 176 3.56 0.46 未婚(2) 90 2.43 0.75 離婚(3) 5 4.6 0.55 分居(4) 2 4.5 0.71 *p< 0.05 與未婚合併? F 事後比較 3.16* 3>1; 3>2 4>1; 4>2 Question 12 • 本研究採準實驗設計(quasi-experimental design) 的非隨機實驗控制組前後測設計 (non-randomized control-group pretest-posttest design )… • 經統計分析發現:在顯著水準0.01之下,實驗組與 控制組的後測成績具顯著差異,因此本研究推論實 驗處理介入後,能有效提升學生學習成效… 準實驗設計可否推論因果? 質性資料的介入 Question 13 y:組織績效 轉型領導 n M SD 低分群(1) 348 91.76 13.00 中分群(2) 367 107.39 11.29 447.60** 高分群(3) 347 119.29 16.51 F 事後比較 3>2>1 *p< 0.01 • 在顯著水準0.01之下,不同程度校長轉 型領導對學校組織績效的影響情形具有 顯著意義… 調查研究可否推論因果? Question 14 • 國小學童的學習動機與其數學學習成就的 相關係數為-0.22,在顯著水準0.01之下, 並無顯著相關(p = 0.34)… • 數學成就=132.46-0.52學習動機 R=-0.22 yˆ 132.46 0.52x 特殊個案 R=0.989 yˆ 30 0.918x • 國小學童的學習動機與其數學學習成就的 相關係數為0.989,在顯著水準0.01之下, 呈顯著正相關(p < 0.01)… • 數學成就=30+0.918學習動機 Question 15 • 學童的數學學習成就與其學習價值在顯著 水準0.01之下呈顯著相關(p < 0.01)… • 學童的數學學習成就與其學習期望在顯著 水準為0.05之下呈顯著相關(p < 0.05) … • 因此,學童的數學學習成就與其學習價值 的顯著相關性優於學習期望… 統計解釋不是數學 Question 16 • 數學成就=11.7+0.77智商 • 數學成就=10.2+0.54智商+0.02血型 其中,血型:1=A;2=B;3=O ;4=AB 名義尺度 • 設置虛擬變數 變數 血型1 血型2 血型3 A 1 0 0 B 0 1 0 O 0 0 1 AB 0 0 0 • 數學成就=10.2+0.54智商+0.2血型1+ 0.01血型2+ 0.04血型3 Question 17 • 本研究採結構方程模式(Structural Equation Model)進行模式驗證… • 模式的卡方值為927.78, 自由度265 (p<0.01) ;RMR為0.042;RMSEA為0.078; GFI為0.84……,顯示模式未達接受之程度, 因此進行模式修正… 模式適配驗證;非模式探索 Question 18 • 本研究採調查研究法,自編○○問卷為研究工具, 所蒐集資料,以結構方程模式進行模式關係分析… 服務 品質 產品 品質 購買 決策 • 服務品質與產品品質顯著影響消費者的購買決策; 換言之,消費者的購買意願係因廠家的服務品質與 產品品質造成… 統計學家說: • 倒底國北教大的校慶是111年還是112年, 統計學家說未達顯著差異, 所以111年還 是112年都沒關係…. 統計學家也說: •一本十萬字的碩士論文,只要有 九萬五千字正確,那大概就可以 信賴了… •博士論文要求要高一點,大概要 九萬九千字吧??? Feedback and Comment [email protected]