常見的統計迷思與謬誤

Download Report

Transcript 常見的統計迷思與謬誤

統計在社會科學領域研究之應用
常見的統計迷思與謬誤
楊志強 博士
國立台北教育大學教育學系教授
[email protected]
http://tea.ntue.edu.tw/~cyang
全球僅5%國家沒開放
2010/1/24
<<台灣新生報>> 550cc以上重型機車騎
士表示,全球沒有開放重型機車行駛高
速公路的國家,大約只剩百分之五,這
百分之五的國家,有一些是沒有高速公
路,有一些則是屬於共產國家,台灣不
應該再對開放重型機車行駛國道有所質
疑。
在立委王幸男十二日所舉辦的公聽會
上,有上百位重型機車騎士與會,向在
場的交通部官員說明政府應該開放
550cc以上大型重型機車行駛國道高速
公路的理由。
有一位騎士表示,現在沒有開放國道行
駛重型機車的國家,就只剩下一些太
平洋的島國,以及包括寮國、緬甸,
以及北韓等共產國家;重型機車的加
速性及靈活性絕對有能力行駛國道高
速公路,台灣應該立即無條件開放大
型重型機車行駛國道高速公路。
另一位騎士則提及,重型機車重
大事故幾乎都發生在一般道路,
他反問在場官員以什麼理由反對
重型機車行使國道高速公路?
500萬人煩躁不耐 台灣人很焦慮
2008/04/30
現代人文明病之一,就是太多壓力造成焦慮
症,來看這份針對國內成年人,所做的廣泛性
焦慮症調查。過去半年來,你是不是曾經浮躁
不耐煩,靜不下來不專心,或情緒容易激動,
全身無法放鬆,晚上又睡不好,如果有這六大
症狀中出現了三個,而且持續三個月都沒有改
善,就屬於廣泛性焦慮症,調查發現全台超過
500萬人是危險族群,其中有超過一百萬民眾,
六項症狀通通有,屬於重度患者,應該儘速就
醫治療,找出抒壓方法。
經濟好不好 網路關鍵字知道
2007/1/19
1
2
2007年上半年度
關鍵字廣告
租屋
旅行社
2007年全年度
關鍵字廣告
租屋
網頁設計
3
4
5
人力銀行
民宿
Wii
民宿
人力銀行
遊戲
6
7
8
9
租車
法拍屋
室內設計
手機
星光幫
二手車
旅行社
吃到飽
10
年菜
Wii
排名
<<中廣新聞網>> 經濟好不好,從網
友關心哪些事就知道。入口網站公布
了「2007年人氣關鍵字廣告排行榜」,
包括「二手車」、「吃到飽」等和省
錢有關的關鍵字首度擠入排行榜前十
名,顯示經濟壞、物價漲,民眾消費
是錙銖必較。
Quiz
如果對統計分析的應
用有興趣,先回答以
下幾個問題
Quiz 1
•衛生署公佈台灣地區約有5000人是屬
單腳肢體殘障。已知台灣地區約有
2,300萬人口。求台灣地區人民的平
均腳數?
(5,0001)  (22,995,000 2)
 1.9997826
23,000,000
所以,根據統計:
我們發現台灣地區多數人腳的數目
超過平均值的!
算平均幹嘛?
Quiz 2
五年級各班數學定期評量統計表
班別
平均
排序
甲班
60
1
乙班
60
1
丙班
59
3
五年級各班數學定期評量統計表
班別 人數
分數
平均
甲班
2
100, 20
60
乙班
2
60, 60
60
丙班
2
60, 58
59
丙班最差嗎?
Quiz 3
下圖是否有某種明顯的特殊趨勢嗎?
當X軸與Y軸互換,並拉長X軸的座標尺度時…
Quiz 4
y
R=1
x
R=1
R=1
R=1
Quiz 5
Mark Twin once said, “There are
three kinds of lies: Lies, Damned
lies, and Statistics.”
常見的統計迷思與謬誤
Question 1
• 本研究採用量化研究進行統計分析,經由
立意抽樣(judgment sampling),取得
樣本共1067名……
統計學第一章第一節 Random Sampling
Question 2
•本研究隨機選取30名學生實施問卷預試,
並用以進行項目分析、信度分析與效度分
析,以作為正式問卷之問項修正與篩選之
依據…
30名學生夠不夠?
量化的預試?質性的預試?
Question 3
第一題
保留
專家1
1
專家2
1
專家3
修正
刪除
1
專家4
1
chi-square=8; df=6; p=0.238
•經卡方檢定,四位專家的看法無顯著差異,所以第一
題建議保留…
量化的專家效度?質性的專家效度?
Question 4
• 本研究以探索性因素分析(Exploratory
Factor Analysis)進行效度考驗。
• 以特徵值大於1為萃取依據,萃取出3個因
素…
• 本研究工具原為4個構面設計,根據上述
證據,將問項進行調整,修正為3個構面,
再進行正式施測…
為何取特徵值>1?修正的理由?
Question 5
構面
題數
Cronbach’s α
自信
5
0.87
焦慮
5
0.90
滿意
5
0.92
整體構面
15
0.65
可合併的理論或文獻基礎?
Question 6
題項
負荷量
鄉土語言課要考試時,我會很緊張。
0.99
只要想到要上鄉土語言,我就會不由自主的緊張起來。
0.95
我會因為鄉土語言課時的表現不好而煩躁。
0.87
我會因為在鄉土語言課上表現不好的事感到難過。
0.97
上鄉土語言課,可以增加自己的鄉土語言能力。
0.82
上鄉土語言課,讓我感到很有興趣。
0.79
上鄉土語言課,讓我感到充實的感覺。
0.98
上鄉土語言課,讓我變得比較有自信。
0.94
上鄉土語言課能有很好的表現,是我很滿意的一件事。
0.87
累積變異量
64.29%
57.34%
可分開的理論或文獻基礎?
Question 7
層面名稱
題數
人數
平均數
標準差
整體組織績效
23
1062
105.95
16.51
目標達成
7
1062
32.52
4.93
行政效率
6
1062
27.29
4.72
工作滿意
5
1062
23.50
4.28
組織適應
5
1062
22.86
4.64
Question 8
題項
平均數 標準差
排序
上鄉土語言課,讓我感到很有興趣。
3.56
0.48
2
上鄉土語言課,讓我感到充實的感覺。
3.43
0.54
3
上鄉土語言課,讓我變得比較有自信。
3.14
0.56
4
上鄉土語言課能有很好的表現,是我很
滿意的一件事。
4.12
2.12
1
Question 9
題項
平均數
標準差
上鄉土語言課,讓我感到很有興趣。
3.56
0.48
上鄉土語言課,讓我感到充實的感覺。
3.43
0.54
上鄉土語言課,讓我變得比較有自信。
3.14
0.56
上鄉土語言課能有很好的表現,是我很
滿意的一件事。
5.12
0.98
Question 10
Levene's Test for
Equality of Variances
Equal variances
assumed
Equal variances not
assumed
F
Sig.
t
df
0.555 68
0.35
4
Sig.
(2-tailed)
0.581
0.554
0.557 67.68 0.579
統計分析
不是多數決
探索?驗證?
Question 11
有沒有事前比較?
y:角色模糊
婚姻狀況
n
M
SD
已婚(1)
176
3.56
0.46
未婚(2)
90
2.43
0.75
離婚(3)
5
4.6
0.55
分居(4)
2
4.5
0.71
*p< 0.05
與未婚合併?
F
事後比較
3.16*
3>1; 3>2
4>1; 4>2
Question 12
• 本研究採準實驗設計(quasi-experimental design)
的非隨機實驗控制組前後測設計 (non-randomized
control-group pretest-posttest design )…
• 經統計分析發現:在顯著水準0.01之下,實驗組與
控制組的後測成績具顯著差異,因此本研究推論實
驗處理介入後,能有效提升學生學習成效…
準實驗設計可否推論因果?
質性資料的介入
Question 13
y:組織績效
轉型領導
n
M
SD
低分群(1)
348
91.76
13.00
中分群(2)
367
107.39
11.29 447.60**
高分群(3)
347
119.29
16.51
F
事後比較
3>2>1
*p< 0.01
• 在顯著水準0.01之下,不同程度校長轉
型領導對學校組織績效的影響情形具有
顯著意義…
調查研究可否推論因果?
Question 14
• 國小學童的學習動機與其數學學習成就的
相關係數為-0.22,在顯著水準0.01之下,
並無顯著相關(p = 0.34)…
• 數學成就=132.46-0.52學習動機
R=-0.22
yˆ  132.46  0.52x
特殊個案
R=0.989
yˆ  30  0.918x
• 國小學童的學習動機與其數學學習成就的
相關係數為0.989,在顯著水準0.01之下,
呈顯著正相關(p < 0.01)…
• 數學成就=30+0.918學習動機
Question 15
• 學童的數學學習成就與其學習價值在顯著
水準0.01之下呈顯著相關(p < 0.01)…
• 學童的數學學習成就與其學習期望在顯著
水準為0.05之下呈顯著相關(p <
0.05) …
• 因此,學童的數學學習成就與其學習價值
的顯著相關性優於學習期望…
統計解釋不是數學
Question 16
• 數學成就=11.7+0.77智商
• 數學成就=10.2+0.54智商+0.02血型
其中,血型:1=A;2=B;3=O ;4=AB
名義尺度
• 設置虛擬變數
變數
血型1
血型2
血型3
A
1
0
0
B
0
1
0
O
0
0
1
AB
0
0
0
• 數學成就=10.2+0.54智商+0.2血型1+ 0.01血型2+ 0.04血型3
Question 17
• 本研究採結構方程模式(Structural
Equation Model)進行模式驗證…
• 模式的卡方值為927.78, 自由度265
(p<0.01) ;RMR為0.042;RMSEA為0.078;
GFI為0.84……,顯示模式未達接受之程度,
因此進行模式修正…
模式適配驗證;非模式探索
Question 18
• 本研究採調查研究法,自編○○問卷為研究工具,
所蒐集資料,以結構方程模式進行模式關係分析…
服務
品質
產品
品質
購買
決策
• 服務品質與產品品質顯著影響消費者的購買決策;
換言之,消費者的購買意願係因廠家的服務品質與
產品品質造成…
統計學家說:
• 倒底國北教大的校慶是111年還是112年,
統計學家說未達顯著差異, 所以111年還
是112年都沒關係….
統計學家也說:
•一本十萬字的碩士論文,只要有
九萬五千字正確,那大概就可以
信賴了…
•博士論文要求要高一點,大概要
九萬九千字吧???
Feedback and Comment
[email protected]