ch3_student.ppt

Download Report

Transcript ch3_student.ppt

第三章 統計資料的呈現:
統計圖表
推論正確性之判斷
問題
確認
研究對象
之確認
資料
蒐集
資料
分析
解釋
資料
整理
抽樣
推論
敘述
推論
統計
統計
樣本
機率論
母體
1: 產生數據
2: 整合
數據
3: 從數據
中得出結2
論
學習目標
 利用統計圖表作資料的呈現,讓人有一目了
然的感覺。
 繪製屬質資料的統計圖表
次數分配表、長條圖與圓形圖。
 繪製屬量資料的統計圖表
次數分配表、直方圖、多邊形圖、肩形圖、有
序枝葉圖與時間數列圖。
統計圖表
 統計圖表的功能
 將數據以系統性方法呈現,使讀者一目了然, 故為描述
資料(敘述統計)的重要工具之一。
 使用統計圖表之前
 需確定資料為屬質資料或是屬量資料,資料屬性不同,
其適用的統計圖表亦不同。
屬質資料的統計圖表
 屬質資料的次數分配表
 長條圖
 圓形圖
屬質資料的次數分配表
 Frequency distribution table
 依照資料的原始分類
 分別計算各類別的出現次數
 將各類別次數以表呈現。
樂透彩券開出號碼前十名次數分配表
獎號最常開出號碼前十名次數分配表(包含特別號)
~統計至92054期
排名
1
2
3
4
5
6
7
8
9
10
號碼
27
39
20
41
10
21
34
12
15
11
次數
35
34
33
32
31
31
31
30
30
29
7
例3.1 選修高等統計學的各系人數
 假設40位選修高等統計學課程的學生所屬系
別,若選修本課程是以報考研究所為主要目
的,該任課老師欲瞭解哪一系學生的報考風
氣較盛,試問任課老師應如何編製次數分配
表,從中可以得到那些訊息?
表3.1 選修高等統計學的學生所屬系別
企管
資管
保險
資管
財金
保險
企管
資管
保險
資管
會計
資管
財金
保險
會計
保險
資管
財金
財金
保險
保險
企管
企管
企管
財金
資管
保險
資管
企管
資管
休閒
保險
企管
資管
資管
企管
財金
資管
財金
會計
屬質資料的次數分配表(續)
表3.2 選修高等統計學課程的次數分配表
系別
財金
企管
資管
保險
會計
休閒
合計
學生數
長條圖(直條圖)
 Bar chart
 是由若干長條所構成
 每一長條所代表的是該組的發生次數或次數
百分比。
民國91年台灣地區十大癌症死因
民國91年台灣地區十大癌症死因
25
20.22
19.93
20
百 15
分
比 10
10.63
7.08
4.70
3.50
5
3.17
3.11
2.74
2.18
0
肝癌
肺癌 結腸直腸癌 胃癌
口腔癌 女性乳癌 食道癌
胰臟癌 子宮頸癌 攝護腺癌
癌症
12
資料來源:行政院衛生署
例3.2
 某系一年級全體同學的血型分布情形如下:
A型10位、B型21位、O型60位、AB型9位,
試編製血型的長條圖。
長條圖(續)
圖3.6 血型分布長條圖
人數 1.2
1
0.8
0.6
0.4
0.2
0
A
B
O
AB
血型
例3.3 人身保險業務員的教育程度

表3.3是民國88年人身保險業務員的教育程度,依男性、女性及
總人數繪製教育程度長條圖,如圖3.7。
圖3.7 人身保險業務員教育程度長條圖(民國88年)
140000
120000
人
數
100000
男
80000
女
60000
合計
40000
20000
0
國小
國中
高中職
專科
教育程度
大學
研究所
其它
資料來源:壽險公司(民國89年)
15
圓形圖
 Pie chart
 以圓形的三百六十度為百分之百
 各分類所占的次數百分比即為扇形的角度。
 事實上,只要欲表達某類別佔全部的比例,
以
的呈現最為合適。
求職者學歷分布
台灣地區求職者學歷分布—調查期間 2003年5月10日
高中職以下
1.11%
博士
碩士
0.45%
10.43%
高中職
16.28%
專科
29.28%
大學
42.45%
資料來源:中時人力網
17
例3.4 飲料種類的消費情形


表3.4呈現某校大一200位學生對飲料的喜好情形。
表3.4 學生對飲料種類的喜好情形
種類
茶
人數
36
碳酸 運動 咖啡 機能 果汁
34
16
40
30
20
水
18
其他 合計
6
200
18
例3.4 飲料種類的消費情形(續)
 將表3.4之數據以圓形圖表示各類的分布情形,如圖3.8所示。
圖3.8 飲料種類的圓形圖
水
9%
其他
3%
咖啡
20%
果汁
10%
運動飲料
8%
機能飲料
15%
茶飲料
18%
咖啡
運動飲料
碳酸飲料
茶飲料
機能飲料
果汁
水
其他
碳酸飲料
17%
19
圓形圖(續)
圖3.9 選修高等統計學課程的圓形圖
休閒
會計
3%
8%
財金
18%
保險
22%
企管
20%
資管
29%
屬量的統計圖表
 有序枝葉圖
 屬量資料的次數分配表
 直方圖
 多邊形圖
 肩形圖
 時間數列圖
有序枝葉圖
 有序枝葉圖
 將資料由 到 依序排列,將每一觀察值分成兩部分,
一部分屬於「枝」, 其餘(最後一位數)的屬於「葉」,完
整呈現資料的基本特性。
 有序枝葉圖的重要性
 可以洞悉資料的集中與分散情形,對於資料特性的掌握
相當有幫助。
例3.7 驚人的銀行逾放比
 最近幾年國內的經濟持續惡化,尤其是銀行
的呆帳漸多,因而造成逾放比的節節上升,
表3.5為國內二十家銀行的逾放比資料。
表3.5 國內20家銀行的逾放比(民國89年)
(單位:%)
編號
1
2
3
4
5
6
7
8
9
10
逾放比
1.7
2.5
2.5
2.7
2.8
2.9
2.9
3.1
3.2
3.6
編號
11
12
13
14
15
16
17
18
19
20
逾放比
4.0
4.0
4.0
4.7
5.6
5.7
7.1
7.7
7.8
9.0
例3.7 驚人的銀行逾放比(續)
 解答:取個位數為枝,小數點第一位為葉。
(單位: 1)
例3.7 驚人的銀行逾放比(續1)
由圖可知,資料分布非常不對稱,逾放比最高的
是9%,遠超出大多數的銀行,出現頻率最高的
是2%至2.9%這一組。
例3.6 您的統計成績如何?
 某校抽樣50位同學的統計學期中考成績如下:
39
77 67
72
52 83
66
84 59
63
75
94 84
73
81 41
61
51 91
87
34
54 71
47
79 70
65
57 90
83
58
69 82
76
71 60
38
81 74
69
68
76 85
58
45 73
75
42 93
65
試繪製有序枝葉圖,利用所得圖形說明成績的集中情形與
分散情形。
例3.6 您的統計成績如何?(續)
圖3.10 統計學期中考成績的有序枝葉圖
(單位: 1)
屬量資料的次數分配表
 建立屬量資料的次數分配表的步驟
資料排序
求全距 R

R=最大值 - 最小值
決定組數 k
 方法一: 取 k等於
n
的整數。
 方法二: 求最小的 k 值,使得 2k  n。
 方法三: Sturge’s formula
k = 1+3.32log10n。
屬量資料的次數分配表(續)
決定組距
 組距(d) = 全距(R)∕組數(k)
決定組限(各組別之最小值及最大值)
劃記並計算次數
例3.8 統計成績的次數分配表

根據例3.6的資料編製統計學成績的次數分配表。
1.
2.
3.
4.
排序資料可以根據圖3.10的有序枝葉圖得知。
最大值為94,最小值為34,故全距
R=
利用最簡單的公式,k約等於 n ,所以取
組。
根據資料得知最小計算單位為1分,由前兩項得知
全距/組 數組距d =
。
31
5.
6.
因為最小值為34,依此我們決定最小一組由33開
始且組距為9,所以各組的組限分別是33-41,4250,51-59,60-68, 69-77,78-86,87-94。
劃記並計算次數,利用前述的過程,得表3.6為統
計學成績的次數分配表。
32
例3.8 統計成績的次數分配表
 根據例3.6的資料編製統計學成績的次數
分配表。
組別
組限
劃記
次數
1
2
3
4
5
6
7
合計
50
例3.9 節節上升的失業率
試依表3.7的每月失業率統計數據編製次數分配
表。
解:

1. 將資料排序後,求全距為2.88。
2. 我們利用公式計算k使得2 k  n,本例n = 44,因此k
=6。
3. 計算公式為組距=全距/組數,因此組距為0.48,
為了方便計算取為組距0.5。
4. 資料中最小值為2.29,因此我們以2.20為第一組之
組下限,再者組距為0.5,所以2.69為第一組的上限,
其餘各組依此類推。
5. 劃記並計算各組次數,最後結果如表3.8所示。
34
例3.9 節節上升的失業率(續)
表3.8 每月失業率次數分配表(民國87年1月至90年8月)
組界
組別
組
限
劃記
次數
1
2
3
4
5
6
合計
資料來源:行政院主計處
35
直方圖
 直方圖
與長條圖非常類似,適用於連續的屬量資料,作
法如同長條圖。橫軸代表各組的組界,縱軸代表
各組的次數或相對次數。
 組界
組下界 = 組下限-最小計算單位∕2
組上界 = 組上限 + 最小計算單位∕2
統計學成績的直方圖
組別 組限
組界
組中 次數 累積
點
次數
1
33-41
4
2
42-50
3
3
51-59
7
4
60-68
8
5
69-77
14
6
78-86
9
7
87-95
5
合計
50
相對數
1

第 i 組, i = 1, 2, …, k (共有 k 組)

相對次數(relative frequency)
第 i 組的相對次數 = 第 i 組的次數 fi / 總次數 n,

累積次數(cumulative frequency)
Fi = f1 + f2 + … + fi
 組中點(class mid-point)
組中點 =(組下限 + 組上限)∕2
=(組下界 + 組上界)∕2
38
例3.10 統計學成績的直方圖(續)
圖3.12 統計學成績直方圖
例3.11 失業率的分佈情形

根據例3.9之資料畫出我國在民國八十七年一月至九十
年八月的失業率直方圖。
圖3.13 失業率之直方圖(民國87/01至90/08)
40
直方圖與長條圖有何區別?
 就長條的寬度而言:
 長條圖無組距及組界的觀念,其長條寬度亦不具
任何意義
 直方圖的橫軸代表組限(界), 其長條寬度代表組距
的大小.
 就縱軸而言:
 長條圖的縱軸只能以次數或相對次數表示.
 直方圖的縱軸可以是次數, 相對次數或累積次數
表示.
 就外觀而言:
 長條圖之每一長條之間可以有間隙.
 直方圖之每一長條皆併鄰排列.
41
多邊形圖(polygon)
 可以由直方圖中直接得到
 在第一組之前及最後一組之後各加一組當作
假想組,此兩組的次數皆設為0
 將
及
所構成的點連接而成。
 如此可得一封閉的曲線,即由橫軸出發,最
後再回到橫軸。
例3.12 統計學成績的多邊形圖
 利用表3.9之資料,繪製統計學成績的多邊形
圖。
圖3.14 統計學成績多邊形圖
次數 16
14
14
12
9
10
8
8
6
4
7
4
5
3
2
0
32.5 41.5 50.5 59.5
68.5
77.5 86.5
95.5
成績
肩形圖(ogive):累積次數曲線圖
以
與
為座標
 將所得的點連接起來
 曲線的起點以第一組下界與次數為0的座標開
始

44
例3.13 統計學成績的肩形圖
 試利用表3.9的累積次數資料,繪製統計學成
績的肩形圖。
圖3.15 統計學成績肩形圖
累積 60
次數
50
50
45
36
40
30
22
20
10
14
4
7
0
32.5 41.5 50.5 59.5
68.5
77.5 86.5
95.5
成績
時間數列圖
 將
置於橫軸
 將另一變數的數據置於縱軸。
 這樣的圖形可讓我們瞭解經過一段時間的影
響,另一變數的消長趨勢情形等。
例3.14 外匯存底消長趨勢為何?
 表3.10是台灣與中國大陸自民國80年至
89年的外匯存底金額,試以時間數列圖
表示十年間的變化趨勢。
表3.10 我國與中國大陸的外匯存底(民國80至
89年)(單位:億美元)
年
度
台
灣 824.1 823.1 835.7 924.5 903.1 880.4 835.0 903
80
中國大陸 427
81
194
82
212
83
516
84
736
85
86
87
88
89
1062 1067
1050 1399 1450 1547 1656
資料來源:國際金融統計(IMF)月報。
例3.14 外匯存底消長趨勢(續)
圖3.16 台灣與大陸外匯存底之時間數列圖
(民國80至89年)
(單位:億美元)
外匯
2000
存底
1600
1200
台灣
800
大陸
400
0
80
81
82
83
84
85
86
87
88
89
年度
金融機構逾放比
18
16
14
12
10
8
6
4
2
0
16.39
總體金融機構逾放比
14.53
基層金融機構逾放比
12.27
8.16
90
(1
2月
)
5.86
89
5.64
88
4.52
87
4.18
86
4.15
85
84
3
8.53
7.1
4.02
9.38
資料來源:台灣經濟研究院
49