2013T02Descriptive

Download Report

Transcript 2013T02Descriptive

贰 资料描述
主講人
陳陸輝 特聘研究員兼主任
政治大學選舉研究中心
美國密西根州立大學博士
1
2015/4/13
政治學研究方法班
主题
一 何谓统计
二 次数分配表
三 中央趋势/集中趋势
四 离散程度
参考王德育第三章与第四章
2
政治學研究方法班
2015/4/13
一 、何谓统计
1.描述统计(descriptive statistics)
将所观察到研究对象(母体)的相关信息加以归纳整理。
2.推论统计(inferential statistics)
以既有观察所得数据,来推论超出观察范围的对象。
 信赖区间 confident interval
 假设检定hypothesis testing
3
政治學研究方法班
2015/4/13
二 次数分配表
在社会科学研究的资料中,通常以名目资料为主。
因此,在描述数据分布时,以次数分配表呈现是
一个不错的方式。
4
政治學研究方法班
2015/4/13
如果政府完全开放两岸经贸,请问您认为台湾的经济情况会变
得更好、更差,还是差不多?
表一、民众对于两岸经贸开放后评估台湾整体经济变化次数分配表
(样本数)
直栏百分比
更好
( 607)
41.3
差不多
( 251)
17.1
更差
( 404)
27.5
无反应
( 208)
14.1
小计
(1,470)
100.0
资料来源:陈陆辉(2008)。
说明:*无反应包括表示:「不知道」、「没意见」与「拒答」等意见。
5
政治學研究方法班
2015/4/13
累积次数分布
累积次数分布
累计该类别以及比该类别的数值还低的所有观察
值的次数分布总数
百分位 percentile rank /累计相对次数分布
一个观察值的百分位,系指所有等于以及小于该
观察值的所有观察值,累计后的相对次数分布。
6
政治學研究方法班
2015/4/13
表3-2
7
民众对民进党过去一年来表现的评价(未合并资料)
評分
0
1
2
3
4
5
6
7
8
9
10
小計
次數
百分比% 累積百分比%
26
2.6
2.6
22
2.2
4.9
43
4.4
09.2
86
8.7
17.9
93
9.4
27.4
362
36.7
64.0
153
15.5
79.5
138
14.0
93.5
39
4.0
97.5
17
1.7
99.2
8
0.8
100.0
987
政治學研究方法班 100.0
2015/4/13
表3-3
評分
0-3
4-6
7-10
小計
8
民众对民进党过去一年来表现的评价(合并后资料)
次數
百分比%
177
608
202
987
政治學研究方法班
17.9
61.6
20.5
100.0
累積百分比%
017.9
079.5
100.0
2015/4/13
用图形呈现数据
除了我们用次数分配表来呈现资料之外,
我们可以用图形来加以表现。
用圆饼图(pie chart)、长条图(bar
chart)来呈现名目数据
用直方图(histogram)来表现包括等距数
据以及等比数据的数字数据。
9
政治學研究方法班
2015/4/13
图3-1 2000年总统选举不同省籍背景选民支持对象长条图
80.0
65.8
70.0
60.0
48.5
50.0
40.0
39.8
32.2
30.0
陳水扁
28.0
宋楚瑜
28.4
23.2
20.0
19.5
連戰
14.8
10.0
0.0
10
本省客家
本省閩南
政治學研究方法班
大陸各省
2015/4/13
图3-2 2000年总统大选三位主要候选人得票百分比的圆饼图
23.18
41.91
陳水扁
宋楚瑜
連戰
34.91
11
政治學研究方法班
2015/4/13
圖三 民眾對兩岸經貿開放總體預期
圖3-3
45.0
民眾對兩岸關係預期長條圖
41.3
40.0
35.0
27.5
30.0
25.0
17.1
14.1
20.0
15.0
10.0
5.0
0.0
12
更好
差不多
政治學研究方法班
更差
无反应
2015/4/13
三 中央趋势
平均數(mean)
N
母體平均數

X
i 1
i
(7.1)
N
n
樣本平均數
13
X
政治學研究方法班
x
i 1
n
i
(7.2)
2015/4/13
平均数的特性

各观察值与平均数间的差之总和等于零。
N
 (x
i
 )  0
i 1


14
各观察值与平均数之差的平方总和最小。
易受极端值影响。
政治學研究方法班
2015/4/13
中位数(median)
找寻一个变量中位数的方式是:
先将我们搜集到的资料由小到大排序,
找出位于该数据中间的位置,
也就是运用累积相对次数0.50那个位置,
即为中位数所在的位置。
15
政治學研究方法班
2015/4/13
找寻中位数
若是N是奇数,则中位数所在的位置是第(N+1)/2位,
该数之值即为中位数
若是N是偶数,则中位数之值即取第(N+1)/2位的前
后两个数再加以平均
16
政治學研究方法班
2015/4/13
中位数的特性

|
 | xi  md |为  | xi  A 中之最小,其中,A为任意
常数。所以,就绝对离差之和而言,中位数与所
有观察值的绝对离差之和为最小。
中位数不易受极端值的影响。
可惜的是,相对于平均数,中位数不易进行代数
计算,所以在一般的统计分析应用机会较少。

17
政治學研究方法班
2015/4/13
众数(mode)
是指
观察值中出现次数最多的那一个数值
18
政治學研究方法班
2015/4/13
四 离散程度






19
全距(range,R)
四分位距(inter-quartile range,IQR)
平均绝对离差(mean absolute deviation ,MAD)
变异数(variance)
标准差(standard deviation)
离散系数(coefficient of variation,CV)。
政治學研究方法班
2015/4/13
全距(range,R)
观察值中的最大值 – 观察值中的最小值 = R
全距的优点为计算简便,不过,它的两个缺点是:
 不够敏感
 易受极端值影响
20
政治學研究方法班
2015/4/13
四分位距(inter-quartile range,IQR)
將資料中的第3四分位數
(在全體資料的累積相對百分比為75%者,或是第75百分
位數)
減去資料中的第1四分位數
(在全體資料的累積相對百分比為25%者,或是第25百分
位數),
所得到的差距,就是四分位距。
21
政治學研究方法班
2015/4/13
离差
平均數的一個特性就是各觀察值與平均數間的差
(也就是所謂的「離差」)的總何等於零,也就
是:
N
(X
i 1
i
 ) = 0
所以,我們可以運用平方或是取絕對值的方式,
將離差的量留下。
22
政治學研究方法班
2015/4/13
平均绝对离差(mean absolute deviation ,MAD)
N
1
| Xi   |

母體 MAD =
N i1
(7.5)
n
1
樣本 mad = | xi  X | (7.6)
n i1
23
政治學研究方法班
2015/4/13
变异数(variance)
母體
N
1
2
2
  ( Xi  ) (7.7)
N i1
n
樣本
24
1
2
s 
(xi  X )

n 1 i1
2
政治學研究方法班
(7.8)
2015/4/13
变异数的性质
变异数一定为正数,若是变异数为零,
则表示观察值间没有变异情况
计算变异数会考虑所有观察值,
适合演算以及统计推论工作
缺点是:
因为平方了所有离差,所以,
单位变成了平方解释较为困难
25
政治學研究方法班
2015/4/13
标准差(standard deviation)
標準差通常落在最小以及最大的絕對離差之間
它使用的是原單位,解釋起來較變異數為佳
26
母體標準差
1 N
2

(
X


)

i
N i1
樣本標準差
1 n
2
s
(xi  X ) (7.10)

n 1 i1
政治學研究方法班
(7.9)
2015/4/13
标准常态分布图
標準常態分布曲線圖
4
-
27
3
-
2
-
1
-
0
1
2
当观察值为常态分布时,在平均数的
正负一个标准差的区间之内,涵盖了68%的所有观察值
正负两个标准差的区间之内,包括了95%的所有观察值,
政治學研究方法班
正负三个标准差的区间之内,包括了99.7%的所有观察值。
3
2015/4/13
4
离散系数(coefficient of variation,CV)
它的测量方式就是将变量的标准差除以平均数
28
政治學研究方法班
2015/4/13
表3-4 民众对国内主要政党评分表
29
政治學研究方法班
2015/4/13
民众对国内主要政党评分表
范例表二、民众对国内主要政党评分的差异
政党
平均数
标准差
(样本数)
民进党
5.04
1.84
(
国民党
4.26
2.08
( 1,030)
亲民党
3.81
2.39
(
987)
733)
资料来源:陈义彦,(2000)。访问由政治大选选举研究中心执行,时间为 2000
年 6 月至 9 月台湾地区面访。
30
政治學研究方法班
2015/4/13