量化研究的基本概念 - Sites@Duke

Download Report

Transcript 量化研究的基本概念 - Sites@Duke

交叉表格分析
庄文忠 副教授
世新大学行政管理学系
1
SPSS之应用(庄文忠副教授)
2011/7/13
课程大纲
 交叉表格分析(Crosstabs analysis)
2 test)
 余值分析(Residual analysis)
 关联性测量(Measures of association)
 加入控制变数(control variable)的交叉
表格分析
 卡方检定(

2
SPSS之应用(庄文忠副教授)
2011/7/13
交叉表格分析(Crosstabs
analysis)
 次数分配(frequency)虽然得知类别变数
的分布情形,了解各个类别或等第的分布
情形是否过于集中或分散,但这是属于单
变数分析,并无法告诉我们「为什么」会
是这种分布,也不知道有哪些可能的解释
原因。
 交叉表格分析经常被用来查看类别数较少
的两个变数(通常是名义的或等第的)之间
的关系。
3
SPSS之应用(庄文忠副教授)
2011/7/13
建立交叉表格的步骤与原则
 交叉表应该有一个表头或标题。
 在适当的位置(如表格内最上一列和最左一列、或
表格下方的注脚处)陈述变数的内容。
 依据自变数和依变数的属性各自分成数个类别,形
成矩阵式表格。
 分别计算表格内各个细格的个案数,再以边际个数
和为分母计算横百分比(row percentage)和直百分
比(column percentage),或是利用总和为分母计
算总和百分比(grand percentage)。
 若资料中有遗漏值,在交叉分析时被舍弃不用,必
须在表格的附注说明处交待遗漏值的个数及比例。
4
SPSS之应用(庄文忠副教授)
2011/7/13
交叉表格的基本内容
 个数(Counts)
 期望个数(Expected frequencies)
percentage)
 直百分比(Column percentage)
 总和百分比(Grand percentage)
 横百分比(Row
5
SPSS之应用(庄文忠副教授)
2011/7/13
6
SPSS之应用(庄文忠副教授)
2011/7/13
7
SPSS之应用(庄文忠副教授)
2011/7/13
卡方检定(
2 test)
 卡方检定(Chi-square test)是用以决定两个变数
之间,是否有统计上的显着关联性。如果这两个变
数之间没有关系,就可以说是统计上独立,因此,
卡方检定通常是指「独立性卡方检定」(Chisquare test of independence)。作为一种推论性
统计,我们可以用样本的检定结果为基础,得知有
关母体的结论。
 公式:
2
2
(
O

E
)
(
觀察個數

期望個數
)
ij
ij
2
X 

期望個數
Eij
8
SPSS之应用(庄文忠副教授)
2011/7/13
9
SPSS之应用(庄文忠副教授)
2011/7/13
10
SPSS之应用(庄文忠副教授)
2011/7/13
余值分析(Residual analysis)
 余值(residual)
余值=观察个数-期望个数=nij
 标准化余值(standard residual)

eij 
Eij
(Oij  Eij )
Eij
 调整后标准化余值(adjust standardized
residual)
調整後餘值d ij 
eij
~ 標準常態分布
nj
ni
(1  )(1  )
N
N
因為d ii近似於Norm al(0,1,故用
)
Z檢定來判定是否有顯著差異
11
SPSS之应用(庄文忠副教授)
2011/7/13
12
SPSS之应用(庄文忠副教授)
2011/7/13
13
SPSS之应用(庄文忠副教授)
2011/7/13
关联性测量(Measures of
association)
 虽然卡方检定结果可以证实统计上的显着
关联性存在,但我们可能也会对找出两者
之间的「关联强度」感到兴趣。不过,由
于卡方检定几乎是受样本数大小所决定,
因而无法提供我们有关这方面的信息。
14
SPSS之应用(庄文忠副教授)
2011/7/13
常见的关联量数
 Lambda值:利用X变数所提供的信息来帮忙预测
Y变数所减少犯错的比例。
 Cramer's V
2
V
N (k  1)
k : 行數與列數中取較小者  Gamma参数
P Q
Gam m a
PQ
15
SPSS之应用(庄文忠副教授)
P : 正向配對 Q : 反向配對
2011/7/13
常见的关联量数
 Somers' d值
d yx 
P Q
P  Q  Y0
(Y為依變數)
d xy 
P Q
P  Q  X0
(X為依變數)
 Kendall's tau-b相关系数
b 
16
2( P  Q)
( P  Q  X 0 )(P  Q  Y0 )
SPSS之应用(庄文忠副教授)
2011/7/13
17
SPSS之应用(庄文忠副教授)
2011/7/13
18
SPSS之应用(庄文忠副教授)
2011/7/13
19
SPSS之应用(庄文忠副教授)
2011/7/13
加入「控制变数」的交叉表格分
析
 分析自变数X对依变数Y的效果,必须透
「控制」可能影响此一关系的变异,让这
些变异保持固定的状态下,观察X和Y的关
系是否依然存在。
 在三维或多维的交叉表格分析中,研究者
所感兴趣的不是X和Y是否独立的单一假设,
而是关心多个变数之间的关系是否成立。
20
SPSS之应用(庄文忠副教授)
2011/7/13
21
SPSS之应用(庄文忠副教授)
2011/7/13
22
SPSS之应用(庄文忠副教授)
2011/7/13
23
SPSS之应用(庄文忠副教授)
2011/7/13
操作练习&提问时间
24
SPSS之应用(庄文忠副教授)
2011/7/13
作业:
 挑选两个类别变数,并提出假设,利用交
叉表格分析验证此一假定是否成立。
 加入第三个变数,验证原始两个变数之间
的关系是否仍然成立。
25
SPSS之应用(庄文忠副教授)
2011/7/13