社会研究方法 - 上海财经大学人文学院

Download Report

Transcript 社会研究方法 - 上海财经大学人文学院

社会研究方法(上)
刘长喜
上海财经大学经济社会学系


社会研究方法的内容体系
方法论
研究过程
研究方案
研究设计
抽样方案
资料收集方法
定性分析方法
资料分析方法
定量分析方法
问卷法
观察法
试验法
访问法
个案法
文献法
等等
第一章 社会研究的科学基础



第一节 科学研究
第二节 科学研究的逻辑和程序
第三节 社会研究的方法论
第一节 科学研究



一、科学的概念
1、科学
科学是从确定研究对象的性质和规律这一
目的出发,通过观察、调查和实验而得到
的系统的知识。


2、科学研究
为科学目的进行的实践活动。
3、科学知识
通过科学研究而活动的知识。
你平时的知识来源主要是哪些方式?
传统
经验
科学研究
知识来源
权威
思辨







二、科学发展中的问题
1、科学与文化的分离
过度关注自然,忽视对人类自身的认识
2、科学研究方法的局限性
科学研究方法应用到社会现象的局限性
3、社会制度的制约
带来灾难




三、社会科学研究的特点
1、社会现象的复杂性和异质性
2、个人因素的影响
研究者&被研究者
3、社会现象的不确定性
第二节 社会研究的逻辑和程序
一、科学研究的逻辑
1、归纳的逻辑及其局限
从个别到一般。即从经验观察出发,通过对
大量现象的观察,概括出具有普遍性或一
般性的结论。
比如:通过对大量天鹅观察,得出天鹅是白色
的;
比如:通过对生活中认识的某地方的人观察,
得出这个地方的人不好的。




局限:
A、结论不一定可靠。
B、仅靠归纳无法逻辑地推论出一般性
原理。






2、演绎的逻辑及局限性
从一般到个别。
即从一般原理或理论出发,通过逻辑推理
来解释具体的事件或现象。
如:人是自私
某某是人
某某是自私的。


局限:
错误的前提推出错误的结论。




3、假设检验逻辑
首先从理论演绎出研究假设;
然后通过观察归纳出相应的经验性结论
用经验性结论来检验研究假设:
如果被证实,就可以对被观察到的具体现
象做出有效的理论解释;
如果被证伪,则对理论进行修正或者推翻
理论,发展新理论。
二、科学研究的程序
1、通过理论演绎提出理论假设
2、操作化
3、经验观察
4、通过观察得出研究结论
科学环
建立假设
得出结论
操作化
经验观察
第三节社会研究的方法论

一、社会研究方法论

方法论只要探讨研究的基本假设、逻辑、
原则、程序等问题,是指导研究的一般思
想方法或哲学观点。
比如什么是真?
耳听为虚,眼见为实。
潘光旦的实验


实证主义&人文主义
社会科学能否象自然科学那样客观地认识社会现象
社
会
研
究
方
法
论
是否存在客观的社会规律
应采用何种方法研究社会现象
如何判断社会科学知识的真理性
价值中立与否
 二、社会规律的性质



1、社会总体的统计规律
2、社会制度约束的行为模式
3、社会特定时期的经验规则
三、解释与理解的方法
 1、自然科学的客观解释:因果解释
 2、社会研究中的主观意义
韦伯:一个女孩子在大街上眨眼睛。
3、投入式理解的方法
4、社会研究中因果解释与理解相结合





四、价值与客观性
1、价值中立与价值介入的争论
2、科学的真理性争论
3、科学的功能性争论
实证主义&人文主义





五、社会研究范式
1、后实证研究范式
继承和发展了实证主义方法论
2、阐释研究范式
继承和发展了人文主义方法论







3、批判诠释理论范式
批判+诠释
4、后现代主义范式
反理性
反逻辑
反中心
反本质
第二章 社会研究的主要过程和内容
第一节 社会研究的主要阶段
第二节 确定研究课题和研究假设
第三节 研究单位与研究内容的确定
第一节 社会研究的主要阶段






一、准备与设计阶段
1、确定研究课题
2、初步探索
3、调查研究的总体设计(设计调研方案)
二、资料搜集阶段
三、资料分析阶段
补充:调查方案的主要内容
1 说明调查课题的目的和意义:
2. 说明调查的内容.
3.说明调查范围和方法,时间和地点
4.调查对象
5.说明抽样方案
6.说明调查人员的组成,组织结构及培训安排.
7.确定调查的时间进度和经费使用计划.
第二节 确定研究课题和研究假设








一、研究课题的设定
1、廓清研究课题
2、研究课题的论证
理论意义
实践意义
迫切性
可行性
研究条件
二、确定研究类型
1、研究性质:应用研究和理论研究
 2、研究目的:
描述性研究:是什么
解释性研究:为什么
探索性研究:大致如何

3、研究时间:横剖研究&纵贯研究
 横剖研究:
在某一个时间对研究对象进行横断面的研究。
 上海人民对世博会的态度调查。

纵贯研究:
在不同的时点或较长的时期内观察和研究社会现象。

(1)趋势研究:对研究对象随时间推移而发生的变化进行
研究。“上海老年人养老选择”趋势调查
(2)同期群研究:对同一时期同一类型的研究对象随时间
推移而发生变化的研究。三十年来“老三届”政治态度研
究。
(3)追踪研究:对同一批研究对象随时间推移而发生变化
的研究。“中科大少年班”追踪研究;江村研究。

4、调查对象的范围:普查、抽样调查和个
案调查
三、提出研究假设
1、具体研究假设必须满足的条件
(1)有明确的概念为基础;
(2)能够为经验事实证明或证伪;
(3)有明确的假设适用范围;
(4)具备假设检验的条件;
(5)应该清楚与相关社会科学理论的相互关
联。

2、提出假设的方式
查阅文献;
实地考察或访谈;
两者结合。





3、提出假设的步骤
(1)在确定要研究的问题和目标后,既要
对研究中需要解释的现象作出概括,也要
得出用来解释的社会特征的抽象概念。
(2)明确概念之间的相互关系
(3)将一组相关的解释命题,按其相互之
间的逻辑关系和先后秩序关联起来,建立
命题体系。


4、假设的陈述:变量及其相互关系
变量:给出具体操作化定义的概念

自变量:在一组变量中,能够影响其他变
量发生变化,而又不受其他变量影响的变
量

因变量:在一组变量中,依赖于其他变量,
而又不能影响其他变量的变量



(1)相关关系
(2)因果关系
(3)虚无关系
第三节研究的单位与研究内容的确定

一、研究单位

研究单位也称之为分析单位,就是在研究
范围内的所有研究对象的基本单元。
研究单位与调查对象







研究单位的层次:
个人
群体
组织
社区
社会产物与社会结构




二、研究内容
存在状态
主观倾向
实际行为
第三章 测量





第一节 测量的特征
第二节 测量的尺度
第三节 概念的具体化和操作化
第四节 信度的评估
第五节 效度的评估
第一节 测量的特征






测量就是对做确定的研究内容或调查指标
进行有效的观测与度量。
要素:
测量客体:测量谁
测量内容:测量什么
测量法则:如何测
数字和符号:测的结果




有效测量必须满足的三个条件:
准确性;
完备性;
互斥性;
第二节、测量的尺度



一、定类测量或名义测量
在任何一门科学中,最基本和最简单的
操作是分类(或组)。只要类别是可穷尽
的,且总体单位对分类而言是互斥的,那
么便可以使用定类尺度来进行测量。
例如我们可以按肤色把黑种人、白种人和
黄种人归于不同的类,但我们决不能说哪
一种肤色的人较优或最优。

定类尺度的特征是没有方向性,只能划分
类别;不能比较高低,只能计算各类中总
体单位出现的次数;不能加减,更不能乘
除,只能表征为“=”或“≠”。常见的定
类尺度有性别、血型、宗教信仰等。



二、定序测量或次序测量
如果我们不仅可以区分出类,而且可以
排列出各类的顺序,那么测量便提高到定
序尺度。
例如对人们的态度进行量度,不仅可以区
分出类,而且还可以排出“非常赞成”、
“赞成”、“中立”、“不赞成”、“非
常不赞成”这样的顺序。还有社会地位、
教育程度等都是常见的定序尺度。


定序尺度具有反对称性和传递性。所谓反
对称性,系指A>B,B≯A。或者说当A>B
时,不可能有B>A。定序尺度仍具有传递
性,因如果A>B、B>C,A>C必能成立。

必须指出,定序尺度的特征是方向性,虽
然在类别之间可以做比较,却无法获得它
们之间差值大小的信息。有时研究者测量
人们对某事的态度,固然可以用离散变量l,
2,3,4,5来对“非常赞成”、“赞成”、
“中立”、“不赞成”、“非常不赞成”
进行编码。但这些数值并不是各等级之间
的真实距离,而只是为了统计方便而设的
代码。

因此在这一测量层次,我们一般无法进行
加、减、乘、除的运算,只能进行大于和
小于的运算。
三、定距测量或等距测量

如果我们不仅可以测量被研究对象的
类别和顺序,而且还可以获得有关它们
之间差值的信息,那么测量便提高到了
定距尺度。


必须指出,在定距尺度这一层次上可以做
加减法运算,无法做除法运算。如量度两
杯水的温度,测得一杯为20℃,另一杯为
l0℃,可以知道后者比前者低l0℃,但不能
说后者是前者的一半。因为在定距尺度这
一层次上,零点是任意确定的。



四、定比测量或比例测量
如果我们在定距尺度上可以确定一个绝
对的或非任意性的零点,那么测量便提高
到了定比尺度。定比尺度的特征是两个数
可以组成一个有意义的比率,例如50岁人年
龄是25岁人年龄的两倍。
定比尺度各类别之间可以做除法运算。常
见的定比尺度有身高、体重、人数、收入
等。


关于变量层次几点重要说明:
(1)高一层次的尺度除自己的特性外,必
包含着下一层次尺度的所有特性,层次越
高,数学特质越丰富。 反之则不成立。

(2)比较
尺 特征
度
数字性 平均量度值 统计检验
质
定 相互排斥且可
类 辨别的类别
=,= 众数
X2检验
定 等级顺序大于
序 或小于
>,<
符号秩检验
众位数
定
距
尺
度
尺度上的单位具有相等的 +,意义
算术 T检
平均 验,
数
F检
验
定
比
尺
度
有一个真正意义的零点
几何 T检
平均 验,
数
F检
验
×,÷


(3)用较低尺度收集的资料不能用较高尺
度的数学运算来处理,反过来则可以。比
如在很多研究时都要尽量手机更多更精确
的信息,分析时仅做一些简单的运算,虽
然浪费,但是也比反过来好。
(4)社会现象大多数是定类和定序,有时
也可以通过虚拟变量改变为的方法进行高
层次的变量处理。


(5)一个变量具体运用哪一层次的尺度测
量,要根据研究所要求的精确度
(6)在社会研究中,只满足定距而不能同
时满足定比的变量并不多。如智商







对下列标志进行测量,哪些是定类尺度?哪些是
定序尺度?哪些是定距尺度?哪些是定比尺度?
(1)年龄
(2)性别
(3)籍贯
(4)血型
(5)体温
(6)体重
(7)教育程度 (8)婚姻状况 (9)知名度
(10)月薪
(11)智商
(12)路程
(13)温度
(14)能力
(15)每月工作天数
第三节、概念的具体化与操作化
一、概念的具体化过程
 1、概念的形成
 2、概念的界定
 第一步 概念分解;
 第二步 抽象定义
经过严格定义的概念就是变量。
 3、选择测量指标
 4、编制综合指标



二、概念的操作定义
概念的操作定义是依据抽象定义所界
定的概念内涵和外延提出一些可观测的调
查指标或调查项目来说明如何度量一个概
念.
举例抽象定义:人口增长和智力
操作定义:
人口增长
=出生人口-死亡人口+迁入人口—迁出人口
智力(高低)
= 智力量表中几十项指标的分相加的总分
通过操作定义概念就转换为变量形式


再如情商:
这个概念如何测量?如何操作化?
操作定义的重要作用:
可以使抽象概念与经验现象联系起
来,从而使经验研究成为可能.
 它有助于对现象进行精确,客观的描
述和比较,如比较不同人的智力水平.
 它有助于对调查研究结论进行客观
检验

___________________社会剥夺__________________
↓
↓
↓
社 会 孤 立
社 会 歧 视
社 会 权 力 剥 夺
↓
↓
↓
界定其主要内容和表现 界定歧视的各种类型 界定社会权利的各个方面
↓
↓
↓
指标;
1 朋友的数目
2,与其他家庭的来往
程度
3,活动区域
4 社交活动
……
指标;
1,性别歧视
2,种族歧视
3,职业歧视
4,政治歧视
……
指标;
1 受教育权利的剥夺
2.社会交往权利的剥夺
3.公民权利的剥夺
4,移民权利的剥夺
……
第四节、信度的评估
信度和效度是衡量测量(调查)的质量高低和好坏!
一、信度(Reliability)
 信度是指测量数据(资料)的可靠性
程度,即测量工具能否稳定地测量
到它要测量的事项及其程度。
 信度是指测量的稳定性与一致性.
二、信度检验的方式

1、重复测量(再测信度)

用同一种试验对同一群受试者,前后测验
两次,再根据受使者两次测验分数计算其
相关系数,即得出再测信度,这是一种最
普遍,最常用的信度检查方法 .

比如,调查在校大学生对无偿献血的意愿,第一
次测量结果是愿意参加的人占87.8%,一周后再
次测量结果是愿意参加的人占88.0%,两次调查
的结果相差0.2%。

然后计算再测信度。前后两次调查的结果非常接
近,这表明调查结果是稳定的,对在校大学生无
偿献血调查所采用的方法是可信的,也就是说调
查信度很高。

2、对分测量(折半信度)

将调查来的结果按题目的单双分成两半计
分,再根据各个人的这两部分的总分计算其
相关系数,就得到折半信度
3、复本测量(复本信度)
复本是相对于原本而言的,它是原本的复制品,对一
项调查的问题,让被调查者接受问卷测量,并同
时接受这份问卷的复本的调查,然后根据调查结
果计算其相关系数,就得出了复本信度。
 例如,老师考试一般都会出A、B卷,A卷用于正
式的考试,而B卷则用于缓考、补考。只要A、B
卷等价,两套试卷测量学生课程学习的效果应该
相当的。



再测信度是一套测量工具两次调查,
复本信度是两套测量工具两次调查,
折半信度则是一套测量工具一次调查。

4、主观评分法(评分者信度)

计算一个评分者的一组评分与另一个评分
者的同一组评分的相关系数。即评分者信
度。
三、影响信度的因素
1、被调查者:
是否耐心,认真,专注,不受情绪波
动影响,一般说来调查时间越长,提出的
问题越多,越复杂,信度越低。
2、调查者:
是否按规定程序和标准,是否有意或
无意地对被调查者施加影响,纪录的认真
程度等。
3、测量内容
是否措辞含糊不清,不易理解,一致性差
等,
4、测量环境和时间
研究人员对被调查者有较大的干扰,他
人在场的影响,两次测量的时间间隔太长
等。
第五节 效度的评估




一、效度的概念
测量的含义:
一方面测量效度指的是所测量指标内涵正是概念内涵,
二者在内容性质上是一致的;
另一方面测量指标应该尽可能涵盖概念,二者在程度
上应尽可能重合。
效度越高级表示测量结果越能显示出所要测量对象的真正
特征。
比如说,《社会研究方法》课程要进行期末考试,一份试
卷考出来结果较之学生们的实际水平普遍偏低。由于这份
试卷未能真实地反映出该课程教学、情况,该测量应该说
试卷是缺乏效度的。
二、效度检验方式
1、评价内涵效度(内容效度)
内容效度是指测量指标同我们所研究的概念内涵
的相符程度,判定指标是否反映了概念的基本内
容。

例如,我们要用问卷去测量中学生的“学
习负担”,那么我们首先要弄清“学习负
担”的定义,然后看问卷中的问题是否都
与“学习负担”有关。如果我们看不出问
卷中有问题与“学习负担”无关,那么我
们就说,该测量具有内容效度。
2、确立效度标准(准则效度)

准则效度指的是用几种不同的测量方式或不同
指标对同一变量进行测量时,将其中的一种方
式或指标作为准则,其它的方式或指标与这个
准则做比较。如果其它的方式或指标与准则的
方式或指标具有相同的效果,则其它的方式与
指标就具有准则效度。
3、结构效度

测量工具反映概念之间关系的程度。
4、外在效度和内在效度

外在效度是这种研究结论的普遍有效性

内在效度是一项研究的资料和结论的有效
性。
三、信度与效度的关系




1、信度低,效度不可能高
2、信度高,效度不一定高
3、效度低,信度有可能高
4、效度高,信度一定高
第四章



抽样
第一节 抽样概述
第二节 概率抽样的方法
第三节 非概率抽样的方法
第一节
抽样概述

一、抽样的概念

按照一定的方式,从总体中抽取能代表总
体的样本,然后根据样本信息推断总体信
息。
二、抽样调查的发展简史

现代抽样技术始于美国大选民意测验的发
展。
(一)《文学文摘》的成败


《文学文摘》是美国1890-1938年期间的一份普
及型新闻杂志。
1920年,该杂志第一次尝试对当年的美国总统大
选进行预测。他们根据电话号码簿和汽车执照登
记名单向全美6个州的公众发出明信片,询问在即
将进行的总统选举中,是会投“哈丁”的票还是
会投“科克斯”的票。《文学文摘》根据回收的
明信片统计调查结果,准确的预测出哈丁将当选
总统,该杂志由此名声鹊起。

在接下来1924年、1928年和1932年连续三届
的总统大选中,《文学文摘》杂志用同样
的发放明信片的方式,准确预测了谁会当
选总统。

1936年,美国总统大选在罗斯福和兰登之间
展开,大选之前《文学文摘》杂志发出了
空前的1000万张明信片,并回收了200万张,
预测罗斯福和兰登的得票比例为43:57,认
为兰登将当选。就在人们表示信以为真时,
最后的选举结果却是罗斯福以61%的选票当
选,《文学文摘》杂志从此名声下降。


原因在于样本的偏差:
汽车和电话用户的拥有者
盖洛普的成功

1、配额抽样的首次运用

在这一次的大选预测中,另一个年轻的民意测验
者盖洛普 获得了首次成功,他采用配额抽样技术
正确地判断出罗斯福将获胜。后来的总统大选预
测中,盖洛普和他的美国民意测验中心取代了
《文学文摘》杂志的地位。
在随后的预测中1940、1944预测都相当成功。




2、配额抽样的失败与概率抽样的兴起
1948年,预测失败了!
杜威--杜鲁门

现代总统大选中使用的民意测验技术已经
相当成熟,取2000左右的样本规模,就可以
得到非常好的预测结果,而早年《文学文
摘》杂志动辄回收几百万份问卷却预测失
败了,这正是抽样技术的奥妙所在。
三、抽样的基本术语


1、总体
研究对象的集合体称之为总体。





2、样本( sample )。
样本是指从总体中抽取出来的那一部分进行调查
的分析单位的集合体。
例如,我们从上海市大学生中抽取500名大学生来
进行“上海市大学生体育锻炼爱好”情况的调查,
这500名大学生就构成一个样本。
样本中的单位,叫样本单位。如上例中,500名大
学生中的每一人,都是样本单位。
样本中含有的分析单位的数目,叫样本容量(一
般用英文字母n表示),也称样本大小。如上例中,
500就是样本容量。




3、抽样单位( sampling unit )。
在社会调查研究中,分析单位是我们进行信息收
集和分析的基本单位。
而当我们确定采用抽样调查进行社会调查时,习
惯于把分析单位称为抽样单位。抽样单位可以是
一个人,也可以是一个家庭、一个群体或者组织,
比如公司、学校等等。
显然,在一个既定的抽样调查中,抽样单位和分
析单位是同一个概念。不过,在抽样设计阶段我
们习惯于以抽样单位相称,在资料分析阶段我们
则还是习惯于以分析单位相称。




4、抽样框( sampling frame )。
抽样框就是抽样单位的具体化的实际名单。
在社会调查研究中,抽样框是和调查总体相对应
的一个概念。在抽取样本前,把总体各单位区别
开来并做出一览表,每一个单位只列入一次,这
个一览表就叫做抽样框。
比如调查总体是上海财经大学的本科生,那么在
抽取样本前,我们必须掌握上海财经大学全体本
科生的名册,这就是抽样框,样本是从这个名册
中产生的。

6、总体参数( 总体指标 )和样本统计量。

总体参数是关于总体中某一变量取值的综
合描述,即根据总体中各单位的已知量计
算出来的关于总体的统计指标,如上海财
经大学大一男生的平均身高。在抽样调查
时,这个量一般是未知的(但是唯一的)。
因为如果这个量已知,就不必进行抽样调
查了。


样本统计量是关于调查样本中某一变量取值的综
合描述,即根据样本中各单位的已知量计算出来
的关于样本的统计指标。如在上海财经大学大一
男生中随机地抽出200个人组成一个样本,测得每
个人的身高,然后计算出这200个男生的平均身高
便是。
样本统计量,当抽样调查完成后即可计算出来,
但它不具有唯一性。抽样调查就是运用样本统计
量去推断总体参数,而这种推断误差总是难免的。

7、抽样误差( sampling error )。

抽样误差是指由于抽样方法本身导致样本
统计量和总体参数之间的差异。

用样本统计量去推断总体参数时,误差总
是不可会避免的。科学的抽样设计其目的
在于尽可能减少这种误差。

非抽样误差在抽样调查中由于人为的差错
或者不可控制的因素所 导致的误差。
四、概率抽样和非概率抽样
1、概率抽样
 概率抽样是指在抽样时遵循随机原则使总
体内的所有个体具有相同的被抽入样本的
概率。
 2、非概率抽样
非概率抽样主要按照抽样的方便性、主观判
断、主观意愿来选择研究对象。

五、概率抽样的过程
1.界定总体


根据调查的目的要求,确定调查对象的
范围,包括时间,地点,和人物,
例如我们要研究上海财大大学生生活态
度,可以界定总体的范围如下,2006年下
半年海财大大一至大四的在校本科大学
生.总体的定义越清楚越好,由样本所得
的研究结果,原则上只能推论到这个所界
定总体范围.
2、确定抽样框


将总体按照抽样单位划分为各个部分,
这些部分还必须互不重叠,又能合成总体,
然后将其毫无遗漏地编制成表,既抽样框,
在复杂的多阶段的抽样中,相应的各个阶
段有多个抽样框,
在应用之前必须审核其完整性
和准确性,例如,有无遗漏,有无列于名单
上但实际上不存在的个案,有没有重复或
不属于研究范围的等等.
3、选择抽样方式
4、实际抽取样本
5、对样本进行评估
在样本抽出后,需采用各种调查方法对样
本进行实际调查以收集资料,最后对收集到
的资料进行计算并将结果推论和说明总体.
在开始调查之前要对样本进行评估,评
估的目的是初步检查样本的代表性,以免由
于前面步骤中的失误使样本偏差太大,
评估样本可以采取收集若干容易得到的
资料作为总体和样本之间的比较方法.
如果样本与总体的情况相似,这样的样本
就有代表性,如果两者资料相差甚多,则表
明前面的抽样步骤有问题要检查,修正.
六、概率抽样的原则



1、目的性原则
2、随机性原则
3、效果最佳原则
第二节、 概率抽样的方法

简单随机抽样;

系统抽样;

分层抽样;

整群抽样;

多阶段抽样;

PPS抽样
一、简单随机抽样


1.内涵
简单随机抽样又称为纯随机抽样,它是
最基本的概率抽样,其他概率抽样都可以看
成是由他派生出来的.
简单随机抽样对总体中的所有个体按
完全符合随机原则的特定方法抽取样本,既
抽样时不进行任何分组,排列,使总体中的
任何个体都同样有被抽取的平等机会,对总
体中的所有分子一视同仁,毫无例外.
2.方法:


小总体时 抓阄,抽签,
较大总体时 随机数字表使用方法.





3、优缺点:
优点:
最理想的概率抽样方法;
没有偏见,简单易行;
有一条健全的理论和统计方法推论总体参
数;



缺点:
当总体太大时,费时、费力、费钱;
当总体异质性太大时,误差就比较大;
二、系统抽样
它是简单随机抽样的一个变体,具体做法是:
1.将总量的所有个体按一定顺序排列.
2.计算抽样距离.距离是由总体数目与样本
数目决定的.如果总体数为N,样本数为n,则
抽样距离应是:
N
K=——
n
3.在第一个K个个体中,用完全随机的方
法抽取一个个体,设其所在的位置的序号为m
4.自 m 开始,每隔K个抽取一个体,依次抽
取的位置序号为m.,m+k. m+2k ,m+3k.
m+2k…,m+(n-1)k。

5、将这n个单位合起来,就构成从该总体所
要抽取的样本。
从原理上来说,简单随机抽样和系统抽样是一样
的,因此其优缺点也相仿。
等距抽样与简单随机抽样相比,样本分布更为均匀,
抽样误差更小,是一种更广泛应用的抽样方法.
如果总体分布出现如学校、军队这样的分布规律时,
容易出现错误
小故事:一次失败的二战士兵调查

二战期间,美国军方委托社会学家对军队士兵进行一项抽样调查。在进行抽
样之前,研究者对军方提供的总体名单未作认真考察,他们在不知道该单位
名册是按照十个士兵组成的一个班内的军队军衔级别进行排序的(如上士、
中士和下士)的情况下,就确定将名单混在一起作为抽样框。具体调查过程
中,研究者按照等距抽样的规则计算出抽样间距是10,于是在每十个士兵选
择出一个作为样本,这个抽样间距正好与班内的军衔级别重合,结果导致样
本中的士兵全部是上士,中士和下士一个都没有。显然,这个抽样没有实现
具有代表性的样本,而是一个上士士兵调查的样本,最后的调查结果不是说
明所有士兵的情况,最多只能说明军衔是上士的那些士兵的情况。调查宣告
失败。
三、分层随机抽样

1.分层抽样的内涵
分层随机抽样是将总体依照某一种或某几种特性分

为几个子总体,每个子总体称为一层,然后从每一层中
抽取一个字样本,将这些子样本合在一起即为总体的样
本.

比如说,我们要在学生中进行抽样时,可以先将学校按大学、中学、小
学分层,然后随机抽样在各个层中分别地进行,最后把从各层中抽取的
学生合并起来构成总体样本


2.分层抽样种类:
按各层子样本容量的确定方式分层
抽样一般分为按比例分层抽样和异比例分
层抽样.
四、整群随机抽样

整群抽样是将总体按照某种标准化分为一些子群
体,每个子群体作为一个抽样单位,用随机的办法从中
抽取若干子群,将抽出的子群中所有个体合在一起作
为总体的样本.
 举例来讲,要对某市大学生的体质状况做一次抽样调查。该市
共有大学生5万人,分布在30所大学中。我们先从30所大学中随
机抽取 5所大学,然后对所抽中的学校的全部学生逐个进行调
查,这便是整群抽样。


整群抽样与分层抽样有相似之处,第一步都
是按某种标准将总体划分为一些子群.

但是分层抽样是在所有子群中均抽取
一个子样本,作为总体样本的一部分,而整
群抽样是抽取若干子群,并将抽出的子群中
全部个体作为样本,总体样本只分布在几个
群中。
五、多阶段抽样


多阶段抽样是按总体内部元素之间的层次
关系,把抽样过程分成若干阶段进行的抽样方
式。
它通常在第一阶段使用严格的随机抽样方
法,而从第二阶段起使用概率比例抽样,即根
据每一群所含个体的多少分配样本名额.
例如,某市有23个区,共714万人,从中抽取
1000人的样本,将区作为初级抽样单位,每区人数
不等,把每区人数的号码范围列出,东区是1120000号,西区是120001-270000号…..一直排到
7140000号.从这些号码中用随机数字表确定10个
号码,则这10个号码所落入的区即为调查区.如仇
中340000号,它落在南区,则南区为调查区,从这
10个调查区中,每区再随机抽取100人就构成最终
样本.
多阶段抽样特别适用于调查范围大,单位多,
情况复杂的调查对象,但多阶段抽样由于在每一
阶段抽样是都会产生误差,因此经多阶段抽样得
到的样本的误差也相应增大.这是它的不足之处.
六、概率与规模成比例抽样(PPS抽样)

指在多阶段抽样中,尤其是二阶段抽样中,
初级抽样单位被抽中的概率取决于其初级
抽样单位的规模大小,初级抽样单位规模
越大,被抽中的机会就越大,初级抽样单
位规模越小,被抽中的概率就越小。就是
将总体按一种准确的标准划分出容量不等
的具有相同标志的单位在总体中不同比率
分配的样本量进行的抽样。
七、样本规模的确定






研究的精确度;
总体性质;
分析要求;
抽样方法;
无回答;
经费。
第三节 非概率抽样


概率抽样能够排除调查者的主观影响,抽选出郊游代
表性的样本,并能够确知和控制抽样误差的大小。
但是在很多情况下,这种严格的随机抽样很难进行,
例如,由于调查对象的总体边界不清,无法编制随机抽样
所应具备的抽样框,因而无法进行随机抽样.

有时调查的目的仅仅是对问题做出不探索,获得研究
的线索和提出假设,而不是有样本推论总体,在这种情况
下一般代之以非概率抽样.
一、偶遇抽样



偶遇抽样是指研究者按照方便性原则
将其在一定时间内,一定环境里所能遇
见或接触到的人均选入样本的方法。
“街头拦人”
由于是依据调查者的方便任意选取样
本,也称为方便抽样.
偶遇抽样的优点是方便省力.但是样
本的代表性差,又很大的偶然性.
二、主观抽样

分为两种情况:

判断抽样,研究者依据主观判断选取认为可以
代表整体的个体作为样本的方法。
比如选取有代表性的农民工。
立意抽样,研究者有目的选择样本。
选择蚁族代表。



三、配额抽样

配额抽样是按调查对象的某种属性或特征将总
体中所有个体分成若干类或层,然后在各层中抽样,
样本中个层所占的比例与它们在总体中所占的比
例一样.但是不同的是分层抽样中各层子样本是随
机抽取的,而定额抽样中各层的子样本是非随机抽
取的.

定额抽样是以代表总体为目的的.因此必须对
总体的性质有充分的了解.但是,一方面分层时只
能考虑众多属性中的几种,另一方面,新的变化信
息又不易得到,因此样本的代表性要受影响.

例如某大学共有2000个应届毕业生,其中58%是女性,42%是男性;
60%生源地是东部地区,29%生源地是中部地区,11%生源地是西部
地区。那么在一项关于毕业班学生就业去向的样本容量为100的配额
调查中,样本单位的性别比例和生源地比例也应该和总体单位的性别
比例和生源地比例相当,即在调查对象中应该有58个女性,42个男性;
60个为东部生源,29个为中部生源和11个为西部生源。
四、滚雪球抽样



滚雪球抽样是首先从几个适合的调查对
象开始,然后通过得到更多的对象,一步
步扩大样本范围。
比如同性恋调查。
吸毒者群体调查
第五章 定量研究方法




第一节 问卷调查方法
第二节 量表法
第三节 实验的方法
第四节 二次数据分析
第一节 问卷调查法

一、问卷的结构
题目
封面信
指导语
问题和答案
编码
结束语



1、题目
很容易忽略
问卷的标题则常常以“关于……的调查”
为基本形式。
2.封面信 (WWH三原则)
首先 要说明调查者的身份(who).
其次 要说明调查的大致内容和进行
这项调查的目的(why);
最后 要说明调查对象的选取方法和对
调查结果保密的措施(how).

封面信
 说明身份
 调查的大致内容、
目的
 说明保密措施
 感谢语
亲爱的先生(女士)
我们正在进行一项调查,目的是想了解人们在收听广播和收看电视时,
对什么节目感兴趣,对什么节目不感兴趣。
我们给遍布在全国各地的具有代表性的人们写信,请他们把他们的意见告
诉我们。为了确保把所有这些意见都收集起来,我们渴望每个收到信的人都
给我们回答。
随信寄来一份问题表和一个贴好邮票的信封,请您根据自己的情况填写,
并请及时将表寄回。
请注意我们需要的是您的意见,请不要让别人代您填写,那样的话,我
们就收集不到有代表性的意见了。
衷心感谢您的帮助!
您的:司戈特
请将问题表寄至:曼彻斯特、3区 大街1号情报中心办公室
中国儿童发展中心(CCS—2002)
家长调查表
学生编号□□□□□□□□
亲爱的家长:您好!
首先请原谅打扰了您的工作和休息!
儿童是祖国的未来,儿童的成长和教育是家长们十分关心的
问题。为了探索儿童成长和教育的规律,我们在北京,湖南,安徽,
甘肃等地开展了这项调查,希望得到家长们的支持和帮助。
本调查表不用填写姓名和工作单位,各种答案没有正确错误
之分,家长们只需按自己的实际情况在合适的答案上打√,或者在
______中填上适当内容。请您在百忙之中抽出一点时间填写这份调
查表。
为了表示对您的谢意,我们为您的孩子准备了一份小小的礼物,
作为这项调查活动的纪念。
祝您的孩子健康成长!
祝您们全家生活幸福!
北京大学社会学系“儿童发展研究”课题
组
3 指导语
指导语是用来指导被调查者填写问卷的一组说
明.其作用与仪器的使用说明书相似,有些指导语集
中在封面信之后,并标有“填表说明”的标题,其作
用
是对填表方法,要求,注意事项等作一个总体说明。
例如:
填 表 说 明
1. 请在每一个问题后适合自己情况的答案号码
上画圈或者在_处填上适当的内容.
2. 问卷每页右边的数码及短横线是上计算机用
的,您不必填写.
3. 若无特殊说明,一个问题只能选择一个答案.
4. 填写问卷时,请不要与他人商量.
4.问题和答案
问题和答案是问卷的主体,即题器。
5.编码
所谓编码就是赋予每一个问题及
其答案一个代码,编码的工作即可在
问卷设计时就设计好,也可等调查完
成后再进行,前者称为预编码,后者称
为后编码.


6、结束语
表示感谢等。
二、问卷的设计过程


1、确定测量内容
2、设计问卷初稿
卡片法






第一步:根据探索性工作,将设计的每一个问题和选
项放在一张卡片上。
第二步:按照卡片的主题和内容分成堆。
第三步:每一推按照逻辑和习惯排序。
第四步:根据问卷逻辑,排出各堆的顺序。
第五步:调整
第六步:将卡片上的问题写到纸上,形成问卷初稿。
框图法

第一步:根据研究假设和逻辑,画出问卷各部分
及前后顺序框图;

第二步:根据回答者的情况和心理,堆框图前后
顺序进行调整;

第三步:设计每一部分的问题和选项,并排出顺
序

第四步:对全部问题的形式和顺序进行调整,形
成初稿。

3、试调查
三、题器及其形式
问题从形式上看,可分为开放式(openended)问题和封闭式问题(closed-ended
question) 两类。
开放式问题 是不为回答者提供具体答
案,而由回答者自由填答。
封闭式问题 就是在提出问题的同时,还
给出若干个答案,要求被调查者选择一个或几
个作为回答。
封闭式问题形式主要有下面几种:
1. 填空式 即在问题后面划一短横线,让回答
者填写。
如:① 您的年龄是
岁?
② 您家有几口人?
人
③ 您有几个孩子 ?
个
④ 您每天上班需要
(分钟)时间?
填空式一般只用于那些对回答者来说即容
易回答也易于填写的问题,通常只填数字.
2. 是否式
答案只有“是”和“不是”(或者其他肯定和否定
形式)两种.回答者根据自己的情况选择其一。如:
① 您是共青团员吗?
是 □
不是 □
② 您住在本市吗?
是 □
不是 □
③ 您家有空调吗?
有 □
没有 □
④ 您赞成学分制吗 ? 赞成□ 不赞成□
是否式问卷是在民意测验的问卷中使用得最多的一
种,其特点是回答简单明了,可以严格地把回答者分成两
类不同的群体,但其弱点是得到的信息量太小,两种极端
的回答类型不能了解和分析回答者中客观存在的不同层
次.
3.多项单选式.
给出的答案至少在两个以上,回答者根据自
己的情况选择其一,这也是问卷中采用最多的一
种问题形式.
如:⑴ 您的文化程度是
① 小学及以下
② 初中
③ 高中或中专
④ 大专以上
4. 多项限选式
指在所列举的多个答案中,要求回答者根据自己情
况从中选择若干个.
您喜欢看那一类电视节目(请最多选择三项打√)
①
新闻节目
②
电视剧
③
体育节目
④
广告节目
⑤
教育节目
⑥
歌舞节目
⑦
少儿节目
⑧
其他(请注明)
多项限选式比多项选一的方式更能反映被调查者
的实际情况,但是我们无法从答案中看出被选择的顺
序,无法区分选项间的程度差别.
5.多项排序式
在所例举的多个答案中,选择两个以上的答案,
并且要求被调查者为自己的选择答案排序.
您最喜欢看那一类电视节目,(请将答案号
码填入下表中)
第一
①
新闻节目
第二
第三
②
电视剧
③
体育节目
④
广告节目
⑤
教育节目
⑥
歌舞节目
⑦
—
少儿节目
⑧
其他(请写明)—
6.多项任选式
多项任选式是在所提供的答案中,被调查者可
以任意选择各种不同数目答案的一种问题形式.
如:您家有哪些家用电器?(请在题号上打√)
① 彩色电视机
② 录像机
③ 空调
④ 电冰箱
⑤ 电脑
⑥ 微波炉
⑦ 电话
⑧ 其它(请明)______
7.矩阵式
这是一种将同一类型的若干个问题集中在一起,构成一各问
题的表达方式.
您对沈阳电信提供的服务看法如何?(请在所选方框内打√)
很满意
满意 基本满意 不满意 很不满意
① 装机移机服务
□
□
□
□
□
② 话费查询服务
□
□
□
□
□
③ 电话障碍修复
□
□
□
□
□
④ 公用电话服务
□
□
□
□
□
矩阵式的优点是节省问卷的篇幅,同时把同类问题放在
一起,回答方式又相同,也节省了回答者阅读和填写的时间。
8.表格式
这是矩阵式的一种变体,其形式与矩阵式十分相似比如上述
矩阵式问题对应的表格式问题就是:
您对沈阳电信的下列服务看法如何?(请在所选方框内打√)
很满意
①
②
②
满意
基本满意
不满意
很不满意
装机移机服务
话费查询服务
③
电话障碍修复
④
公用电话服务
表格形式的问题除了具有矩阵形式的特点外,还显得更为整
齐,醒目.但是应当注意的是,这两种形式虽然具有简单集中的优
点. 但是也同时使人产生呆板,单调的感觉,在一份问卷中这两
种形式的问题不易用得太多,另外,这两种形式只能减少问题在
问卷中的篇幅,并不能减少其数量,比如上述例题中实际上就包
含了四个问题。

9、相倚问题

选择问题中的某一选项后需要继续回答与
之相关的其他问题。
相倚问题的格式常常如下:

例,您是退休人员吗 ?
① 是的 → 请问您是哪一年退休的?____年.
② 不是
有时相倚问题中又有相倚问题,
其设计方法类似
您有孩子吗 ?
①有 →
② 没有
您有几个孩子?
① 一个孩子—→
② 两个孩子
③ 三个以上孩子
您孩子领独生子女证了吗?
1.
领了
2.
没有领
有时一连好几个问题都只适用于
一部分回答者,设计时往往采用跳答式
的方法来解决.如下例:

您的孩子是独生子女吗?

① 是的
②不是的→
请跳过 10-15 题,
直接从第 16 题接着回答.
这个例子中问题10—15都是询问有关独生子女
家庭情况的,对于多子女家庭来说显然不适用,
所以通过跳答指示他们从问题16开始答起。
四、问卷设计的基本要求

1、问卷的结构要清晰。

同一主题的内容要集中起来,不要引起被
调查者思维跳跃太快。





2、题器顺序的安排要得当。
(1)符合被调查者的思维和逻辑习惯。
(2)先易后难。
(3)先行为类问题,再态度和意见类问题。
(4)先封闭式,后开放式。






3、问卷语言要尽量口语化,尽量简短,不要引起
歧义。
你对单位近年来的情况的感觉是:
A几乎没有什么变化;
B变化不大
C变化很大
您认为我们国家现在最需要:


1、全面迅速的改变
3、部分迅速的改变
2、全面缓慢的改变
4、部分的缓慢改变
您是否适应在财大的学习和生活?
 1、很适应 2、基本适应
3、不适应


4、避免问被调查者不知道的问题以及过于
敏感的问题。
 您的家庭是:

1、核心家庭 2、主干家庭 3、联合家庭

4、丁克家庭 5、其他____

5、提问的态度要客观,不要带有倾向性。
看了《英雄》和《卧虎藏龙》之后,提高了你
对中国武术的兴趣,是吗?
 1、没有提高 ;2、提高了一点
 3、提高很多 ;4、对武术更感兴趣了

有学者认为,房地产保有税的结果将有利于
控制房价,您的看法:
 1、同意
2、不同意
3、不知道


6、避免使用否定式。
五、问卷调查的组织与实施
问卷:
操作化的程度;
专业术语;
发问的形式;
指导语;
提问的用词;
提问的主题;
访问员:
个人特征;外表;
访问动机;信誉;
态度;理解能力;
行为表现;技能;
知识;
问卷调查误差
被调查者:
个人特征;
知识;兴趣;期
望;状态;态度;
调查环境:
访问的方式;
标准化程度;
访问员的训练;
访问员的监控;
访问员的培训与控制





访问员的差错导致的误差:
询问误差:更改询问的标准化流程
追问误差:不适当的追问甚至带有偏见的
追问
记录误差
欺骗误差






1、调查员挑选
一般条件:
诚实与认真
兴趣与能力
勤奋负责
谦虚耐心




特殊条件
政治、经济问题,应选男性为主;
婚姻、家庭等,应选女性为主;
根据方言与风俗习惯;




2、调查员的培训
动员;
强调制度规则;
示范;

3、对访问员的督导

4、问卷审核
第二节 量表法


一、瑟斯顿量表
是L.L.瑟斯顿及其同事E.J.蔡夫于1929年提出的,称之为瑟
斯顿量表法。这个方法首先搜集一系列有关所研究态度的
陈述或项目,而后邀请一些评判者将这些陈述按从最不赞
同到最赞同方向分为若干类,譬如11类。经过淘汰、筛选,
形成一套约20条意义明确的陈述,沿着由最不赞同到最赞
同的连续统分布开来。要求参加态度测量的人在这些陈述
中标注他所同意的陈述,所标注的陈述的平均量表值就是
他在这一问题上的态度分数。瑟斯顿量表法提出了在赞同
或不赞同的因次上测量态度的方法,这是它的贡献。这个
作法迄今仍是多数量表的基本特点。
瑟斯顿量表基本设置步骤为:






(1)收集大量的与要测量的态度有关的语句,一般应在100条以
上,保证其中对主题不利的、中立的和有利的语句都占有足够的比例,
并将其分别写在特制的卡片上。
(2)选定二十人以上的评定者,按照各条语句所表明的态度有
利或不利的程度,将其分别归入十一类。第一类代表最不利的态度,
依次递推…,第六类代表中立的态度…,第十一类代表最有利的态度。
(3)计算每条语句被归在这十一类中次数分布。
(4)删除那些次数分配过于分散的语句。
(5)计算各保留语句的中位数,并将其按中位数进行归类,如
果中位数是n,则该态度语句归到第n类。
(6)从每个类别中选出一、二条代表语句(各评定者对其分类
的判断最为一致的),将这些语句混合排列,即得到所谓的瑟斯顿表。


二、利克特量表
1932年R.利克特提出了一个简化的测量方法,称
之为相加法。它不需要收集对每个项目的预先判
断,只是把每个项目的评定相加而得出一个总分
数。利克特量表也是由一系列陈述组成,利用5点
或7点量表让被试作出反应。5点量表是从强烈赞
同(5)、赞同(4)、中性(3)、不赞同(2)到强
烈不赞同(1)。7点量表则分为强烈赞同、中等赞同、
轻微赞同、中性、轻微不赞同、中等不赞同、强
烈不赞同。
第三节 实验的方法

实验法是控制情境和变量来研究社会行为
和社会现象的变化,以考察变量间的因果
关系。
一、实验法的原理与设计






1、提出关于自变量和因变量的关系假设;
2、事前测验:在实验开始对因变量进行测
试(前测);
3、引入自变量;
4、事后测验(后测);
5、比较前测和后测的差异值,对假设进行
检验。
比如:从众实验。
二、影响实验设计的主要因素


外部因素很难控制;
伦理问题;

三、实验的信度和效度
第四节 二次数据分析

一、二次数据分析的概念

二次数据分析是对现存的数据资料或有他
人已经收集和分析的数据资料所进行的新
的分析。
用二手资料研究新问题;


用新方法研究二手资料,验证原来的研究
结果;




二、二次数据的收集和分析
首先,选择好研究主题;
其次,寻找合适的资料;
最后,选择合适的方法进行分析。