社会研究方法 - 上海财经大学人文学院
Download
Report
Transcript 社会研究方法 - 上海财经大学人文学院
社会研究方法(上)
刘长喜
上海财经大学经济社会学系
社会研究方法的内容体系
方法论
研究过程
研究方案
研究设计
抽样方案
资料收集方法
定性分析方法
资料分析方法
定量分析方法
问卷法
观察法
试验法
访问法
个案法
文献法
等等
第一章 社会研究的科学基础
第一节 科学研究
第二节 科学研究的逻辑和程序
第三节 社会研究的方法论
第一节 科学研究
一、科学的概念
1、科学
科学是从确定研究对象的性质和规律这一
目的出发,通过观察、调查和实验而得到
的系统的知识。
2、科学研究
为科学目的进行的实践活动。
3、科学知识
通过科学研究而活动的知识。
你平时的知识来源主要是哪些方式?
传统
经验
科学研究
知识来源
权威
思辨
二、科学发展中的问题
1、科学与文化的分离
过度关注自然,忽视对人类自身的认识
2、科学研究方法的局限性
科学研究方法应用到社会现象的局限性
3、社会制度的制约
带来灾难
三、社会科学研究的特点
1、社会现象的复杂性和异质性
2、个人因素的影响
研究者&被研究者
3、社会现象的不确定性
第二节 社会研究的逻辑和程序
一、科学研究的逻辑
1、归纳的逻辑及其局限
从个别到一般。即从经验观察出发,通过对
大量现象的观察,概括出具有普遍性或一
般性的结论。
比如:通过对大量天鹅观察,得出天鹅是白色
的;
比如:通过对生活中认识的某地方的人观察,
得出这个地方的人不好的。
局限:
A、结论不一定可靠。
B、仅靠归纳无法逻辑地推论出一般性
原理。
2、演绎的逻辑及局限性
从一般到个别。
即从一般原理或理论出发,通过逻辑推理
来解释具体的事件或现象。
如:人是自私
某某是人
某某是自私的。
局限:
错误的前提推出错误的结论。
3、假设检验逻辑
首先从理论演绎出研究假设;
然后通过观察归纳出相应的经验性结论
用经验性结论来检验研究假设:
如果被证实,就可以对被观察到的具体现
象做出有效的理论解释;
如果被证伪,则对理论进行修正或者推翻
理论,发展新理论。
二、科学研究的程序
1、通过理论演绎提出理论假设
2、操作化
3、经验观察
4、通过观察得出研究结论
科学环
建立假设
得出结论
操作化
经验观察
第三节社会研究的方法论
一、社会研究方法论
方法论只要探讨研究的基本假设、逻辑、
原则、程序等问题,是指导研究的一般思
想方法或哲学观点。
比如什么是真?
耳听为虚,眼见为实。
潘光旦的实验
实证主义&人文主义
社会科学能否象自然科学那样客观地认识社会现象
社
会
研
究
方
法
论
是否存在客观的社会规律
应采用何种方法研究社会现象
如何判断社会科学知识的真理性
价值中立与否
二、社会规律的性质
1、社会总体的统计规律
2、社会制度约束的行为模式
3、社会特定时期的经验规则
三、解释与理解的方法
1、自然科学的客观解释:因果解释
2、社会研究中的主观意义
韦伯:一个女孩子在大街上眨眼睛。
3、投入式理解的方法
4、社会研究中因果解释与理解相结合
四、价值与客观性
1、价值中立与价值介入的争论
2、科学的真理性争论
3、科学的功能性争论
实证主义&人文主义
五、社会研究范式
1、后实证研究范式
继承和发展了实证主义方法论
2、阐释研究范式
继承和发展了人文主义方法论
3、批判诠释理论范式
批判+诠释
4、后现代主义范式
反理性
反逻辑
反中心
反本质
第二章 社会研究的主要过程和内容
第一节 社会研究的主要阶段
第二节 确定研究课题和研究假设
第三节 研究单位与研究内容的确定
第一节 社会研究的主要阶段
一、准备与设计阶段
1、确定研究课题
2、初步探索
3、调查研究的总体设计(设计调研方案)
二、资料搜集阶段
三、资料分析阶段
补充:调查方案的主要内容
1 说明调查课题的目的和意义:
2. 说明调查的内容.
3.说明调查范围和方法,时间和地点
4.调查对象
5.说明抽样方案
6.说明调查人员的组成,组织结构及培训安排.
7.确定调查的时间进度和经费使用计划.
第二节 确定研究课题和研究假设
一、研究课题的设定
1、廓清研究课题
2、研究课题的论证
理论意义
实践意义
迫切性
可行性
研究条件
二、确定研究类型
1、研究性质:应用研究和理论研究
2、研究目的:
描述性研究:是什么
解释性研究:为什么
探索性研究:大致如何
3、研究时间:横剖研究&纵贯研究
横剖研究:
在某一个时间对研究对象进行横断面的研究。
上海人民对世博会的态度调查。
纵贯研究:
在不同的时点或较长的时期内观察和研究社会现象。
(1)趋势研究:对研究对象随时间推移而发生的变化进行
研究。“上海老年人养老选择”趋势调查
(2)同期群研究:对同一时期同一类型的研究对象随时间
推移而发生变化的研究。三十年来“老三届”政治态度研
究。
(3)追踪研究:对同一批研究对象随时间推移而发生变化
的研究。“中科大少年班”追踪研究;江村研究。
4、调查对象的范围:普查、抽样调查和个
案调查
三、提出研究假设
1、具体研究假设必须满足的条件
(1)有明确的概念为基础;
(2)能够为经验事实证明或证伪;
(3)有明确的假设适用范围;
(4)具备假设检验的条件;
(5)应该清楚与相关社会科学理论的相互关
联。
2、提出假设的方式
查阅文献;
实地考察或访谈;
两者结合。
3、提出假设的步骤
(1)在确定要研究的问题和目标后,既要
对研究中需要解释的现象作出概括,也要
得出用来解释的社会特征的抽象概念。
(2)明确概念之间的相互关系
(3)将一组相关的解释命题,按其相互之
间的逻辑关系和先后秩序关联起来,建立
命题体系。
4、假设的陈述:变量及其相互关系
变量:给出具体操作化定义的概念
自变量:在一组变量中,能够影响其他变
量发生变化,而又不受其他变量影响的变
量
因变量:在一组变量中,依赖于其他变量,
而又不能影响其他变量的变量
(1)相关关系
(2)因果关系
(3)虚无关系
第三节研究的单位与研究内容的确定
一、研究单位
研究单位也称之为分析单位,就是在研究
范围内的所有研究对象的基本单元。
研究单位与调查对象
研究单位的层次:
个人
群体
组织
社区
社会产物与社会结构
二、研究内容
存在状态
主观倾向
实际行为
第三章 测量
第一节 测量的特征
第二节 测量的尺度
第三节 概念的具体化和操作化
第四节 信度的评估
第五节 效度的评估
第一节 测量的特征
测量就是对做确定的研究内容或调查指标
进行有效的观测与度量。
要素:
测量客体:测量谁
测量内容:测量什么
测量法则:如何测
数字和符号:测的结果
有效测量必须满足的三个条件:
准确性;
完备性;
互斥性;
第二节、测量的尺度
一、定类测量或名义测量
在任何一门科学中,最基本和最简单的
操作是分类(或组)。只要类别是可穷尽
的,且总体单位对分类而言是互斥的,那
么便可以使用定类尺度来进行测量。
例如我们可以按肤色把黑种人、白种人和
黄种人归于不同的类,但我们决不能说哪
一种肤色的人较优或最优。
定类尺度的特征是没有方向性,只能划分
类别;不能比较高低,只能计算各类中总
体单位出现的次数;不能加减,更不能乘
除,只能表征为“=”或“≠”。常见的定
类尺度有性别、血型、宗教信仰等。
二、定序测量或次序测量
如果我们不仅可以区分出类,而且可以
排列出各类的顺序,那么测量便提高到定
序尺度。
例如对人们的态度进行量度,不仅可以区
分出类,而且还可以排出“非常赞成”、
“赞成”、“中立”、“不赞成”、“非
常不赞成”这样的顺序。还有社会地位、
教育程度等都是常见的定序尺度。
定序尺度具有反对称性和传递性。所谓反
对称性,系指A>B,B≯A。或者说当A>B
时,不可能有B>A。定序尺度仍具有传递
性,因如果A>B、B>C,A>C必能成立。
必须指出,定序尺度的特征是方向性,虽
然在类别之间可以做比较,却无法获得它
们之间差值大小的信息。有时研究者测量
人们对某事的态度,固然可以用离散变量l,
2,3,4,5来对“非常赞成”、“赞成”、
“中立”、“不赞成”、“非常不赞成”
进行编码。但这些数值并不是各等级之间
的真实距离,而只是为了统计方便而设的
代码。
因此在这一测量层次,我们一般无法进行
加、减、乘、除的运算,只能进行大于和
小于的运算。
三、定距测量或等距测量
如果我们不仅可以测量被研究对象的
类别和顺序,而且还可以获得有关它们
之间差值的信息,那么测量便提高到了
定距尺度。
必须指出,在定距尺度这一层次上可以做
加减法运算,无法做除法运算。如量度两
杯水的温度,测得一杯为20℃,另一杯为
l0℃,可以知道后者比前者低l0℃,但不能
说后者是前者的一半。因为在定距尺度这
一层次上,零点是任意确定的。
四、定比测量或比例测量
如果我们在定距尺度上可以确定一个绝
对的或非任意性的零点,那么测量便提高
到了定比尺度。定比尺度的特征是两个数
可以组成一个有意义的比率,例如50岁人年
龄是25岁人年龄的两倍。
定比尺度各类别之间可以做除法运算。常
见的定比尺度有身高、体重、人数、收入
等。
关于变量层次几点重要说明:
(1)高一层次的尺度除自己的特性外,必
包含着下一层次尺度的所有特性,层次越
高,数学特质越丰富。 反之则不成立。
(2)比较
尺 特征
度
数字性 平均量度值 统计检验
质
定 相互排斥且可
类 辨别的类别
=,= 众数
X2检验
定 等级顺序大于
序 或小于
>,<
符号秩检验
众位数
定
距
尺
度
尺度上的单位具有相等的 +,意义
算术 T检
平均 验,
数
F检
验
定
比
尺
度
有一个真正意义的零点
几何 T检
平均 验,
数
F检
验
×,÷
(3)用较低尺度收集的资料不能用较高尺
度的数学运算来处理,反过来则可以。比
如在很多研究时都要尽量手机更多更精确
的信息,分析时仅做一些简单的运算,虽
然浪费,但是也比反过来好。
(4)社会现象大多数是定类和定序,有时
也可以通过虚拟变量改变为的方法进行高
层次的变量处理。
(5)一个变量具体运用哪一层次的尺度测
量,要根据研究所要求的精确度
(6)在社会研究中,只满足定距而不能同
时满足定比的变量并不多。如智商
对下列标志进行测量,哪些是定类尺度?哪些是
定序尺度?哪些是定距尺度?哪些是定比尺度?
(1)年龄
(2)性别
(3)籍贯
(4)血型
(5)体温
(6)体重
(7)教育程度 (8)婚姻状况 (9)知名度
(10)月薪
(11)智商
(12)路程
(13)温度
(14)能力
(15)每月工作天数
第三节、概念的具体化与操作化
一、概念的具体化过程
1、概念的形成
2、概念的界定
第一步 概念分解;
第二步 抽象定义
经过严格定义的概念就是变量。
3、选择测量指标
4、编制综合指标
二、概念的操作定义
概念的操作定义是依据抽象定义所界
定的概念内涵和外延提出一些可观测的调
查指标或调查项目来说明如何度量一个概
念.
举例抽象定义:人口增长和智力
操作定义:
人口增长
=出生人口-死亡人口+迁入人口—迁出人口
智力(高低)
= 智力量表中几十项指标的分相加的总分
通过操作定义概念就转换为变量形式
再如情商:
这个概念如何测量?如何操作化?
操作定义的重要作用:
可以使抽象概念与经验现象联系起
来,从而使经验研究成为可能.
它有助于对现象进行精确,客观的描
述和比较,如比较不同人的智力水平.
它有助于对调查研究结论进行客观
检验
___________________社会剥夺__________________
↓
↓
↓
社 会 孤 立
社 会 歧 视
社 会 权 力 剥 夺
↓
↓
↓
界定其主要内容和表现 界定歧视的各种类型 界定社会权利的各个方面
↓
↓
↓
指标;
1 朋友的数目
2,与其他家庭的来往
程度
3,活动区域
4 社交活动
……
指标;
1,性别歧视
2,种族歧视
3,职业歧视
4,政治歧视
……
指标;
1 受教育权利的剥夺
2.社会交往权利的剥夺
3.公民权利的剥夺
4,移民权利的剥夺
……
第四节、信度的评估
信度和效度是衡量测量(调查)的质量高低和好坏!
一、信度(Reliability)
信度是指测量数据(资料)的可靠性
程度,即测量工具能否稳定地测量
到它要测量的事项及其程度。
信度是指测量的稳定性与一致性.
二、信度检验的方式
1、重复测量(再测信度)
用同一种试验对同一群受试者,前后测验
两次,再根据受使者两次测验分数计算其
相关系数,即得出再测信度,这是一种最
普遍,最常用的信度检查方法 .
比如,调查在校大学生对无偿献血的意愿,第一
次测量结果是愿意参加的人占87.8%,一周后再
次测量结果是愿意参加的人占88.0%,两次调查
的结果相差0.2%。
然后计算再测信度。前后两次调查的结果非常接
近,这表明调查结果是稳定的,对在校大学生无
偿献血调查所采用的方法是可信的,也就是说调
查信度很高。
2、对分测量(折半信度)
将调查来的结果按题目的单双分成两半计
分,再根据各个人的这两部分的总分计算其
相关系数,就得到折半信度
3、复本测量(复本信度)
复本是相对于原本而言的,它是原本的复制品,对一
项调查的问题,让被调查者接受问卷测量,并同
时接受这份问卷的复本的调查,然后根据调查结
果计算其相关系数,就得出了复本信度。
例如,老师考试一般都会出A、B卷,A卷用于正
式的考试,而B卷则用于缓考、补考。只要A、B
卷等价,两套试卷测量学生课程学习的效果应该
相当的。
再测信度是一套测量工具两次调查,
复本信度是两套测量工具两次调查,
折半信度则是一套测量工具一次调查。
4、主观评分法(评分者信度)
计算一个评分者的一组评分与另一个评分
者的同一组评分的相关系数。即评分者信
度。
三、影响信度的因素
1、被调查者:
是否耐心,认真,专注,不受情绪波
动影响,一般说来调查时间越长,提出的
问题越多,越复杂,信度越低。
2、调查者:
是否按规定程序和标准,是否有意或
无意地对被调查者施加影响,纪录的认真
程度等。
3、测量内容
是否措辞含糊不清,不易理解,一致性差
等,
4、测量环境和时间
研究人员对被调查者有较大的干扰,他
人在场的影响,两次测量的时间间隔太长
等。
第五节 效度的评估
一、效度的概念
测量的含义:
一方面测量效度指的是所测量指标内涵正是概念内涵,
二者在内容性质上是一致的;
另一方面测量指标应该尽可能涵盖概念,二者在程度
上应尽可能重合。
效度越高级表示测量结果越能显示出所要测量对象的真正
特征。
比如说,《社会研究方法》课程要进行期末考试,一份试
卷考出来结果较之学生们的实际水平普遍偏低。由于这份
试卷未能真实地反映出该课程教学、情况,该测量应该说
试卷是缺乏效度的。
二、效度检验方式
1、评价内涵效度(内容效度)
内容效度是指测量指标同我们所研究的概念内涵
的相符程度,判定指标是否反映了概念的基本内
容。
例如,我们要用问卷去测量中学生的“学
习负担”,那么我们首先要弄清“学习负
担”的定义,然后看问卷中的问题是否都
与“学习负担”有关。如果我们看不出问
卷中有问题与“学习负担”无关,那么我
们就说,该测量具有内容效度。
2、确立效度标准(准则效度)
准则效度指的是用几种不同的测量方式或不同
指标对同一变量进行测量时,将其中的一种方
式或指标作为准则,其它的方式或指标与这个
准则做比较。如果其它的方式或指标与准则的
方式或指标具有相同的效果,则其它的方式与
指标就具有准则效度。
3、结构效度
测量工具反映概念之间关系的程度。
4、外在效度和内在效度
外在效度是这种研究结论的普遍有效性
内在效度是一项研究的资料和结论的有效
性。
三、信度与效度的关系
1、信度低,效度不可能高
2、信度高,效度不一定高
3、效度低,信度有可能高
4、效度高,信度一定高
第四章
抽样
第一节 抽样概述
第二节 概率抽样的方法
第三节 非概率抽样的方法
第一节
抽样概述
一、抽样的概念
按照一定的方式,从总体中抽取能代表总
体的样本,然后根据样本信息推断总体信
息。
二、抽样调查的发展简史
现代抽样技术始于美国大选民意测验的发
展。
(一)《文学文摘》的成败
《文学文摘》是美国1890-1938年期间的一份普
及型新闻杂志。
1920年,该杂志第一次尝试对当年的美国总统大
选进行预测。他们根据电话号码簿和汽车执照登
记名单向全美6个州的公众发出明信片,询问在即
将进行的总统选举中,是会投“哈丁”的票还是
会投“科克斯”的票。《文学文摘》根据回收的
明信片统计调查结果,准确的预测出哈丁将当选
总统,该杂志由此名声鹊起。
在接下来1924年、1928年和1932年连续三届
的总统大选中,《文学文摘》杂志用同样
的发放明信片的方式,准确预测了谁会当
选总统。
1936年,美国总统大选在罗斯福和兰登之间
展开,大选之前《文学文摘》杂志发出了
空前的1000万张明信片,并回收了200万张,
预测罗斯福和兰登的得票比例为43:57,认
为兰登将当选。就在人们表示信以为真时,
最后的选举结果却是罗斯福以61%的选票当
选,《文学文摘》杂志从此名声下降。
原因在于样本的偏差:
汽车和电话用户的拥有者
盖洛普的成功
1、配额抽样的首次运用
在这一次的大选预测中,另一个年轻的民意测验
者盖洛普 获得了首次成功,他采用配额抽样技术
正确地判断出罗斯福将获胜。后来的总统大选预
测中,盖洛普和他的美国民意测验中心取代了
《文学文摘》杂志的地位。
在随后的预测中1940、1944预测都相当成功。
2、配额抽样的失败与概率抽样的兴起
1948年,预测失败了!
杜威--杜鲁门
现代总统大选中使用的民意测验技术已经
相当成熟,取2000左右的样本规模,就可以
得到非常好的预测结果,而早年《文学文
摘》杂志动辄回收几百万份问卷却预测失
败了,这正是抽样技术的奥妙所在。
三、抽样的基本术语
1、总体
研究对象的集合体称之为总体。
2、样本( sample )。
样本是指从总体中抽取出来的那一部分进行调查
的分析单位的集合体。
例如,我们从上海市大学生中抽取500名大学生来
进行“上海市大学生体育锻炼爱好”情况的调查,
这500名大学生就构成一个样本。
样本中的单位,叫样本单位。如上例中,500名大
学生中的每一人,都是样本单位。
样本中含有的分析单位的数目,叫样本容量(一
般用英文字母n表示),也称样本大小。如上例中,
500就是样本容量。
3、抽样单位( sampling unit )。
在社会调查研究中,分析单位是我们进行信息收
集和分析的基本单位。
而当我们确定采用抽样调查进行社会调查时,习
惯于把分析单位称为抽样单位。抽样单位可以是
一个人,也可以是一个家庭、一个群体或者组织,
比如公司、学校等等。
显然,在一个既定的抽样调查中,抽样单位和分
析单位是同一个概念。不过,在抽样设计阶段我
们习惯于以抽样单位相称,在资料分析阶段我们
则还是习惯于以分析单位相称。
4、抽样框( sampling frame )。
抽样框就是抽样单位的具体化的实际名单。
在社会调查研究中,抽样框是和调查总体相对应
的一个概念。在抽取样本前,把总体各单位区别
开来并做出一览表,每一个单位只列入一次,这
个一览表就叫做抽样框。
比如调查总体是上海财经大学的本科生,那么在
抽取样本前,我们必须掌握上海财经大学全体本
科生的名册,这就是抽样框,样本是从这个名册
中产生的。
6、总体参数( 总体指标 )和样本统计量。
总体参数是关于总体中某一变量取值的综
合描述,即根据总体中各单位的已知量计
算出来的关于总体的统计指标,如上海财
经大学大一男生的平均身高。在抽样调查
时,这个量一般是未知的(但是唯一的)。
因为如果这个量已知,就不必进行抽样调
查了。
样本统计量是关于调查样本中某一变量取值的综
合描述,即根据样本中各单位的已知量计算出来
的关于样本的统计指标。如在上海财经大学大一
男生中随机地抽出200个人组成一个样本,测得每
个人的身高,然后计算出这200个男生的平均身高
便是。
样本统计量,当抽样调查完成后即可计算出来,
但它不具有唯一性。抽样调查就是运用样本统计
量去推断总体参数,而这种推断误差总是难免的。
7、抽样误差( sampling error )。
抽样误差是指由于抽样方法本身导致样本
统计量和总体参数之间的差异。
用样本统计量去推断总体参数时,误差总
是不可会避免的。科学的抽样设计其目的
在于尽可能减少这种误差。
非抽样误差在抽样调查中由于人为的差错
或者不可控制的因素所 导致的误差。
四、概率抽样和非概率抽样
1、概率抽样
概率抽样是指在抽样时遵循随机原则使总
体内的所有个体具有相同的被抽入样本的
概率。
2、非概率抽样
非概率抽样主要按照抽样的方便性、主观判
断、主观意愿来选择研究对象。
五、概率抽样的过程
1.界定总体
根据调查的目的要求,确定调查对象的
范围,包括时间,地点,和人物,
例如我们要研究上海财大大学生生活态
度,可以界定总体的范围如下,2006年下
半年海财大大一至大四的在校本科大学
生.总体的定义越清楚越好,由样本所得
的研究结果,原则上只能推论到这个所界
定总体范围.
2、确定抽样框
将总体按照抽样单位划分为各个部分,
这些部分还必须互不重叠,又能合成总体,
然后将其毫无遗漏地编制成表,既抽样框,
在复杂的多阶段的抽样中,相应的各个阶
段有多个抽样框,
在应用之前必须审核其完整性
和准确性,例如,有无遗漏,有无列于名单
上但实际上不存在的个案,有没有重复或
不属于研究范围的等等.
3、选择抽样方式
4、实际抽取样本
5、对样本进行评估
在样本抽出后,需采用各种调查方法对样
本进行实际调查以收集资料,最后对收集到
的资料进行计算并将结果推论和说明总体.
在开始调查之前要对样本进行评估,评
估的目的是初步检查样本的代表性,以免由
于前面步骤中的失误使样本偏差太大,
评估样本可以采取收集若干容易得到的
资料作为总体和样本之间的比较方法.
如果样本与总体的情况相似,这样的样本
就有代表性,如果两者资料相差甚多,则表
明前面的抽样步骤有问题要检查,修正.
六、概率抽样的原则
1、目的性原则
2、随机性原则
3、效果最佳原则
第二节、 概率抽样的方法
简单随机抽样;
系统抽样;
分层抽样;
整群抽样;
多阶段抽样;
PPS抽样
一、简单随机抽样
1.内涵
简单随机抽样又称为纯随机抽样,它是
最基本的概率抽样,其他概率抽样都可以看
成是由他派生出来的.
简单随机抽样对总体中的所有个体按
完全符合随机原则的特定方法抽取样本,既
抽样时不进行任何分组,排列,使总体中的
任何个体都同样有被抽取的平等机会,对总
体中的所有分子一视同仁,毫无例外.
2.方法:
小总体时 抓阄,抽签,
较大总体时 随机数字表使用方法.
3、优缺点:
优点:
最理想的概率抽样方法;
没有偏见,简单易行;
有一条健全的理论和统计方法推论总体参
数;
缺点:
当总体太大时,费时、费力、费钱;
当总体异质性太大时,误差就比较大;
二、系统抽样
它是简单随机抽样的一个变体,具体做法是:
1.将总量的所有个体按一定顺序排列.
2.计算抽样距离.距离是由总体数目与样本
数目决定的.如果总体数为N,样本数为n,则
抽样距离应是:
N
K=——
n
3.在第一个K个个体中,用完全随机的方
法抽取一个个体,设其所在的位置的序号为m
4.自 m 开始,每隔K个抽取一个体,依次抽
取的位置序号为m.,m+k. m+2k ,m+3k.
m+2k…,m+(n-1)k。
5、将这n个单位合起来,就构成从该总体所
要抽取的样本。
从原理上来说,简单随机抽样和系统抽样是一样
的,因此其优缺点也相仿。
等距抽样与简单随机抽样相比,样本分布更为均匀,
抽样误差更小,是一种更广泛应用的抽样方法.
如果总体分布出现如学校、军队这样的分布规律时,
容易出现错误
小故事:一次失败的二战士兵调查
二战期间,美国军方委托社会学家对军队士兵进行一项抽样调查。在进行抽
样之前,研究者对军方提供的总体名单未作认真考察,他们在不知道该单位
名册是按照十个士兵组成的一个班内的军队军衔级别进行排序的(如上士、
中士和下士)的情况下,就确定将名单混在一起作为抽样框。具体调查过程
中,研究者按照等距抽样的规则计算出抽样间距是10,于是在每十个士兵选
择出一个作为样本,这个抽样间距正好与班内的军衔级别重合,结果导致样
本中的士兵全部是上士,中士和下士一个都没有。显然,这个抽样没有实现
具有代表性的样本,而是一个上士士兵调查的样本,最后的调查结果不是说
明所有士兵的情况,最多只能说明军衔是上士的那些士兵的情况。调查宣告
失败。
三、分层随机抽样
1.分层抽样的内涵
分层随机抽样是将总体依照某一种或某几种特性分
为几个子总体,每个子总体称为一层,然后从每一层中
抽取一个字样本,将这些子样本合在一起即为总体的样
本.
比如说,我们要在学生中进行抽样时,可以先将学校按大学、中学、小
学分层,然后随机抽样在各个层中分别地进行,最后把从各层中抽取的
学生合并起来构成总体样本
2.分层抽样种类:
按各层子样本容量的确定方式分层
抽样一般分为按比例分层抽样和异比例分
层抽样.
四、整群随机抽样
整群抽样是将总体按照某种标准化分为一些子群
体,每个子群体作为一个抽样单位,用随机的办法从中
抽取若干子群,将抽出的子群中所有个体合在一起作
为总体的样本.
举例来讲,要对某市大学生的体质状况做一次抽样调查。该市
共有大学生5万人,分布在30所大学中。我们先从30所大学中随
机抽取 5所大学,然后对所抽中的学校的全部学生逐个进行调
查,这便是整群抽样。
整群抽样与分层抽样有相似之处,第一步都
是按某种标准将总体划分为一些子群.
但是分层抽样是在所有子群中均抽取
一个子样本,作为总体样本的一部分,而整
群抽样是抽取若干子群,并将抽出的子群中
全部个体作为样本,总体样本只分布在几个
群中。
五、多阶段抽样
多阶段抽样是按总体内部元素之间的层次
关系,把抽样过程分成若干阶段进行的抽样方
式。
它通常在第一阶段使用严格的随机抽样方
法,而从第二阶段起使用概率比例抽样,即根
据每一群所含个体的多少分配样本名额.
例如,某市有23个区,共714万人,从中抽取
1000人的样本,将区作为初级抽样单位,每区人数
不等,把每区人数的号码范围列出,东区是1120000号,西区是120001-270000号…..一直排到
7140000号.从这些号码中用随机数字表确定10个
号码,则这10个号码所落入的区即为调查区.如仇
中340000号,它落在南区,则南区为调查区,从这
10个调查区中,每区再随机抽取100人就构成最终
样本.
多阶段抽样特别适用于调查范围大,单位多,
情况复杂的调查对象,但多阶段抽样由于在每一
阶段抽样是都会产生误差,因此经多阶段抽样得
到的样本的误差也相应增大.这是它的不足之处.
六、概率与规模成比例抽样(PPS抽样)
指在多阶段抽样中,尤其是二阶段抽样中,
初级抽样单位被抽中的概率取决于其初级
抽样单位的规模大小,初级抽样单位规模
越大,被抽中的机会就越大,初级抽样单
位规模越小,被抽中的概率就越小。就是
将总体按一种准确的标准划分出容量不等
的具有相同标志的单位在总体中不同比率
分配的样本量进行的抽样。
七、样本规模的确定
研究的精确度;
总体性质;
分析要求;
抽样方法;
无回答;
经费。
第三节 非概率抽样
概率抽样能够排除调查者的主观影响,抽选出郊游代
表性的样本,并能够确知和控制抽样误差的大小。
但是在很多情况下,这种严格的随机抽样很难进行,
例如,由于调查对象的总体边界不清,无法编制随机抽样
所应具备的抽样框,因而无法进行随机抽样.
有时调查的目的仅仅是对问题做出不探索,获得研究
的线索和提出假设,而不是有样本推论总体,在这种情况
下一般代之以非概率抽样.
一、偶遇抽样
偶遇抽样是指研究者按照方便性原则
将其在一定时间内,一定环境里所能遇
见或接触到的人均选入样本的方法。
“街头拦人”
由于是依据调查者的方便任意选取样
本,也称为方便抽样.
偶遇抽样的优点是方便省力.但是样
本的代表性差,又很大的偶然性.
二、主观抽样
分为两种情况:
判断抽样,研究者依据主观判断选取认为可以
代表整体的个体作为样本的方法。
比如选取有代表性的农民工。
立意抽样,研究者有目的选择样本。
选择蚁族代表。
三、配额抽样
配额抽样是按调查对象的某种属性或特征将总
体中所有个体分成若干类或层,然后在各层中抽样,
样本中个层所占的比例与它们在总体中所占的比
例一样.但是不同的是分层抽样中各层子样本是随
机抽取的,而定额抽样中各层的子样本是非随机抽
取的.
定额抽样是以代表总体为目的的.因此必须对
总体的性质有充分的了解.但是,一方面分层时只
能考虑众多属性中的几种,另一方面,新的变化信
息又不易得到,因此样本的代表性要受影响.
例如某大学共有2000个应届毕业生,其中58%是女性,42%是男性;
60%生源地是东部地区,29%生源地是中部地区,11%生源地是西部
地区。那么在一项关于毕业班学生就业去向的样本容量为100的配额
调查中,样本单位的性别比例和生源地比例也应该和总体单位的性别
比例和生源地比例相当,即在调查对象中应该有58个女性,42个男性;
60个为东部生源,29个为中部生源和11个为西部生源。
四、滚雪球抽样
滚雪球抽样是首先从几个适合的调查对
象开始,然后通过得到更多的对象,一步
步扩大样本范围。
比如同性恋调查。
吸毒者群体调查
第五章 定量研究方法
第一节 问卷调查方法
第二节 量表法
第三节 实验的方法
第四节 二次数据分析
第一节 问卷调查法
一、问卷的结构
题目
封面信
指导语
问题和答案
编码
结束语
1、题目
很容易忽略
问卷的标题则常常以“关于……的调查”
为基本形式。
2.封面信 (WWH三原则)
首先 要说明调查者的身份(who).
其次 要说明调查的大致内容和进行
这项调查的目的(why);
最后 要说明调查对象的选取方法和对
调查结果保密的措施(how).
封面信
说明身份
调查的大致内容、
目的
说明保密措施
感谢语
亲爱的先生(女士)
我们正在进行一项调查,目的是想了解人们在收听广播和收看电视时,
对什么节目感兴趣,对什么节目不感兴趣。
我们给遍布在全国各地的具有代表性的人们写信,请他们把他们的意见告
诉我们。为了确保把所有这些意见都收集起来,我们渴望每个收到信的人都
给我们回答。
随信寄来一份问题表和一个贴好邮票的信封,请您根据自己的情况填写,
并请及时将表寄回。
请注意我们需要的是您的意见,请不要让别人代您填写,那样的话,我
们就收集不到有代表性的意见了。
衷心感谢您的帮助!
您的:司戈特
请将问题表寄至:曼彻斯特、3区 大街1号情报中心办公室
中国儿童发展中心(CCS—2002)
家长调查表
学生编号□□□□□□□□
亲爱的家长:您好!
首先请原谅打扰了您的工作和休息!
儿童是祖国的未来,儿童的成长和教育是家长们十分关心的
问题。为了探索儿童成长和教育的规律,我们在北京,湖南,安徽,
甘肃等地开展了这项调查,希望得到家长们的支持和帮助。
本调查表不用填写姓名和工作单位,各种答案没有正确错误
之分,家长们只需按自己的实际情况在合适的答案上打√,或者在
______中填上适当内容。请您在百忙之中抽出一点时间填写这份调
查表。
为了表示对您的谢意,我们为您的孩子准备了一份小小的礼物,
作为这项调查活动的纪念。
祝您的孩子健康成长!
祝您们全家生活幸福!
北京大学社会学系“儿童发展研究”课题
组
3 指导语
指导语是用来指导被调查者填写问卷的一组说
明.其作用与仪器的使用说明书相似,有些指导语集
中在封面信之后,并标有“填表说明”的标题,其作
用
是对填表方法,要求,注意事项等作一个总体说明。
例如:
填 表 说 明
1. 请在每一个问题后适合自己情况的答案号码
上画圈或者在_处填上适当的内容.
2. 问卷每页右边的数码及短横线是上计算机用
的,您不必填写.
3. 若无特殊说明,一个问题只能选择一个答案.
4. 填写问卷时,请不要与他人商量.
4.问题和答案
问题和答案是问卷的主体,即题器。
5.编码
所谓编码就是赋予每一个问题及
其答案一个代码,编码的工作即可在
问卷设计时就设计好,也可等调查完
成后再进行,前者称为预编码,后者称
为后编码.
6、结束语
表示感谢等。
二、问卷的设计过程
1、确定测量内容
2、设计问卷初稿
卡片法
第一步:根据探索性工作,将设计的每一个问题和选
项放在一张卡片上。
第二步:按照卡片的主题和内容分成堆。
第三步:每一推按照逻辑和习惯排序。
第四步:根据问卷逻辑,排出各堆的顺序。
第五步:调整
第六步:将卡片上的问题写到纸上,形成问卷初稿。
框图法
第一步:根据研究假设和逻辑,画出问卷各部分
及前后顺序框图;
第二步:根据回答者的情况和心理,堆框图前后
顺序进行调整;
第三步:设计每一部分的问题和选项,并排出顺
序
第四步:对全部问题的形式和顺序进行调整,形
成初稿。
3、试调查
三、题器及其形式
问题从形式上看,可分为开放式(openended)问题和封闭式问题(closed-ended
question) 两类。
开放式问题 是不为回答者提供具体答
案,而由回答者自由填答。
封闭式问题 就是在提出问题的同时,还
给出若干个答案,要求被调查者选择一个或几
个作为回答。
封闭式问题形式主要有下面几种:
1. 填空式 即在问题后面划一短横线,让回答
者填写。
如:① 您的年龄是
岁?
② 您家有几口人?
人
③ 您有几个孩子 ?
个
④ 您每天上班需要
(分钟)时间?
填空式一般只用于那些对回答者来说即容
易回答也易于填写的问题,通常只填数字.
2. 是否式
答案只有“是”和“不是”(或者其他肯定和否定
形式)两种.回答者根据自己的情况选择其一。如:
① 您是共青团员吗?
是 □
不是 □
② 您住在本市吗?
是 □
不是 □
③ 您家有空调吗?
有 □
没有 □
④ 您赞成学分制吗 ? 赞成□ 不赞成□
是否式问卷是在民意测验的问卷中使用得最多的一
种,其特点是回答简单明了,可以严格地把回答者分成两
类不同的群体,但其弱点是得到的信息量太小,两种极端
的回答类型不能了解和分析回答者中客观存在的不同层
次.
3.多项单选式.
给出的答案至少在两个以上,回答者根据自
己的情况选择其一,这也是问卷中采用最多的一
种问题形式.
如:⑴ 您的文化程度是
① 小学及以下
② 初中
③ 高中或中专
④ 大专以上
4. 多项限选式
指在所列举的多个答案中,要求回答者根据自己情
况从中选择若干个.
您喜欢看那一类电视节目(请最多选择三项打√)
①
新闻节目
②
电视剧
③
体育节目
④
广告节目
⑤
教育节目
⑥
歌舞节目
⑦
少儿节目
⑧
其他(请注明)
多项限选式比多项选一的方式更能反映被调查者
的实际情况,但是我们无法从答案中看出被选择的顺
序,无法区分选项间的程度差别.
5.多项排序式
在所例举的多个答案中,选择两个以上的答案,
并且要求被调查者为自己的选择答案排序.
您最喜欢看那一类电视节目,(请将答案号
码填入下表中)
第一
①
新闻节目
第二
第三
②
电视剧
③
体育节目
④
广告节目
⑤
教育节目
⑥
歌舞节目
⑦
—
少儿节目
⑧
其他(请写明)—
6.多项任选式
多项任选式是在所提供的答案中,被调查者可
以任意选择各种不同数目答案的一种问题形式.
如:您家有哪些家用电器?(请在题号上打√)
① 彩色电视机
② 录像机
③ 空调
④ 电冰箱
⑤ 电脑
⑥ 微波炉
⑦ 电话
⑧ 其它(请明)______
7.矩阵式
这是一种将同一类型的若干个问题集中在一起,构成一各问
题的表达方式.
您对沈阳电信提供的服务看法如何?(请在所选方框内打√)
很满意
满意 基本满意 不满意 很不满意
① 装机移机服务
□
□
□
□
□
② 话费查询服务
□
□
□
□
□
③ 电话障碍修复
□
□
□
□
□
④ 公用电话服务
□
□
□
□
□
矩阵式的优点是节省问卷的篇幅,同时把同类问题放在
一起,回答方式又相同,也节省了回答者阅读和填写的时间。
8.表格式
这是矩阵式的一种变体,其形式与矩阵式十分相似比如上述
矩阵式问题对应的表格式问题就是:
您对沈阳电信的下列服务看法如何?(请在所选方框内打√)
很满意
①
②
②
满意
基本满意
不满意
很不满意
装机移机服务
话费查询服务
③
电话障碍修复
④
公用电话服务
表格形式的问题除了具有矩阵形式的特点外,还显得更为整
齐,醒目.但是应当注意的是,这两种形式虽然具有简单集中的优
点. 但是也同时使人产生呆板,单调的感觉,在一份问卷中这两
种形式的问题不易用得太多,另外,这两种形式只能减少问题在
问卷中的篇幅,并不能减少其数量,比如上述例题中实际上就包
含了四个问题。
9、相倚问题
选择问题中的某一选项后需要继续回答与
之相关的其他问题。
相倚问题的格式常常如下:
例,您是退休人员吗 ?
① 是的 → 请问您是哪一年退休的?____年.
② 不是
有时相倚问题中又有相倚问题,
其设计方法类似
您有孩子吗 ?
①有 →
② 没有
您有几个孩子?
① 一个孩子—→
② 两个孩子
③ 三个以上孩子
您孩子领独生子女证了吗?
1.
领了
2.
没有领
有时一连好几个问题都只适用于
一部分回答者,设计时往往采用跳答式
的方法来解决.如下例:
您的孩子是独生子女吗?
① 是的
②不是的→
请跳过 10-15 题,
直接从第 16 题接着回答.
这个例子中问题10—15都是询问有关独生子女
家庭情况的,对于多子女家庭来说显然不适用,
所以通过跳答指示他们从问题16开始答起。
四、问卷设计的基本要求
1、问卷的结构要清晰。
同一主题的内容要集中起来,不要引起被
调查者思维跳跃太快。
2、题器顺序的安排要得当。
(1)符合被调查者的思维和逻辑习惯。
(2)先易后难。
(3)先行为类问题,再态度和意见类问题。
(4)先封闭式,后开放式。
3、问卷语言要尽量口语化,尽量简短,不要引起
歧义。
你对单位近年来的情况的感觉是:
A几乎没有什么变化;
B变化不大
C变化很大
您认为我们国家现在最需要:
1、全面迅速的改变
3、部分迅速的改变
2、全面缓慢的改变
4、部分的缓慢改变
您是否适应在财大的学习和生活?
1、很适应 2、基本适应
3、不适应
4、避免问被调查者不知道的问题以及过于
敏感的问题。
您的家庭是:
1、核心家庭 2、主干家庭 3、联合家庭
4、丁克家庭 5、其他____
5、提问的态度要客观,不要带有倾向性。
看了《英雄》和《卧虎藏龙》之后,提高了你
对中国武术的兴趣,是吗?
1、没有提高 ;2、提高了一点
3、提高很多 ;4、对武术更感兴趣了
有学者认为,房地产保有税的结果将有利于
控制房价,您的看法:
1、同意
2、不同意
3、不知道
6、避免使用否定式。
五、问卷调查的组织与实施
问卷:
操作化的程度;
专业术语;
发问的形式;
指导语;
提问的用词;
提问的主题;
访问员:
个人特征;外表;
访问动机;信誉;
态度;理解能力;
行为表现;技能;
知识;
问卷调查误差
被调查者:
个人特征;
知识;兴趣;期
望;状态;态度;
调查环境:
访问的方式;
标准化程度;
访问员的训练;
访问员的监控;
访问员的培训与控制
访问员的差错导致的误差:
询问误差:更改询问的标准化流程
追问误差:不适当的追问甚至带有偏见的
追问
记录误差
欺骗误差
1、调查员挑选
一般条件:
诚实与认真
兴趣与能力
勤奋负责
谦虚耐心
特殊条件
政治、经济问题,应选男性为主;
婚姻、家庭等,应选女性为主;
根据方言与风俗习惯;
2、调查员的培训
动员;
强调制度规则;
示范;
3、对访问员的督导
4、问卷审核
第二节 量表法
一、瑟斯顿量表
是L.L.瑟斯顿及其同事E.J.蔡夫于1929年提出的,称之为瑟
斯顿量表法。这个方法首先搜集一系列有关所研究态度的
陈述或项目,而后邀请一些评判者将这些陈述按从最不赞
同到最赞同方向分为若干类,譬如11类。经过淘汰、筛选,
形成一套约20条意义明确的陈述,沿着由最不赞同到最赞
同的连续统分布开来。要求参加态度测量的人在这些陈述
中标注他所同意的陈述,所标注的陈述的平均量表值就是
他在这一问题上的态度分数。瑟斯顿量表法提出了在赞同
或不赞同的因次上测量态度的方法,这是它的贡献。这个
作法迄今仍是多数量表的基本特点。
瑟斯顿量表基本设置步骤为:
(1)收集大量的与要测量的态度有关的语句,一般应在100条以
上,保证其中对主题不利的、中立的和有利的语句都占有足够的比例,
并将其分别写在特制的卡片上。
(2)选定二十人以上的评定者,按照各条语句所表明的态度有
利或不利的程度,将其分别归入十一类。第一类代表最不利的态度,
依次递推…,第六类代表中立的态度…,第十一类代表最有利的态度。
(3)计算每条语句被归在这十一类中次数分布。
(4)删除那些次数分配过于分散的语句。
(5)计算各保留语句的中位数,并将其按中位数进行归类,如
果中位数是n,则该态度语句归到第n类。
(6)从每个类别中选出一、二条代表语句(各评定者对其分类
的判断最为一致的),将这些语句混合排列,即得到所谓的瑟斯顿表。
二、利克特量表
1932年R.利克特提出了一个简化的测量方法,称
之为相加法。它不需要收集对每个项目的预先判
断,只是把每个项目的评定相加而得出一个总分
数。利克特量表也是由一系列陈述组成,利用5点
或7点量表让被试作出反应。5点量表是从强烈赞
同(5)、赞同(4)、中性(3)、不赞同(2)到强
烈不赞同(1)。7点量表则分为强烈赞同、中等赞同、
轻微赞同、中性、轻微不赞同、中等不赞同、强
烈不赞同。
第三节 实验的方法
实验法是控制情境和变量来研究社会行为
和社会现象的变化,以考察变量间的因果
关系。
一、实验法的原理与设计
1、提出关于自变量和因变量的关系假设;
2、事前测验:在实验开始对因变量进行测
试(前测);
3、引入自变量;
4、事后测验(后测);
5、比较前测和后测的差异值,对假设进行
检验。
比如:从众实验。
二、影响实验设计的主要因素
外部因素很难控制;
伦理问题;
三、实验的信度和效度
第四节 二次数据分析
一、二次数据分析的概念
二次数据分析是对现存的数据资料或有他
人已经收集和分析的数据资料所进行的新
的分析。
用二手资料研究新问题;
用新方法研究二手资料,验证原来的研究
结果;
二、二次数据的收集和分析
首先,选择好研究主题;
其次,寻找合适的资料;
最后,选择合适的方法进行分析。