Transcript Document
能力单元四: 社会现象的测量、概念的操作化、量表的制作 一、测量的概念 二、测量的四个要素 三、测量的层次 四、操作化 五、量表 六、测量的信度与效度 学习目标: 掌握社会现象的测量方法、概念的操作 化方法、量表的制作方法,培养操作化 技巧与社会现象测量能力,为问卷设计 准备。 一、测量的概念 就是根据一定的法则,将某种物体或现象所具 有的属性或特征用数字或符号表示出来的过程。 作用:在于确定一个特定的分析单位的特定属 性的类别或水平。 二、测量的四个要素 1.测量客体:即测量的对象.(“测量谁” ) 2.测量内容:即测量的某种属性或特征。(“测量什么” ) 3.测量法则:即用数字和符号表达事物各种属性或特征的操作规 则。(“怎么测量” ) 例1:测量桌子高度的测量法则是:“将桌子放置在水面的地 面上,然后用直尺从地面垂直地靠近桌面的边缘,桌面所对就 的直尺上的刻度即是桌子的高度。” 例2:在社会调查中,我们要测量人们的收入,其测量法则可 以是:“将被调查者工资单上的实发金额加上每月奖金发放统 计表上他所得的奖金数额就是被调查者的月收入。” 4.数字和符号:即用来表示测量结果的工具。(“如何表示” ) 三、测量的层次(Levels of Measurement) 1.定类测量(Nominal Measures) 在本质上是一种分类体系。 “=、≠”。如:测量性别 2.定序测量(Ordinal Measures) 确定调查对象其等级及次序。 “=、≠ 、>、<” 。 如:测 量文化程度 3.定距测量(Interval Measures) 不同类别相互之间的间隔距离和数量差别。 无“绝对零点”, “=、≠ 、>、< 、+、-”。如:测量智商、温度 4.定比测量(Ratio Measures) 具有一个“绝对零点”。“=、≠、>、< 、+、-、×、÷”。 如:测量收入倍数 四种尺度的数学性质 =、≠ >、< +、- ×、÷ 定类测量 定序测量 定距测量 定比测量 √ √ √ √ √ √ √ √ √ √ 直接测量和间接测量 直接测量—— 把测量对象与作为测量标准的量直接进行比对,或用预先按照标准校准的 测量仪器预先确定的对应法则对测量对象进行测量,并能直接得到测量对 象数量大小的测量结果。 一般公式: y=x y——测量对象的数量大小或受测量 x——测量值 如:物体重量、长度、企业职工数目、工资总额、社区家庭数量及工程测量 对时间、压力、温度、湿度、质量使用仪表进行的测量。 间接测量—— 受测量不能通过直接测量的方法得到,必须通过一个 或多个另外的直接测量值,利用一定的函数关系运算 才能得到。 一般公式:y=f(x1,x2, …,xn) y——测量对象的数量大小或受测量 x1,x2, …,xn——各直接测量值 四、操作化(Operationalization) (一)操作化的有关术语(概念、变量、指标) (1)概念(Concept) 概念:是对现象的抽象,它是一类事物的属性(即共同特征)在人们头脑中的主 观反映。 物质财富 抽象 大 含糊 不易观测 生活用品 家具 椅子 概念 具体 小 抽象程度 含盖面 明确 容易观测 特征 可观测性 (2)变量(Variable) 许多概念往往包括若干个范畴、值或亚概念。在社会调查 中,常常借用一个数学术语,将所研究的含有若干个范畴、 值或亚概念的概念称为“变量”或“变数”。换句话说, 变量就是指是具有一个以上取值的概念,属于概念的一种。 变量的特征 ①穷尽性(每一个被调查者的情况都应归于某个取值中) 如:性别——男、女 又如:职业——工人、农民、军人、其他 ②互斥性(每一个被调查者的情况仅属于一个取值) 如:收入——1000元以下、1000-2000元、2000-3000元、3000-4000元、 4000元以上 收入——1000元以下、1000-3000元、2000-4000元、4000元以上 (3)指标(Indicator) 概念 指表示一个变量含义的一组可观察到 的事物。它是具体的、客观存在的、 可观测的。 概念、变量、指标的关系: 指标1 变量 (指标2) 常量 (指标3) 如:社会阶层 作为变量的概念 社会阶层 维度 职业 方面 文化 方面 收入方面 可选指标 指标 周薪 月薪 年薪 文化 程度 职业 (二)操作化的作用 沟通抽象理论概念与具体经验事实的桥梁。 (三)操作化的方法 1、概念:将抽象的概念转化成可观察的具体指标的过程。 2、方法: 例:“父母投资” (1)界定概念(理论概念、操作性概念) 父母为子女提供的帮助 早期家庭帮助 (2)列出概念的维度 近期帮助 正在给予的帮助 照看子女 (3)发展指标 做家务 提供经济上的帮助 思考:将“越轨行为”操作化为一组指标。 (misbehavior) 违俗行为 违德行为 越 轨 行 为 违警行为 违纪行为 违法行为 犯罪行为 越轨行为 五、量表(Scales) 用于主观社会指标的测量 (一)含义 量表是一种用于测量人们的态度、看法、意见、性格等主观性较强的内容 的工具。 (二)社会调查中常用的量表类型 1、总加量表(Summated Rating Scales) 它是由一组反映人们对事物的态度或看法的陈述构成的,回答者分别对 这些陈述发表意见,根据回答者同意或不同意的程度分别给予不同的分 数,然后将回答者在全部陈述上的得分加起来,就得到了该回答者对这 一事物现象的态度得分。 例如:贝利生育量表(部分) 提问项目 同意 不同意 1.结婚的主要原因之一是要孩子。 1 0 2.只生一个孩子是错误的,因为独生子女在 孤独中成长,且会因无兄弟姐妹而忧郁。 1 0 3.生育孩子是一个妇女所能具有的最深刻的 经历之一。 1 0 4.两种性别的孩子至少都有一个比仅有一种 性别的孩子好。 1 0 2.李克特量表(Likert Scaling) 是一种总加量表,在社会调查中最常用。 是由一组对某事物的态度或看法的陈述组成的,回 答被划分为“非常同意、同意、不知道、不同意、 非常不同意”五类。 赋值表 例如:请对下列看法发表意见 项目 非常同意 同意 无所谓 不同意 很不同意 看法(1):婚事应尽量办得简单 些。 □ □ □ □ □ 看法(2):结婚是人生大事应办得隆 重,热闹,花再多钱也值得。 □ □ □ □ □ 看法(3):就是有钱,婚事也不 应大操大办。 □ □ □ □ □ …… 非常同意 同意 无所谓 不同意 很不同意 看法(1) 1 2 3 4 5 看法(2) 5 4 3 2 1 看法(3) 1 2 3 4 5 3.鲍格达斯社会距离量表(Bogardus social distance scale) 是一种定量的测量人们相互间交往的程度、 相互关系的程度或者对某一群体所持的态度 及所保持的距离的工具。 例如: 鲍格达斯社会距离表 愿意 不愿意 提问项目 □ □ 1.你愿意让黑人生活在你的国家吗? □ □ 2.你愿意让黑人生活在你所在的城市吗? □ □ 3.你愿意让黑人住在你们那条街吗? □ □ 4.你愿意让黑人做你的邻居吗? □ □ 5.你愿意与黑人交朋友吗? □ □ 6.你愿意让你的子女和黑人结婚吗? example: 请为人们对在农村普及九年义务教育 的看法的调查设计一份李克特量表。 (6-8个项目) Key 项目 非常同意 同意 不清楚 不同意 很不同意 1、农村的孩子读个小学就行了,没有必要读 初中。 □ □ □ □ □ 2、现在农村的孩子不愿意读书,要普及九年 义务教育很难。 □ □ □ □ □ 3、男孩子可以进行九年义务教育,女孩子就 算了。 □ □ □ □ □ 4、现在教育经费紧张,普及六年义务教育尚 □ □ □ □ □ 5、现在农村工作以发展经济为主,顾不上发 展九年义务教育。 □ □ □ □ □ 6、要想彻底改变农村的贫穷落后面貌,必须 首先普及九年义务教育。 □ □ □ □ □ 7、致富靠科技,掌握科技靠教育,所以必须 □ □ □ □ □ 有困难,别说九年义务教育了。 要首先普及九年义务教育。 Character Assignment Table 赋值表 非常同意 同意 不清楚 不同意 很不同意 项目1 1 2 3 4 5 项目2 1 2 3 4 5 项目3 1 2 3 4 5 项目4 1 2 3 4 5 项目5 1 2 3 4 5 项目6 5 4 3 2 1 项目7 5 4 3 2 1 讨论: 以小组为单位,每组设计一份 “大学生人际关系量表” (≥10个自评项目) examples: 大学生人际关系量表 http://www.zhijizhibi.com/op_QuestionnaireFeedbackS 1!questionnaireid_145228975.html 抑郁自评量表 http://www.psytopic.com/mag/post/standard-scale-selfrating-depression-scale-sds.html 六、测量的信度与效度 (一)信度(Reliability) 1.概念:即可靠性,是指测量结果的一致性或稳定 性,即测量工具能否稳定地测量所测的事物或变量。 也即采取同样的方法对同一对象重复进行测量时, 其所得结果相一致的程度。常用相关系数r来表示信 度。 2.信度的具体类型 (1)再测信度(Test-retest Reliability) 是指采用同一种测量对同一对象在不同的时间点先后测量两次,根据两 次测量的结果计算出相关系数,这种相关系数r就叫做再测信度。缺点: 易受时间因素的影响。 如:两次测量身高。 (2)复本信度(Parallel-forms Reliability) 如果一套测量有两个以上的复本,则可根据同一对象同时接受这两个复 本测量所得的分数来计算其相关系数,这种相关系数r就叫做复本信度。 如:期末考试的A、B卷。 (3)折半信度(Split-half Reliability) 即将研究对象在一次测量中所得的结果,按测量项目的单双号分为两组, 计算这两组分数之间的相关系数,这种相关系数就叫做折半信度。 如: 测量项目按单双分为两部分。 (二)效度(Validity) 1.概念:也称测量的有效度或准确度。它是指测量 工具或测量手段能够准确地测出所要测量的变量或 事物的程度。也即能够准确、真实、客观地度量事 物属性的程度。 2.效度的具体类型 (1)表面效度(Face validity) 是指测量内容或指标与测量目标之间的适合性和逻辑相符 性。也即是指测量所选择的项目是否“看起来”符合测量的 目标和要求。 如1:目标—桌子的形状 —测量四边长度、邻边夹角 如2:目标—城市邻里关系—测量邻里联系频率、对邻里情况 熟悉程度…… (2)准则效度(Criterion Validity) 是指用一种不同以往的测量方式或指标对同一事物或变量 进行测量时,将以往原有的某一种测量方式或指标作为准 则,用新的方式或指标所得到的测量结果与原有准则的测 量结果作比较,如果新的测量方式或指标与原有的作为准 则的测量方式或指标具有相同的效果,那么就可以认为这 种新的测量方式具有准则效度。 如:2009年进行的某次调查中涉及如下两个问题 Q4:您的年龄是 36 岁。 Q27:您在 1999 年结婚,当时 26 岁。 (3)建构效度(Construct Validity) 是指通过将测量结果与有关理论命题或假设进行对比来考察测量的效度。 如:理论假设—— 婚姻满意度与主动做家务的行为有关。婚姻满意度越高,越是主动承担家务。 将婚姻满意度的测量指标换成新指标以后,测量结果—— 婚姻满意度越高,越是主动承担家务。——具有建构效度 婚姻满意度不同,承担家务的行为相似。——不具有建构效度 测量的信度与效度之间既有明显的区别,又存在着某种既相互联 系,相互制约的关系。信度主要回答调查结果得一致性、稳定性 和可靠性问题;效度主要回答调查结果的有效性和正确性问题。 信度和效度之间的关系有四种类型: (1)可信且有效。 (2)可信但无效。如调查某地粮食产量, 但设计的统计指标是播种 面积,投入粮食作物生产的劳力、资金等,即使数据可信,对说 明当地粮食产量来说,其效度仍然很低。 (3)不可信但有效。 这种情况在理论上应该是不存在的。 (4)不可信亦无效。这是测量中应避免的类型。 信度和效度的上述四种关系,见下图: 总之, 信度是效度的基础, 是效度的必要条件而非充 分条件(一般来说,缺乏信度的测量肯定也是无效度 的测量;但高信度的测量未必同时也是高效度的测量, 即它也许是有效度的,也许仍然是无效度的); 效度 则是信度的目的和归属, 没有效度的信度就失去了其 本来的意义。任何社会测量, 只有做到信度和效度的 统一, 才是可信且有效的。 实作: 对你的调查课题中的核心概念进行操作 化。分小组工作坊共同完成,并由小组 代表在课堂上作汇报。 小结: 掌握测量的四个层次;总加量 表,李克特量表;操作化的方法。