Transcript 第三章心理测量的误差
第三章:心理测量的误差 赵英芳13863297972 [email protected] 本章主要内容: 一、心理测量误差的定义与种类 二、心理测量误差的来源及控制 三、真分数理论 四、项目反应理论概述 1、误差的定义 测量误差:在测量过程中,那些与测量目 的无关的因素所导致的测量结果不准确或 者不一致的效应。 误差是由测量目的的无关的变因引起的; 误差是不准确或不一致的测量结果。 2、误差的种类 随机误差:与测量目的无关的偶然因素引起的误 差,使多次测量产生了不一致的结果,并且这些 结果的大小和方向也是不一致的。 系统误差:指由与测量目的无关的因素引起的一 种恒定而有规律的效应。 随机误差既影响到了测验分数的一致性也影响到 了测验分数的准确性,而系统误差确实恒定的, 它不影响测验分数的一致性,只影响其准确性。 本章主要内容: 一、心理测量误差的定义与种类 二、心理测量误差的来源及控制 三、真分数理论 四、项目反应理论概述 1、误差的来源 测量工具:通常是一套以测验为核心的刺 激反应系统(量表),测量工具所造成的 误差主要来自与测验的编制过程,其中项 目取样影响最大。 测量对象:即被试本身引起的误差是测量 工作中最复杂和最难控制的一类误差,被 试的真实水平是否得到充分发挥是造成测 量误差的主要原因。 测验焦虑 测验经验 学习发展和教育 应试动机 练习效应 反应倾向 生理变因 测量过程:与施测过程有关的误差是最容易 控制和检验的。 测试环境、测试时间、主试因素、意外干扰、 评分计分 2、误差的控制 测验标准化:即测验的编制、施测、评 分及对分数的解释都必须标准化。 对所有受测者施测相同或等值的题目 测验的编制方面:代表性,一致性,难度,数 量,说明等 所有受测者必须在相同的条件下接受测试 评分的客观性也是测验标准化的重要条件 测验结果解释的标准化 本章主要内容: 一、心理测量误差的定义与种类 二、心理测量误差的来源及控制 三、真分数理论 四、项目反应理论概述 测量理论的划分 经典测量理论:以真分数为核心假设的 测量理论及其方法体系,统称为经典测 量理论(Classic Test Theory,CTT),也 称真分数理论。 概化理论 项目反应理论 1、真分数(true score)的含义 心理特质:表现在一个人身上所特有的 相对稳定的行为方式。 心理特质具有内部性、一致性、抽象性、 稳定性、层次性、可预测性等特点。 心理学家斯皮尔曼引入真分数的概念 真分数:无数次测量结果的平均值 观察分数:把实测的分数称作该特质的 观察分数 2、真分数数学模型及假设 真分数(T分数):测量没有误差时所得到的真值。 CTT的真分数理论模型:X = T + E,观测分数是真 分数和测量误差的和。 若一个人的心理特质可以用平行的测验反复多次, 观察分数的平均值会接近真分数。E(X)=T或E (E)=0 真分数和测量误差之间相互独立,P(T,E)=0 各平行测验上的误差分数之间相关为零, P (E1,E2)=0 首先,假定在一定的问题研究范围之内, 反映个体某种心理特质水平的真分数是 不变的,测量的任务就是估计这一真分 数的大小; 其次,假定观察分数等于真分数和误差 分数之和,即假定观察分数和真分数之 间是线性关系,而不是其他关系; 测量误差完全随机,并服从于均值为零 的正态分布。不仅独立于所测特质真分 数,还独立于所测特质之外的其他任何 变量。 实施标准化测验时,并不是用很多平行测验反 复测量同一批被试,而是用同一个测验同时侧 查许多被试,该团体的平均真分数就等于该团 体内所有被试实得分数的平均值。 SX2 = ST2 + SE2,实得分数的变异等于真分数 的变异数加上误差的变异数。 ST2 = SV2 + SI2,真分数的变异包括与测量目 的有关的变异(有效变异)和与测量目的无关 的变异(无效变异)两部分。 所以,SX2 = SV2 + SI2 + SE2 本章主要内容: 一、心理测量误差的定义与种类 二、心理测量误差的来源及控制 三、真分数理论 四、项目反应理论概述 项目反应理论(item response theory IRT) 题目反应理论 潜在特质理论(latent trait theory) 美国测量专家洛德针对经典测验理论的 不足提出的一种测验理论 1、经典测量理论的不足 统计量的样本依赖性,抽样变动大; 能力与难度量表的不一致性,测量误差 大; 信度估计的不精确性,复本施测难; 测验结果拓宽的有限性,预测力缺乏; 测验分数的测验依赖性,分数难比较。 2、IRT的提出 1952年,洛德首次在博士论文中提出 计算机出现后才迅速发展 在中国的发展刚起步 3、IRT的特征与优点 项目反应理论的特点: 能力参数估计的不变性 项目参数估计的不变性 能力估计的精确性 测验编制应用的价值性 3、IRT的特征与优点 项目反应理论的优越性: IRT在估计被试能力或潜在特质时,同时考虑被试的反 应组型; IRT可针对每个被试提出其能力估计值的测量误差指标; IRT所采用的项目参数,不依赖于被试样本,也不依赖 于项目库; IRT可以由同质性较高的分测验中计算出被试的能力估 计值; IRT提出的项目信息函数和测验信息函数的概念,可以 作为评定个别项目或整份测验的测量误差的指标。 4、IRT的基本假设 潜在特质空间的单维性假设 局部独立性假设 项目特征曲线假设 非速度限制假设 5、IRT的主要模型 核心是项目特征曲线(ICC) 以项目特征曲线和潜在特质等概念为理 论架构,依据强势假设来发展其理论模 式。