2011年岗前培训教育心理(测量)课件

Download Report

Transcript 2011年岗前培训教育心理(测量)课件

教育测量
天津大学青年教师岗前培训
目录
教育测量的一般理论
教育测验的编制
项目评价
成绩分析
教育测量的概念
教育测量的一般理论
• 教育测量的广义概念:根据一定
的客观标准和规则,运用可行的
方法,对教育的要素、过程和效
果进行价值评判的活动,并将评
判的结果予以数量化的描述。
• 教育测量的狭义概念:学校教育
中学生学业成绩的测量。
教育测量的特点
教育测量的一般理论
特点一
影响测量结果的因素多且不稳定
特点二
测量手段的间接性
特点三
测量结果的相对性
特点四
测量技术和方法的发展性
教育测量的功能
教育测量的一般理论
教育科学研究的重要工具
教育管理科学化的重要依据
巩固学习成果的必要措施
教育测量的功能
检查教学效果的必要手段
教育测验的目标与内容
教育测验的编制
教育测验
考核目标
终极目标;中程目标;具体目标
认知目标;情感目标;技能目标
知识考核;领会考核;运用考核
考核内容
分析部分
综合部分
评价部分
常见的考试试题类型
教育测验的编制
题意:意义完整,概念明确,逻
辑清晰,不含线索,陈述为主
是非题
举例:
人民行使国家
权力的机关是全国
人民代表大会及地
方人民代表大会。
()
常见的考试试题类型
教育测验的编制
题干:意义完整,界定明确,概
念一致,不含线索
选择题
否定式选择题
举例:
下面五种东西
中哪个与其他最不
相似( )。
A麦子B稻草C大豆
D玉米F高粱
选择题
肯定式选择题
举例:
《三国演义》的
作者是( ) 。
A曹雪芹 B吴敬梓
C罗贯中 D蒲松龄
选项:彼此互斥,类型同质,简
洁明确,编号唯一
选择题
因果式选择题
举例:
感性认识有待于发展到理
性认识,这是因为感性认识只
反映个别事物的表面现象,只
有理性认识才揭示事物的本质
和规律,才是对事物更深刻更
全面、更可靠的反映。( )
A结果与原因都正确
B结果正确原因不正确
C原因正确结果不正确
D结果与原因都不正确
常见的考试试题类型
教育测验的编制
选择题
组合式选择题
举例:
在第一次世界大
战末期和战后的革命
高潮中崩溃的帝国有
( )。
A(123) B(13)
C(24) D(1234)
1德意志 2俄罗斯
3奥匈
4奥斯曼
选择题
类推式选择题
举例:
如果甲比乙高,乙
比丙高,那么甲肯
定比丙高。( )
A真 B假
C 不肯定
选择题
改错式选择题
举例:
“我国发射第一
枚运载火箭的活动
获得圆满成功。”
其中的“活动”一
词可以替换为下面
的( ) A工作
B试验
C作法 D愿望
常见的考试试题类型
教育测验的编制
选择题
分类式选择题
举例:
下面四组作品
中,从文学知识角度
看,哪一个与其他三
个不同。( )
A《水浒传》
B《西游记》
C《红楼梦》
D《聊斋志异》
选择题
配合式选择题
举例:
从下面左列姓
名中给右面每篇文
学作品找出作者。
夏衍
《祝福》
鲁迅 《四世同堂》
杨沫 《青春之歌》
老舍
《包身工》
选择题
序列式选择题
举例:
(1)唯见长江天际流;(2)
烟花三月下扬州;(3)孤
帆远影碧空尽;(4)故人
西辞黄鹤楼
这四句诗的顺序是( )
A(1234)
B(4321)
C(4231)
D(2314)
常见的考试试题类型
教育测验的编制
题干:意义完整,界定明确,概
念一致,不含线索
题干:意义明确,界定清晰,包含线
索或诱导成分,陈述疑问方式均可
填空题
简答题
论述题
举例:
我国人民行使
国家权力的机关是
全国人民代表大会
以及
。
举例:
我国西部地区
主要有哪些气候类
型?
举例:
举例说明在工
业产品设计中应用
工效学的基本原理
的重要性。
空白:概念完整,不含语法,前
后一致,无其它可能性
题干:表述完整,包含理论关键词及答
题要求关键词,前后呼应,含诱导成分
设计试题的注意事项
教育测验的编制
题目选择
独立性原则
有效性原则
编写格式的统一性原则
统计指标的适合性原则
文字表述准确性原则
内容的典型性原则
赋分的合理性原则
题量控制
测验的时间
试题的题型
计算与文字书写量
试题的难度
考核内容覆盖面
测验的性质
项目评价
难度
难度
难度是指测验
项目的难易程
度,试题的难
度可以用试题
的通过率来表
示。
难度
指标适用范围
试题卷面的
难度值范围
是0.6~0.7
计算公式
难度记为 P,
在教育测量
中,
P=R/N
R:答对该题的人数
N:参加测验总人数
项目评价
区分度
区分度
含义
指测验对学业
水平不同的考
生的区分程度
或鉴别力。
意义
具有良好区分
度的项目,能
将不同水平的
考生区分开来,
即在该项目上
水平高的考生
得高分,水平
低的考生得低
分。
公式
D=PH-PL
PH指高分组通
过的百分比,高
分组为总分数
最高的27%
PL指低分组通
过的百分比,低
分组为总分数
最低的27%
指标范围
通常用D表示,
取值范围为+
1.00至-1.00。
D越高则质量越
好。
0.2以下应淘汰
0.2-0.3 合格
0.3-0.4 良好
0.4-1 性能佳
项目评价
区分度
区分度计算
主观性试题
极端分组法
客观性试题
极端分组法
公式
D=PH-PL
计算步骤:
按测验总分从高到低排序;
测验总分最高的27%的被试
作为高分组,最低的27%的
被试为低分组;
分别求出这两组被试通过试题
的百分比;
将算得有关数据带入上公式。
公式
D
XH  XL
N ( H  L)
XH:高分组总分;XL:低分组总分;H:该题最高分;L:该
题最低分;N:考生总人数的25%
计算步骤:
按测验总分由高到低排序;
分别确定测验总分的前27%和后27%
作为高低分组;
列出试题分析表;
将数据带入公式计算。
项目评价
整体分析:信度
信度
含义
种类
即测试的稳定
性和和可靠程
度,信度是反
映测量中随机
误差大小的指
标。包括重测
信度、复本信
度、同质性信
度。
重测信度:同一测验
对同组被试先后两
次施测所得结果的
一致性程度;
复本信度:两平行测
验对同组被试施测
所得结果的一致性
程度;
同质性信度:测验内
部所有题目间的一
致性程度。
公式
指标范围
试题同质性信度
 i
k
(1 
)
k 1
2
2
r信 
σ2i:每道试题方差;
Σ2:全卷方差;
k :试卷中试题数目
教师自编测验
的信度指标范
围为0.7以上。
项目评价
整体分析:效度
效度
含义
种类
公式
是测验的准确
性,是测验能
够测出它所欲
测的特质的程
度,即测验实
际测量出其所
要测量特性的
程度。
内容效度:是指测
验内容对于其所欲
测之行为领域的代
表性程度。
效标关联效度:是
指一个测验对处于
特定情境中的个体
的行为进行预测的
有效性。
结构效度:是指测
验对于被称作某一
理论概念或特质测
量的程度。
试卷结构效度
r效 
1
 Di
k
Di为每一试题的
区分度
k为试卷中试题
的数目
指标范围
教师自编测验
的效度指标范
围为0.4以上。
项目评价
紧密围绕教学大纲
和教学目标命题
测验中题目
的数量应适
当,不能太少 提高信度和效度的方法
少出偏题怪题,以
考察基础知识和基
本能力为主
测验整体难度适当,
不同类型和不同难
度题目的比例恰当
信度和效度
考核内容应全面,
并且能有效代表学
生应掌握的知识领
域
成绩分析
原始分数的误区
家长看到孩子成绩单上的
数学测验成绩为82分,
语文测验成绩为70分,
父母们对此是如何评价的?
有老师对学生说,你
上次数学测验的的成
绩是78分,这一次测
验只得了71分,你为
什么退步了。
原始分
误区
某学校负责人在学期结束时的
总结会上对某学科教师说他的
教学效果不好,其依据是该学
期学生在此学科上的考试平均
成绩低于其他学科。
数据的整理
成绩分析
甲班男女生数学成绩分布统计表
成
绩
性别
在获得数据之后,要对数据
分门别类,加以整理。数据
的整理了分析数据的第一步,
分类的标准与分析的目的直
接相关。
比如,对学生成绩进行初步
分析,可以以性别和成绩水
平为类别标准,用一个统计
表表示不同成绩组中数据的
个数。
合计
优
良
中
差
男
9
13
7
4
33
女
4
8
9
2
23
合计
13
21
16
6
56
乙班学生数学成绩分数段统计表
分数段
人数
<60
1
60-69
7
70-79
15
80-89
15
>90
5
成绩分析
次数直方图
次数直方图由若干直方条排
列在基线上构成,直方条的
高度或长度表示次数大小。
数据的整理
成绩分析
次数多边形图
次数多边形图以各组的组值
为横坐标,以相应的次数为
纵坐标画点,然后将这些点
连接成折线。
数据的整理
成绩分析
分数分布形态图
数据的往往表现出不同的分
布模式,一般来说,学生的
成绩分布为正态或负偏态分
布。正态分布是最为常见一
种概率分布形态,在理论和
实践中均有广泛的应用,具
有单峰和对称的特点 。
数据的整理
成绩分析
算术平均数
通用符号
X或M
基本统计量及其含义
计算公式
1 n
X   Xi
n i 1
含义:所有观察值Xi的总和除以总个(次)数所得之商。简称平均数或均数。一个数据
发生任何微小的变化都会影响到算术平均数的大小,算术平均数能够非常灵敏地反映数
据的变动。一些极端数值(极大值或极小值)很容易影响平均数,使其失去典型性。
意义:算术平均数是一组观察值的代表值,在平均过程中,它可以消除由于偶然性造成
。
的差异,从而揭示出必然因素的作用。有了它,我们就可以对不同的总体或同一总体不
同时间的情况进行比较,判断它们之间的差异。
成绩分析
中数
通用符号
基本统计量及其含义
Md
含义:把全部数值按大小顺序排列,位于中间位置的数。
意义:所有数据中,只有位于最中间的1个或2个数据参加运算,极端数值不会影响中数。
它适合用于代表有极端数据的一组数值,但不适合进行进一步的代数运算。
成绩分析
众数
通用符号
基本统计量及其含义
M0
含义:是数据中出现次数最多的那个数值。将所有数据依大小顺序排列,然后用观
察法直接寻找一组数据中出现次数最多的那个数,就得到众数。
意义:众数简明易懂,也不受极端数值的影响,数据分组中组距对众数有直接的影响,
也不适合进一步的代数运算,其使用范围十分狭窄。
成绩分析
全距
计算公式
基本统计量及其含义
Range max min
含义:是观察值中最大值与最小值的差。
意义:全距是最粗略的差异量,全距越大说明观察值越分散,反之就越集中。全距的计
算只使用了两个数据,所以它易受极端数值的影响,不能充分反映实际的差异程度。
成绩分析
平均差
通用符号
AD
计算公式
基本统计量及其含义
X
i
X
n
含义:是指所有观察值与算术平均数之差的绝对值的算术平均数。
意义:平均差越大说明数据的差异程度越大。
成绩分析
方差和标准差
符号及公式
S2 或  2
 X

基本统计量及其含义
X
2
i
n
S或  
 X
X
2
i
n
含义:方差和标准差利用对离差进行平方的方式避免了离差之和等于零的情况。标准差是
方差的平方根,也可以利用原始数据直接进行计算。
成绩分析
标准分
Z 
符号及公式
基本统计量及其含义
X X
T  50  10 Z

含义:是一种由原始分推导出来的相对的位量数,它是用来说明原始分在所属的那些分数
中的相对位置的。Z 分数准确地刻划了一个分数在一批分数中的相对位置,在Z分
数的基础上进一步转换,发展出了一系列其他形式的标准分。 如,T分数。
例如:张月和李娜两同学的数理化三科成绩如下表:
姓名
考试科目
张月
李娜
年级平均
分
年级标准
差S
T分数
张月
李娜
数学
67
73
65
4
55
70
物理
76
86
74
6
53
70
化学
86
70
71
12
62.5
49
总分
229
229
170.5
189
平均分
76.3
76.3
51
63
如果按照我们常用的实际分值,这两个人的总分相同,在年级排队的位置一样。但是,
换算成了T分数后,李娜的成绩显然优于张月的。原因是在原始分中,数学的1分和物理、
化学的1分的值是不等的,即含金量是不同的。这样的分相加后的可比性就比较差,常会出
现很大的误差。从以上的T分数也可以看出各学科的贡献率。总分都是229,张月的数学贡
献率较物理的大(数学在总体的位置靠前),李娜的数学和物理的贡献率一样大(这两科
在总体的位置一样)。
天津大学教育学院
安容