基于《学业质量评价标准》的学业考试设计与编制

Download Report

Transcript 基于《学业质量评价标准》的学业考试设计与编制

基于《学业质量评价标准》的
学业水平考试设计与编制
广州市教育局教学研究室
2012-04-19
许世红
主要内容
• 学业水平考试的性质
• 基于《评价标准》的学业水平考试试卷设计
• 试题的分类
• 客观性试题的编制
• 主观性试题的编制
一、学业水平考试的性质
• 关于考试
– 教育类考试是指对个体经教育训练所获知识与能
力的考察,具体体现为按一定规则给被考察对象
在一定量尺上给出一个指定值。
– 量尺通常表现为问卷、试卷、作品评价标准等。
– 指定值通常称为考试分数,简称分数。
– 在教育测量中,分数只有与一定的参照物和参照
系比较,其意义才能说清楚。
用来解释考试分数的参照系有以下两类:
年龄常模
发展常模
年级常模
常
模
百分等级常模
相
对
评
价
组内常模
标准分数常模
质量标准
标
准
操作标准
即用文字概括出什
么是合格与不合格,
什么是一级、二级、
三级等水平
即在编织成的测验
上划定及格线或等
级分数线
绝
对
评
价
【案例1-1】某班四名学生某次期末考试中的语
文、数学、英语的考试情况如下,如何评价?
常模
X
原始分数
Z值(Z=(x-X)/S )
S
甲
乙
丙
丁
甲
语文 81.5
8
85
90
76
80
0.438
数学 89.5
13
92
80
96
100
0.192 -0.7308
英语 72.5
9
75
81
80
87
0.278
252
251
252
267
0.908
总成绩
乙
丙
丁
1.0625 -0.6875 -0.1875
0.5
0.8077
0.9444
0.833
1.611
1.2761
0.6455 2.2312
• 关于考试分类
– 按照解释分数意义的参照系的不同,教育考试可划分为两
类:
• 常模参照考试(Norm Referenced Test,简称NRT)
– NRT关注的是被试在语文、数学、英语等学科的年级发展水平间的差
异,或言语理解、数量计算、空间关系等基本心智操作发展状态中
的个体间的差异。
– NRT要求试题间的内部一致性高,区分度大,难度适中。它关注的是
试卷总分,并不追究总分是由哪些试题上的得分所构成。
• 标准参照考试(Criterion Referenced Test ,简称CRT)。
– CRT关注的是被试的心理特质水平达到了何种程度, 并通过与某个客
观标准进行比较,以确定被试“能做什么”与“不能做什么”,是
“已达标”还是“未达标”,或者处于某个级别水平。
– CRT要求:(1)对所测的心理特性或结构要给出行为领域的良好界定;
(2)据之编制的测验要能导出行为领域的代表性样本;(3)对被试的测
验表现进行绝对评分;(4)测验提供的资料要能确切说明被试在所测
行为领域实际能做什么,不能做什么,做得有多好。
• 基于《评价标准》的学业水平考试
– 学业水平考试的载体是学科内容。
– 学业水平是指学科学习中的知识、技能、经验、方法、
策略、观念、情感、态度等心理因素的形成过程与发展
水平。
– 学业水平考试即评估学生学习某一学科的学业水平。它
需要承担学生“学到什么”和“怎样学习”的评价任务。
– 学业水平考试的主要功能是促进学生的发展,而不是给
学生排队。因此,其命题与分析应认真借重标准参照考
试的模式。
– 学业水平考试的方式既需要规范化、标准化,也应该灵
活多样,二者应该结合起来使用,以求更全面地体现学
生的成长、进步与不足。
– 各学科的《评价标准》中给出了多种形式的评价示例,
应给予仔细研究,并在实践中丰富与完善。
二、基于《评价标准》的学业水平考试试卷设计
• 试卷设计的基本流程
– 1. 考试目标
– 2. 考试的内容领域
– 3. 行为目标及其表现水平标准
【行为目标即学生通过学习以后预期产生的行为变化】
–
–
–
–
–
–
–
–
–
–
4. 测量目标的选择
5. 测量目标占内容领域的题量和题型以及分值比例
6. 试卷结构的确定
7. 命题细目表的编制
8. 试题命制
9. 拼题组卷
10. 编制参考答案
11. 制定评分标准
12. 审核与调控
13. 制卷、校对、付印
【案例2-1】2009学年下学期某区四年级语文试卷设计
• 1.考试目标
– 全面检测我区小学四年级语文学生的学业水平,作为规范学生学业
评价的参考依据。
– 了解我区小学四年级的语文教学质量,以考导学,找准教学目标和
教学的重难点,改善教学设计,完善教学过程,落实语文学科的素
质教育,以促进学生的发展。
• 2.考试的内容领域
– 人教版义务教育课程标准实验教科书《语文》四年级下册,包括识
字与写字、阅读、习作、口语交际、综合性学习等五个方面。
• 3.行为目标及其表现水平标准
– 《广州市义务教育阶段学科学业质量评价标准(语文)》(实验稿)
五年级部分
• 4-5.测量目标的选择,占内容领域的题量和题型以及分值
比例
– 听力占5%,语文基础占46%,以考查识记、理解、简单运用能力
为主。阅读能力占24%,其中课内占7%,课外占17%,以考查获
取信息、理解词义和文意、概括分析、鉴赏评价、创意表达的语
文能力。习作占25%,考查综合运用的语文表达能力。
• 6.试卷结构的确定
– 框架结构,题型结构,知识结构,能力结构,难度结构
• 7.命题细目表的编制
– 整理的四个细目表(四语,七语,三数,八数)
• 8-13. 略
• 基于《评价标准》的试卷设计中应遵循的原则
– 适标性,即试题考查的内容和要求均不应超越《评价标准》
的规定。
– 科学性,即试卷内容要正确,不能出现知识性的错误,有
争议的问题不要编入试题。
– 规范性,即试卷中每道试题的陈述都应准确、规范、简洁、
有条理、层次分明,无歧义,标点符号正确,图表清晰。
– 适度性,即试卷中的每道试题都必须有自己明确有效的考
查目标,既要与试卷中其他试题相辅相成,又要为试卷中
别的试题无法代替。
– 有效性,即试卷能够测到预期的目标与内容。
– 导向性,核心知识、主干知识应重点考查,引导教学关注
学科素养的培养。
三、试题的分类
• 按成绩的评定是否存在误差分类,
– 可分为客观题(如选择题、填空题、是非判断题、配对
题、改错题、名词解释等)和主观题(如论述题,作文,
解答题等)。
• 按考查的学科内容分类,
– 语文可分为语言积累与运用、阅读与鉴赏、写作。
– 数学可分为代数题、几何题、概率统计题、综合题。
– 英语可分为听力、语言知识及应用、完形填空、阅读理
解、写作。
– 等等。
四、客观题的编制
• 选择题的编制
– 结构:
• 选择题由题干和多个选择项组成。
– 功能:
• 测量学生对所学知识的理解、再认、比较、辨别等能力。
– 分类:
• 一般分为单项选择题、多项选择题。
– 基本要求:
• 题干通常是一个不完整的陈述句,但每一个选择项与题干连接在
一起时,应成为一个完整的语句。
• 几个选择项之间应当类型相同、形式相近、彼此相称。
• 正确的选择项尽可能隐蔽一些,错误的选择项尽可能多一些迷惑
性。最好是针对考生的弱点或可能失误的地方,设置错误的选择
项。应尽可能防止选择项明显虚设的情况。
• 对于目前常用的“四选一”的选择题,还要防止正确的选择项不
止一个或没有的情况。
【案例4-1】“爸爸的嘴张着,仿佛在呼唤什么。”这是(
A.疑问句。
B.陈述句。
)。
• 命题依据:根据《评价标准》要求,本题的考点是掌握几
种基本句式,明确句式的种类,并通过课文的句子让学生
明确陈述句和疑问句的概念。
– 陈述句指用来叙述或说明一件事或者一个道理的句子,
句末用句号,包括肯定陈述句、否定陈述句和双重否
定句。
– 疑问句指用来向别人提出问题,询问一件事情或表示
疑问的句子,包括明知故问,即反问句,句末用问号。
• 正确答案:B
• 本题难度:0.77.
【案例4-2】“已知一个直角三角形的两边长分别是3,4,则下列选
项中,可作为第三边长的是( ).
A.7
B. 25
C. 7
D. 5
• 命题依据:根据《评价标准》要求,本题的考点是掌握勾
股定理,会用勾股定理计算直角三角形的边长。
• 正确答案:C
• 本题难度:0.81.
若选择支设计如下,又如何?
A.5
B. 7
C.5或 7
D.不确定
【案例4-3】某校八年级6个班级同学在“支援玉树灾区献爱心”
活动中都捐了款,具体班级捐款情况如表,则该校班级捐款
数 的中位数是( ).
捐款班级
1
2
3
4
5
6
捐款数(元)
240
240
260
280
270
330
A.240
B.260
C.265
D.270
• 命题依据:根据《评价标准》要求,本题的考点是会根据实际
情境求出中位数,理解中位数可以作为一组数据的代表。
• 正确答案:C。
• 本题难度:0.49。
• 分析:四个选择支的作答分布为:A,2%;B,4%;C,50%,
D,43%。学生出错的原因,估计主要有两方面:
• 求中位数时忽略了“排序”;
• 误将“捐款班级”理解为“捐款班级数”从而对各捐款数
进行多次排列。
【案例4-4】Is ___________ here?
No, Simon and Daniel have asked for leave.
A.anybody
B. somebody
C. everybody
D. nobody
• 命题依据:在具体的语言情景中运用语法规则,从而达到
交流的目的,题设的意思是“大家都到齐了吗?”,这是
常用的交际用语。
• 正确答案:C
• 有些考生只死记语法规则 ,一看题设是个疑问句,不看
答语,就选A,错以为太简单。
• 填空题的编制
– 结构:
• 一般是提供一个留有空隙的不完整的陈述句,要求考生
将空缺的字、词、句补填进去。
– 主要功能:
– 测量学生的记忆能力、简单的推理、计算能力。
– 基本要求:
• 一道填空题涉及的知识点不宜过多。
• 合理安排空位。应防止由于空位安排不当而引起歧义或
误解的情况。
【案例4-5】把下面的四字词语补充完整,选用2个以上描写大
课间的情形。
迷( )不解 气急( )坏 争先( )后 骨( )如柴
( )精会神 一丝不( ) 不( )向上 鱼( )而出
________________________________________________
________________________________________________
命题依据:根据《评价标准》对于词语部分要求的考查。
《评价标准》要求学生能正确理解词语,体会其在具体语境
中的含义及表达效果。能够通过联系上下文和生活实际体会
词语的内涵和在表情达意上的作用。本学期区各小学举行大
课间评比,通过这题考查孩子的灵活应用日常积累的词语的
能力。难度中等。
一个反例:
刚读到短文的题目时你产生了哪些疑问?请写出你的一个疑
问______________________________________________
(2分)
存在的问题:分数无法体现学生的阅读水平,因为无论学生
提任何一个问题都应该得分。
【案例4-6】
正方形的周长是40分米,则它的面积是________平方米。
• 命题依据:根据《评价标准》对于正方形要求的考查。《评
价标准》要求学生会应用公式正确计算长方形、正方形的面积。
• 需要注意的问题:学生出错的原因可能不是不会求正方形的
面积,而是其它原因。
• 本题的考查效度有待改进。
• 改进方法:
(1)正方形的周长是40分米,则它的面积是_____平方分米。
(2)正方形的边长是40分米,则它的面积是_____平方米。
五、主观题的编制
• 解答题(论述题、写作题)的编制
– 形式:
• 提出较为复杂的问题,要求考生做出分析、说明、解释、论
证,或做出结论,或提出自己的观点和见解。
– 特点:
• 考生有较多的独立思考、自由发挥的机会。
• 但评分主观因素较多。
– 功能:
• 能够测量较复杂的学习结果和较高深层次的知识水平。
• 测量学生组织知识、表达思维、分析问题、解决问题的能力。
– 编制方法
• 选题,改题,编题
【案例5-1】某区八年级下学期数学试卷中分式专题的考试设计
9.用科学记数法表示:0.000208=
;
• 分式专题的命制思路:
– “分式”部分的试题的选样是突出其工具性。
– 设置的22分值的考查取样放在分式的概念,分式的有关运
算,分式应用(科学计数法)。
– 没考查用分式方程解决实际问题,这是学生的难点。避开这
一难点的原因如下:
• 导向师生把双基的落实放在首位;
• 若安排应用题,分式方程的解法只能在应用题里考,学生列不
出方程就谈不上解方程,这样就不能直接测量学生解分式方程
的掌握情况。
• 用方程解决应用问题的教学具有积累性,可在后面考试中安
排。
– 试题的考查水平均在“理解”“会”的层次,其中六题中五
题是学生常见的题,只有一题背景较为新颖。
– 本次命题,分式计算考查复盖面全面,乘、除一题,加、减
法一题,四则混合运算一题,分式方程一题,四题中只有一
题运算步骤超过四步。
【案例5-2】如图,在平行四边形ABCD 中, E、F分别为边AB、
CD 的中点,连接DE、BD、BF.若AD 
BD ,则四边形BEDF是
什么特殊四边形?请证明你的结论。
• 命题依据:《评价标准》要求:掌握直角三角形斜边上的中
线等于斜边一半,经过探索与证明矩形、菱形、正方形的性
质及判定的过程,形成发展学生合情推理意识,逐步掌握解
决几何问题的分析思路和方法.
• 设计难度是0.6
• 考试后难度是0.42。
【案例5-3】
此题以学校业余体育竞赛活动组织前的调查工作为载体,简单、完整地呈现出抽样
调查中数据整理与表达、数据分析与决策的过程。通过条形统计图、扇形统计图,此
题直观呈现出喜爱不同运动项目的学生分布情况与所占比例情况,考生需要综合考虑
两个统计图的信息,计算样本容量,补全条形统计图,再运用样本估计总体的方法估
计学校最喜欢篮球运动的学生人数。至于合理化建议的提出,虽然因人而异,但应结
合“调查结果”给出,必须体现“调查结果”中数据的价值,这也反映出统计决策中
数据使用的核心地位。
谢 谢 !