关于考试我们了解多少
在前面的两个问题中,我们知道了分析试题的两个重要指标:区分度和难度。这两个指标作为我们分析、评价和筛选试题的重要依据,分别承担着区分学生不同能力水平和衡量学生得分难易程度的功能。可能你会说:“能最大限度地把不同水平的学生区分开,学生又容易做的题,必然是一道好题了。”或者说:“看看难度和区分度的关系表就知道,难度是0.5的试题是最好的,因为它的区分度最大。”真的是这样吗?
问题:什么样的试题才算是好的试题?
如前面所说,一道试题好或者不好,它的区分度和难度是必须要考察的两个参数,哪个更应该排在第一位呢?我们先来看看下面这道初中物理单项选择题。
下列对物理概念或规律的说法中正确的是( )
A.某种燃料完全燃烧放出的热量,叫做这种燃料的燃烧值。
B.阳光通过棱镜后被分解成各种颜色的光,这种现象叫光的反射。
C.电路的一部分导体在磁场中做切割磁感线运动时,导体中就产生电流。
D.一切物体在没有受到力的作用时,总保持静止状态或匀速直线运动状态。
这道题的内容涉及初中物理的四大领域――力学、热学、电学、光学,是一些老师所钟爱的试题,尤其是在综合性考试中,因为对试题的数量有限制,同时又对知识的覆盖面有要求,这道题便显示出了它的独特“优势”。此时,也许你想知道这道题的难度和区分度有多大,但这不应该是我们首先要讨论的话题。我们说,任何一道试题,都 ……此处隐藏2756个字……分,如果一个考生的高考物理成绩是60分,单看这个分数是很不理想的,但如果我告诉你广西高考物理的常模分数大约是40分(注:这并非一本线),60分在广西考生群体中的排名已经很不错了,已经超出了物理单科一本线的能力水平,是不是很值得庆贺呢?考生的成绩还可以和全国的常模比较呢。
我们看到该卷在难度为0.7―0.9和0.4―0.6两个区间预设了较多的试题(占全卷试题的近70%)。从前面的讨论中我们知道,难度在0.5左右的试题具有最大的潜在区分度。
则是用IRT软件对测试所反映出来的考生能力分布的一种分析结果。
“中考”全称是“初中毕业升学考试”,兼有毕业生检验与选拔的双重功能。在实际考试中,我们可能会面对类似的特殊需求,要求测验兼有标准参照测验与常模参照测验两种性质,这就要求我们在编制试卷时必须在它们之间找到一个恰当的平衡点,如同例子中的这份物理卷。两种类型的测验并非水火不相容,虽然它们的侧重点不同,但它们在一定程度上仍能显示出对方的痕迹。在我国,这种情况并不罕见,像研究生考试就有常模参照测验和标准参照测验的双重属性。说它是常模参照测验,因为考生需要排序、选拔;说它是标准参照测验,是因为有“单科分数线”存在。比如一个考生总分可能很高,但他英语没上单科分数线,同样不能录取,他会被认为“英语水平没有达标”……聊了这么多,好试卷都要具备哪些条件好像还是没说全。是的,我们只谈了最为关键的东西:试卷必须为测验目的服务!明确了测试目的这一根本问题,剩下怎样选择好的试题,怎样命制试题,怎样组卷等等,大都是纯技术性的问题了。就如同两军开战,明确了自己将要面临一场巷战,一个优秀的指战员就会知道应该选择轻武器而不是坦克大炮,也当然知道什么战术最合适,难道不是吗?