历史学科多项选择题研究述评

来源 :历史教学·中学版 | 被引量 : 0次 | 上传用户:hbjxwjy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  关键词:多项选择题,历史学科,考察目标
  中图分类号:G63 文献标识码:B 文章编号:0457-6241(2010)19-0059-07
  
  本文“多项选择题”(multiple-response item)指选择题的一种具体形式,即在选择题备选项中,含有两个或两个以上正确的选项。有些文献也称之为“复选题”或“不定项选择题”。
  1999年之后,“多项选择题”(以下简称“多选题”)已从历史高考试卷中淡出,被组合式单选题(complexmultiple-choiceitem)所取代,为何还要研究呢?
  从理论层面上看,命题者一般认为:与“单选题”相比,多选题更能测量考生复杂的认知成果及思维品质,能使考生多角度地思考问题,培养他们独立思考的能力,增加了对考生学科思维周密性和严谨性的考查,更符合历史学科的考查特点。在实践层面上,多选题一直存在于高考政治学科、物理学科,台湾“指考”历史学科也一直沿用该题型。
  一言以蔽之,题型研究要为“历史学科考查目标”服务。就题型而言,本无优劣之分,只有适不适合的区别。多选题的使用与否,应当以考试需求为依据,以考试技术为基础。就目前而言,多选题休眠的主要原因不是考查目标无此需求,而是命题技术达不到考试要求(其中包括难度控制、赋分标准等因素)。
  必须承认,多选题的命制难度较大,对命题技术的要求也较高。题型本身所带来的技术性问题,我们还没有完全掌握,发展命题技术,要靠对题型功能的进一步挖掘。无论从多选题适用性还是技术性角度,都有深入研究的必要。
  
  一、高考历史学科多选题的兴衰
  
  1988年8月,教育部考试中心在总结高考历史学科11年命题经验的基础上,提出探索使用多选题题型,用以考查考生对深层次知识理解。并决定于次年一1989年推出该题型。
  1989年,多选题题型首次在高考历史试卷中出现(表1),仅有4题,共8分。首次出现的多选题与单选题没有分离,而是共设在选择题中(共46题)。其中1至42题为单选题,每题1分;43至46题为多选题,每题2分。
  1989年的4道多选题,为后来多选题的发展定下了三项原则,一是“四选多”模式,即从四个选项中选出若干正确选项,总选项数与“单选题”相同;二是“全对给分”模式,即多选、少选均不得分,也不倒扣分;三是每道“多项题”分值基本是“单选题”的2倍(1993年旧科组卷除外)。这三项原则既为多选题开创了道路,同时也为其后来出现的问题,埋下了伏笔。
  仅过一年,即1990年,多选题猛增至15道,题目数量翻了两倍多,并且分值超过了“单选题”(图1)。这种状态延续到了1992年,此三年是多选题的兴盛期。与此同时,多选题教学与考试的矛盾开始凸显:一方面,多选题的测试功能得到了深化,逐步实现了从以考查历史知识到考查历史思维能力的转变。一些以前从未出现过的“归类型”“分析评价型”“材料型”题目相继出现,给人以耳目一新的感觉。另一方面是教学、教材相对滞后,考生依然“以本为上,按教材观点答题”。结果是,多选题对当时中学历史教学起到了良好的导向作用,但考试难度陡增。
  多选题之所以在1990至1992年急速发展。与当时历史学科承担高考命题改革急先锋的角色分不开,与历史学科急于开拓能力考查的命题模式、当时社会对“高考”的压力也分不开。还是那句话,我们的高考不仅是学科的,也是社会的。考试的科学化水平永远不会超前于人们对考试的认识水平。历史学科为高考命题改革作出了贡献;但同时,也违背了考试规律——在没有充分掌握解新题型的情况下,就在如此高利害的考试中大量使用,难免会出现技术问题。
  鉴于社会对试卷难度问题的责难,在1993和1994年的试卷中,命题组降低了多选题的题目比例,赋分与单选题总体相当,多选题命题技术稳步提高,出现了一些有创意的好题。而这种状况到1995年,发生了变化。
  1995年是全国范围内,全部实行会考后高考的第一年。高考理论上不再兼顾检测高中教学,而是被明确定义“为高等学校选拔符合要求的合格新生”。随着高考性质和功能的变化,历史学科进行了自1990年以来,力度最大的命题改革。举措之一就是“全面改造选择题,拓展这一题型测量能力的功能”,再次调高了多选题的比例,使多选题分值达到36分,占全卷分值的24%,分值超过了单选题。
  
  对于多选题的中途退出,可从客观、主观两方面因素分析。就客观而言,1988~1999年正值急风暴雨式的高考命题改革时期:会考后高考重新定位、能力立意、学科化能力目标修订、教材改革等因素交织在一起。一系列重大问题、矛盾都还没有解决,细化到多选题这一具体题型问题,更没有机会深入研究。
  就主观而言,多选题的命题,的确有些“操之过急”。在特殊的历史背景下,在对多选题理论、技术准备不足的情况下,过快地大规模使用 新题型(图1),造成难度失控。从而使这种被历史测量界看好的题型,过早地退出了历史舞台。
  
  二、多选题的研究状况
  
  我国系统的考试理论缘于西方。教育测量学、统计学、认知心理学等框架结构、基本概念、研究范式是从国外借鉴而来的。在考查多选题研究现状之前,有必要将我们熟知的名称与规范的题型术语进行对应,以便准确研究。
  国外研究者通常将选择题分为5种类型:1、multiple-choice item or Type A(单选题)2、multpeleresponse(多选题)3、multiple true-false or Type X(多重是非题)4、complex multiple choice(复杂单选题)5、Type K(K型选择题)。
  第1、2种题型与我们单选题、多选题内涵基本相同。
  第3种题型——muhipletrue-false orTypex(多重是非题),兼有“是非”和“选择”两种题型特征,在高考历史学科中,还没有以独立题型出现过,故本文暂不介绍(Frisbie对此题型有深入研究,有兴趣读者可简要参看其三篇文章)。
  
  第4种题型complex multiple choice(复杂单选题)基本可与我们所称的“组合式”单选题相对应(如例1所示,该题选自1986年历史高考选择题第1题)。我们通常将“组合式”选择题融人单选题,而国外研究者则做严格区分。
  例1:在下列我国古代四种生产工具中,哪些是用于水利灌溉的?(题干 Stem)
  ①水排 ②翻车 ③筒车 ④耧车
  (备选答案primary responses)
  A ①② B ②③ C ③④ D ①④
  (组合选项secondary choices)
  第5种TypeK可以看做是第4种题型的变型,主要区别在于“组合选项”的数目。如果“组合选项”为4项,则被称作复杂单选题;如果“组合选项”数目为5项则被称作K型选择题。K型选择题,在我国医学类考试中可以见到,研究文献也集中于医学考试。教育类考试极少使用,高考试卷中未见使用。也有一些文献对两者不做区分,与第3种题型一起,笼统称为复杂单选题①。
  (一)多选题的产生
  学者们一般认为,桑代克(E.L.Thorndike)于1908至1914年间陆续编制了一套计算、字迹、语言和拼写的标准化测验;凯利(Frederick J.Kelly)则在1915年推出了由“选择题”组成的默读测试。具有讽刺意味的是,促使“选择题”大量使用的直接原因是战争需要。
  1917年,美国因第一次世界大战的需要,必须快速将150万士兵按照智力水平及特点迅速进行分类、安置。其中很多士兵文化程度不高,不具备文字书写能力。美国心理学会接受了该任务,在奥提斯(A.Otis)研究基础上研制出历史上第—个团体智力测验一“军队A式量表”(ArmyAlpha)和“军队B式量表(Army Beta)”。由于测试对象和测试效率要求,测试不可能采用大量主观题的形式。于是,选择题及其他客观题形式被大量应用。这两种量表所使用的选择题为今天意义上的“单选题”。
  单选题被广泛应用到团体测验后,其高效、便捷的优势得到人们的认可。被迅速推广。在教育领域,人们开始尝试使用包括“多选题”在内的一些更为复杂的选择题模式,试图测量更为复杂的认知结果,但多选题的理论研究却始终没有得到突破,一直处于选择题研究的边缘地位。在现有国外文献中,如无特殊说明,“选择题”是指单选题。
  在应用层面,由于多选题具备在同一条件下,给予更多选择的优势,故在目前的人格测验、态度、价值观等测验中得到一定范围的应用。而在教育类测验中,多选题使用较少,极少在试卷中单独出现,基本是配合“单选题”使用。
  (二)多选题的研究趋势
  鉴于多选题研究,通常以与其他选择题型比较研究的形式出现,故对其进行分析时,需要将整体选择题资源状况做以总览。本研究中,笔者以中国知网(cNKI教育领域)与美国教育信息资源中心(ERIC)资源为研究对象,时间跨度选择为1966年初至2010年6月。筛选国内专题研究文献总计372篇,国外714篇(图3所示)。
  国外选择题研究的两次高峰期分别在70年代末和80年代末,1990年以后,逐渐进入“衰退期”,标志着该题型研究趋于成熟。国内研究高峰期是在90年代末,进入2006年后又进入新的研究高峰期,这也标志着国内该题型研究尚未成熟,还属于探索期。在研究方法上,国内多为定性研究,定量实证研究只有9篇,而国外数据实证研究的数量则为82篇。
  在几种选择题型中,多选题专题研究数量最少,特别是国外研究文献,专题研究multiplercspoDse的文章不超过5篇,国内专题研究文章基本在20篇左右(教育领域内)。
  (三)国外研究状况
  在国外714篇文献中,单选题占到了90%以上,其余四种类型总计不超过10%。国外研究者从理论到实证研究,都认为单选题已能够满足测量目标需求,并没有对多选题做更深入的研究。有代表性的观点如Steven J.Burton认为多选题比单选题形式复杂,却没有测量到更为复杂的认知结果,而且命题者在命制“非正确选项”时会出现诸多问题。但该观点未见实证研究证据。
  值得注意的是,国外研究者明确反对使用复杂选择题(即我们所称之为“组合式”单选题)的做法。总结研究观点如下:1、复杂选择题形式比单选题复杂,但区分效果差。2、组合选项设置的线索提高了低分考生之分数。3、实证研究表明该题型比单选题及多重是非题信度低。4、内容效度存在缺陷,并未测到单选题已经测到的复杂的认知结果叫。5、作答时间更长,减少了内容抽样。
  (四)国内研究状况
  20世纪80年代中后期,选择题引入我国,在自身没有理论准备的基础上,选择题被大量直接运用于各类大规模教育考试中。国内371篇文献中包含:题型研究101篇,统计研究23篇,英语学科78篇,医学学科63篇,历史学科23篇,其他学科类型83篇。
  题型研究是在一边实践摸索、一边译介中建立起来的。因此,多选题研究反而比国外更充分些,对于组合式单选题探索也没有过多顾虑。国内对多选题型分值、难度、误差等进行研究的文献中,有四篇值得关注。其一是郭述评等人通过比较研究,得出单选题比多选题形式要好的结论。其二是宋立新等研究者通过概率统计方法,得出多选题难度大于单选题的结论。其三是陶应奇通过计算,认为单选题猜测概率是多选题的2.75倍,多选题综合难度系数是单选题的2.2倍,同等难度下,多选题分值应为单选题的2.2倍。其四是孙慧超提出“全或无”的评分标准比“部分给分”更科学。
  在学科方面,聂幼犁1987年开始进行客 观性命题研究,在理论及实证研究方面做了翔实的工作。他在1988年发表的选择题题型研究文章,最早对多项选择题、配伍选择题、排列选择题、组合选择题进行讲解,开选择题系统研究之先河。1994年之后,刘梵从题型角度对多选题做了更为深入的研究,并辅之以例题讲解、数据分析。1999年,秦卫华论述了历史单选题与多选题相互置换的技术方法,提出组合式单选题代替多选题的观点。随1999多选题被组合式单选题替代,多选题的研究戛然而止。
  
  纵观百年来的考试发展,大凡成功的考试项目,无一不是考试技术、方法与考查内容的完美结合,题型就是三者的契合点。对题型运用的精准程度是衡量考试技术水平的重要标志之一。从某种程度上讲,国外对单选题研究已经成熟,而多选题尚有较大研究空间,如果能在此领域有所建树,将是我们对教育测量学领域作出的贡献。
  
  责任编辑:王雅贞
其他文献
《雷雨》的主人公究竟是谁黄梅生曹禹的四幕话剧《雷雨》的主人公,现代文学研究史料中有三种说法,一说周朴园,一说待萍,一说蘩漪。这确是一个值得探讨的问题。《雷雨》的主人公究
我国的民族音乐源远流长、内容丰富,在世界上独树一帜。特别是戏曲艺术,更是博大精深、美伦美奂,堪称中华瑰宝,令全世界喜欢音乐的人们赞叹不已。然而长期以来,如何传承和弘