CAT常用能力估计方法比较及其优化:能力综合估计方法开发

被引量 : 0次 | 上传用户:xiangqi520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着测量理论和计算机技术的发展,计算机化自适应测验(Computerized Adaptive Testing,CAT)受到人们越来越多的关注。能力估计技术在CAT中一直扮演重要角色,其估计的准确与否不仅影响选题策略的自适应,还会由此持续的影响CAT最关注的能力估计的准确性。CAT的能力估计方法至今仍沿用IRT时代的几种主要方法,常见的包括MLE,MAP,EAP,WLE等。本文就CAT中能力估计方法的比较与开发开展了两项研究:研究一对四种常用CAT估计方法采用计算机蒙特卡洛模拟程序,分别从偏差,均方根误差,题库调用均匀性,测验效率等方面,进行了系统性的比较。研究二则是以研究一为基础,根据不同估计方法特点及优劣,开发了一种新的CAT能力估计方法——能力综合估计法,即强调在CAT能力估计的不同阶段,综合运用恰当的CAT能力综合估计方法,以期取长补短,发挥现有能力估计方法的优势,达到同时提高CAT能力估计的准确度及测验效率。研究结果表明:1) MLE的偏差小但均方根误差大,曝光率相对其他方法更好,但测验效率最差,且对特殊作答模式无法给出有效的估计。2) WLE的偏差最小,均方根误差多数情况下优于MLE,在a分层选题且b均匀时曝光率最好,且最大信息量选题时的测验效率最高。3) MAP的偏差最大,均方根误差较小,曝光率在大多数条件下与WLE,EAP并无区别,且a分层选题策略下的测验效率最高。4) EAP的偏差仅次于MAP,但均方根误差最小,测验效率略低于MAP。5)本研究提出的前期和中期用EAP,后期用WLE的能力综合估计法可以有效提高EAP的偏差并基本维持EAP的均方根误差。6)综合法主要可以在控制均方根误差的基础上有效改善EAP的偏差。对EAP偏差的改善率可达到30%~40%,而均方根误差仅相比EAP差了不到5%。7)综合法在不同长度的测验中均能有效改善EAP的偏差,其中短测验中改善的效果更好。
其他文献
目前我国往复走丝电火花线切割机床的市场保有量已超60万台,为我国模具加工制造及相关行业的快速发展提供了有力的装备支撑,但仍存在着诸多不足,如它的加工效率为80~150mm2/mi
计算机化自适应测验(computerized adaptive testing,简称CAT)是项目反应理论(item response theory,简称IRT)成功应用的结果,引进了强大的现代科技手段——计算机,CAT根据被试能力自
心理与教育测量领域在20世纪后半叶开始引入了题库与计算机等技术相结合的计算机化自适应测验,这些技术的引入使得测验变成了“无纸化”。较之现在,以前最简单的计算机测试是先
城市经济的快速发展和城市人口数量的急剧增加,导致城市交通压力与日俱增,并逐渐成为上升为城市化的重要问题之一,而城市地铁因能有效缓解交通问题而得到了大力发展。然而,城
英语和汉语属于两种不同语系的语言,在诸多方面存在着极大的差异。鉴于这两种语言在词类上的差异,在汉译英的过程中就不能用“一一对应”的不变通方式逐词翻译,而是要根据英语表
太熙元年杨骏担任太傅之后,陆机受其征召,入洛担任了太傅府祭酒一职。在元康元年三月杨骏被诛杀的政治风波中,陆机由于职位较低,又是南方才士的代表,声名远扬,受到了张华的救理,同时
近几年,我国社会主义经济体制不断完善的同时,也使得事业单位在财务管理方面遭受了较大的冲击。在新的社会形式下,我国市场环境变得复杂,事业单位除了要做好内部财务管理之外
<正>有一位妈妈说她的儿子一直很调皮,自己很是头疼。这位妈妈听说美国教育中会使用计时隔离的管教方法,特地来问我这种方法到底有没有用以及该如何运用。什么是计时隔离?在
期刊
在创建实体的连锁超市的基础上,探讨创建校企合作的新模式。充分发挥校企合作的特点,通过实践的学习,培养学生的综合能力,点燃学生创业激情,以连锁超市为蓝本,运用资本的纽带
【正】副动词的使用必须符合现代标准俄语的规范,也就是必须符合结构和语义两方面的规范,即语法规范和意义规范。前者是指副动词必须与句中的谓语同属于一个主语,后者是指副