论文部分内容阅读
近年来,随着测量理论和计算机技术的发展,计算机化自适应测验(Computerized Adaptive Testing,CAT)受到人们越来越多的关注。能力估计技术在CAT中一直扮演重要角色,其估计的准确与否不仅影响选题策略的自适应,还会由此持续的影响CAT最关注的能力估计的准确性。CAT的能力估计方法至今仍沿用IRT时代的几种主要方法,常见的包括MLE,MAP,EAP,WLE等。本文就CAT中能力估计方法的比较与开发开展了两项研究:研究一对四种常用CAT估计方法采用计算机蒙特卡洛模拟程序,分别从偏差,均方根误差,题库调用均匀性,测验效率等方面,进行了系统性的比较。研究二则是以研究一为基础,根据不同估计方法特点及优劣,开发了一种新的CAT能力估计方法——能力综合估计法,即强调在CAT能力估计的不同阶段,综合运用恰当的CAT能力综合估计方法,以期取长补短,发挥现有能力估计方法的优势,达到同时提高CAT能力估计的准确度及测验效率。研究结果表明:1) MLE的偏差小但均方根误差大,曝光率相对其他方法更好,但测验效率最差,且对特殊作答模式无法给出有效的估计。2) WLE的偏差最小,均方根误差多数情况下优于MLE,在a分层选题且b均匀时曝光率最好,且最大信息量选题时的测验效率最高。3) MAP的偏差最大,均方根误差较小,曝光率在大多数条件下与WLE,EAP并无区别,且a分层选题策略下的测验效率最高。4) EAP的偏差仅次于MAP,但均方根误差最小,测验效率略低于MAP。5)本研究提出的前期和中期用EAP,后期用WLE的能力综合估计法可以有效提高EAP的偏差并基本维持EAP的均方根误差。6)综合法主要可以在控制均方根误差的基础上有效改善EAP的偏差。对EAP偏差的改善率可达到30%~40%,而均方根误差仅相比EAP差了不到5%。7)综合法在不同长度的测验中均能有效改善EAP的偏差,其中短测验中改善的效果更好。