论文部分内容阅读
计算机化自适应测验(computerized adaptive testing,简称CAT)是项目反应理论(item response theory,简称IRT)成功应用的结果,引进了强大的现代科技手段——计算机,CAT根据被试能力自动选择测试项目施测,最后估计被试的能力。这种新型测验不同于传统的笔试测验,它根据被试不同的答题反应,主动选择适应被试能力的项目,以获得准确的被试能力估计值。因此,CAT是因人而异的个性化测验。根据评分模型的不同CAT采用的模型有:0-1评分模型和多级评分模型。选题策略是CAT中必不可少的组成部分,准确、高效且安全的选题策略是CAT一直以来追求的目标。经典的最大Fisher信息量选题具有效率高,估计准确等优点,但项目调用的不均匀性威胁到题库的安全。增设影子题库是一个能较好地平衡项目调用均匀性的方案。本文结合两种选题策略的优点,在0-1评分模型中,设计了一个新的选题策略,并把此方法引入按最大信息量分层和按a分层中。多级评分作为CAT中的一个分支方向,可以提供丰富的项目特征信息,文中结合曝光控制因子在Samejima等级反应模型中提出动态a分层法。模拟实验结果显示,以上新方法比已有的一些方法结果较为理想。