论文部分内容阅读
考试是教育评价的主要手段,传统考试特别是大规模的纸笔考试,费时费力,在实施传统考试时,组织管理过程中也存在不少困难。随着计算机技术的飞速发展,在标准化考试中。计算机所起的作用越来越大。但一般的计算机化考试大多是基干计算机的考试,是纸笔考试的无纸化形式,无法实现“因人施侧”。近二十年来,项目反应理论(IRT)指导下的计算机自适应测试(CAT),得到迅速发展和应用。与纸笔考试不同,CAT的宗旨是为每个被试者构建一个理想的考试,使不同的被试者进行不同长度和内容的考试。CAT具有纸笔考试所不具备的优势——更短的测试长度、更高的测试精度、按需测试和即时的成绩及结果报告,都使CAT更具吸引力。本文对网络智能考试系统的设计与实现进行了探讨。自适应测试包括估计被试能力、连续地为被试者选择合适的试题,在达到预期目标时终止考试。本系统以洛德(Lord)最大信息量为选题策略,以条件极大似然估计为能力估计方法,以费舍测验信息总量为侧试终止规则。目前,考试系统中对于主观题(填空题、概念题、简答题、论述题)等题型的自动阅卷算法目前还没有太好的实现,一般的考试系统的评分功能不包括对于主观题的,而对于客观题(选择题和判断题)则实现得比较全面。如果一个考试系统中的考题都是客观题,这样的试卷不是一份好的试卷,仅有这类题型的试卷对测试考生的能力还存在欠缺。因此,理想的试卷针对不同的学科还应该包括有主观题。对于主观题,由于它的答题特点和复杂性,目前还没有一种考试系统能很好地完成其自动阅卷。主观题的自动评分涉及到人工智能、模式识别以及自然语言理解等方面的理论和知识,需要解决很多技术上的问题,因而成为在线考试系统中的一个技术难点。本文侧重于在理论的层次上对主观题判分的方法进行设计和说明,这些方法也具有一定的使用范围和局限性。回顾过去,展望未来,主观题评分技术的实现能被更多的领域所研究,随着以后计算机技术的不断发展,主观题评分技术也能取得很大的进步。最后文章对CAT未来发展的可能性进行了展望。