基于二阶段测验Q矩阵估计方法的开发

被引量 : 0次 | 上传用户:housekingzuo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
认知诊断理论以其从微观认知角度对被试做出准确评估与反馈的优势在教育与心理测量领域中展现出了巨大的发展潜力。但是,要利用这种优势就必须确保所构建测验Q矩阵的合理性。以往研究所构建的测验Q矩阵主要依赖于专家的经验,这种方法的缺点是专家的水平以及意见统一与否会严重影响到测验Q矩阵的正确性,而错误界定的Q矩阵会对模型参数估计和被试分类准确性带来严重地影响(Rupp&Templin,2008;涂冬波,蔡艳&戴海琦,2012)。为了克服这一困难,国外研究者开发出了6种基于被试作答反应数据的Q矩阵估计方(Barnes,2010;Liu,Xu,&Ying,2012;Close,2012;De Carlo,2012;Xiang,2013;Chiu,2013a),以数据驱动的视角为专家界定Q矩阵提供参考。本研究在这些研究的基础上,结合贝叶斯法(De Carlo,2012)估计准确率高但对Q矩阵已知元素要求较高,而非线性惩罚估计法(Xiang,2013)准确率低但不需要提前界定Q矩阵的特点,开发出一种适用于DINA模型的测验Q矩阵估计方法—二阶段法。该方法的思路是首先采用非线性惩罚估计法得出0-1之间连续的Q矩阵并通过选取不同分界点对其进行部分离散化,然后用贝叶斯法将未能离散化的那部分Q矩阵元素恢复,从而实现Q矩阵的完全离散化估计。为了验证二阶段法的可行性及合理性,本文采用Monte Carlo模拟以平均判准率和判准率增幅为指标考察了被试人数(500,1000)、测验长度(31,62)、属性个数(5,7)和分界点选取标准(0.5,0.6,0.7,0.8)等因素对二阶段法的影响。结果发现:(1)随着被试人数的增加,二阶段法的平均判准率也随之上升且高于非线性估计法的平均判准率;(2)增加测验长度和属性个数,二阶段法的平均判准率有所下降,但仍高于非线性惩罚估计法;(3)不论何种条件下,分界点选取标准为0.6和0.7的平均判准率均高于以0.5分为界点标准(非线性惩罚估计法)下的平均判准率,判准率增幅最高可达10.2%;(4)不同分界点选取标准对二阶段法判准率增幅影响不同。在小样本(500人)条件下,分界点选取标准为0.6时,二阶段法的判准率增幅较其他分界点选取标准高;相反,在中等样本(1000人)条件下,分界点选取标准为0.7时判准率增幅较高。本研究可为实际应用者在认知诊断测验Q矩阵界定上提供方法学借鉴及支持。
其他文献
在深入学习实践科学发展观活动中,柳江县教育局党委高度重视,组建了精干高效的工作机构,精心谋划了工作方案,本着“着力破解影响和制约教育改革发展难题,努力谋划教育事业科学发展
多维项目反应理论因其模型本身的天然优势及其兼具因素分析与项目反应理论于一身的优点,而被广大研究者及应用者所重视。本研究介绍并引进了现代测量理论中的前沿技术——多
<正> 中国和苏联的改革,举世瞩目。可以肯定,不论改革成败都将影响两国和世界的未来。因此,对两国改革的研究已成为国际上的热门课题。苏联改革的契机最早发端于1982年10月纪
【正】 日本是一个国土面积较小,而人口较多的岛国,人平耕地仅0.75亩。但是,由于日本高度重视食品工业的发展,在第二次世界大战后的三十多年里,由一个食品匮乏的国家,发展成
罗氏公司近日公布2008年业绩报告。由于禽流感疫苗磷酸奥塞米韦(达菲)销售锐减,罗氏公司2008年全年利润下跌5%,仅达到108亿瑞士法郎(合93亿美元)。
2009年12月18日,奥巴马总统在哥本哈根联合国气候变化大会发表讲话,阐述美国在气候变化问题上的立场和采取的行动。此演讲热情充沛且逻辑严谨,具有鼓舞人心的力量。该文现以
改革开放30多年来,在党和国家的领导下,我国农村的经济发展水平有了一定的提高,特别是在新时期新阶段又出台了一些惠农政策,这更有利于现阶段农村区域的经济发展。但我国一直
科学发展观是党的三代中央领导集体关于发展的重要思想和方法论的集中体现,是同马克思列宁主义、毛泽东思想、邓小平理论和“三个代表”重要思想既一脉相承又与时俱进的科学理
【正】 据我们调查:泰和县某一个工厂,职工总数为390人。这样一个小厂中,脱产干部竟有104人,占了职工总数的四分之一以上。其中,厂级领导干部共6人,科室、车间负责干部40人,
安永会计事务所在2005年进行了中国药品市场和药品市场投资的调查。调查对象为国有制药企业、合资企业等,主要是了解中国潜在的药品市场发展情况,外资什么时候进入比较合适,进入