论文部分内容阅读
在教育学和心理学的测试研究中,分析和探索潜在特质(如能力)随时间变化的发展趋势一直备受研究者们关注。被试者们可能要参加多次测试,才能实现研究者对他们的潜在特质及其变化趋势的有效评估。项目反应理论是通过测验得到被试对测验项目的反应,再将反应与被试的潜在特质进行建模来研究和分析的过程(详见Lord,1980[64])。在纵向数据研究中,通常假定学生的能力是随时间的变化而不断变化的,相较于单一时间点的测试研究,这里包含了更加丰富的信息。如果一个测试由一些子测试所构成,潜在特质可能有复杂的结构,传统的项目反应理论模型可能不再适用于这类数据。本文首先提出了一种具有多项式结构的纵向多水平项目反应模型,用以测量被试的潜在特质随时间的变化趋势,及协变量对该趋势的影响。为了估计模型参数,一种联合贝叶斯方法被运用。文中选择偏差信息准则(DIC)和广泛适用的信息准则(WAIC)对所有候选模型进行比较。模拟结果表明,在不同的模拟条件下,联合贝叶斯估计方法对模型参数的返真效果均较好。大多数情况下,DIC和WAIC都可以选出真实模型,且两种准则选择的结果相似。最后,以成绩发展的纵向数据集为例说明了提出程序的实施及意义。此外,针对实际研究中可能存在的某些纵向数据的相依问题,本文从测验设计和统计建模两方面展开研究,建立具有Antedependent(AD)结构的纵向多水平二级评分模型,并进一步提出其相应的贝叶斯参数估计方法,为准确估计模型中的未知参数提供保障,从而更好地刻画3年到6年级学生数学评估中纵向数据的统计规律。采用DIC和WAIC两个准则分别对对所有候选模型进行评价,选出同一更适合实例数据的模型。当模型变得更复杂时,比如纵向的、多水平的、多级评分的模型,使用传统的贝叶斯算法(MCMC)进行参数估计将十分耗时。为此,本文提出了一种改进的估计方法,称为加速的MCMC(QMCMC)算法,其精确性和有效性将通过模拟研究加以验证。在不同的模拟条件下,QMCMC算法保障估计精度的同时,其运算效率较MCMC算法提高了近1/4。当整个模拟实验需要成百上千次时,QMCMC算法的使用将大大地缩短运算时间。综上所述,针对二级评分数据,本文提出了两个不同的纵向多水平项目反应理论模型,运用MATLAB软件实现参数的贝叶斯估计,更进一步揭示被试的潜在特质随时间的变化情况。并分别针对两组实际测试中的数据,用提出的模型进行建模,展示数据的纵向变化趋势。此外,针对多级评分数据,本文还提出了一种新的贝叶斯参数估计方法,在保障估计精度的基础上,大大地提高了纵向多水平多级评分的项目反应理论模型的估计效率。