论文部分内容阅读
本研究尝试对IRT取向下的三种方法:SIBTEST、IRT-LR和DFIT,设置三种模式:标准程序下(Standard模式,简称ST),加入Scale Purification程序的检测模式(简称SP模式)和加入DIF-free-then-DIF策略的检测模式(简称pure anchor,简称PA,),进而形成九种检测程序(SIB-ST,SIB-SP,SIB-PA,IRT-LR-ST,IRT-LR-SP、IRT-LR-PA、DFIT-ST,DFIT-SP,和DFIT-PA),在等级反应模式下以模拟实验方式,探讨三种模式和九种检测程序的检测效果比较。研究设计采用四个自变量(样本容量,DIF形态,DIF百分比以及DIF强度),因变量两个(I型错误率和统计检验力)。研究主要结论摘要如下:一、在不同样本容量下,九种程序的统计检验力都是是随着样本容量增大而逐步提高的,平均统计检验力和平均I型错误率亦如此。SP和PA检测模式的统计检验力分布与ST检测模式的分布基本相似,但I型错误率控制为较低。二、对于不同强度DIF检测,除了非一致性DIF题,一致性和混合型DIF的检测方面,各种程序对于强度为中度(0.6)的DIF题目检测效果都优于两种轻度DIF题目的。三、对于不同DIF比例(10%,20%,30%),9种程序的统计检验力和I型错误率随着DIF比例增加而提高。四,整体统计检验力而言,IRT‐LR法三种检测模式的DIF检测效果相对于其他方法较佳。DFIT次之,SIBTEST随后。五、不同检测模式而言,在低DIF比例和小样本时,ST模式统计检验力较好,而在高DIF比例和大样本时,SP模式和PA模式表现较为接近,比ST模式要更好一些。SP和PA检测模式对控制I型错误率有积极作用。