论文部分内容阅读
随着“大数据时代”的到来,数据挖掘(DataMining)成为了各行各业的关注热点,它能够在大量的杂乱无章的数据集中挖掘出有价值的信息,并在商业、金融、医疗保健等领域取得了成功的应用。近年来,随着教育信息化的发展,越来越多的专家学者研究教育领域数据,并形成了一门新的学科—“教育数据挖掘”。目前,在教育部门以及考试机构中存储了大量的考试成绩数据没有得到充分利用,对考试数据的分析不仅能够为教育部门和决策者提供建议,对学习系统进行评价,还能够为教学提供改进方法,指导并改善学生学习。本文通过多元统计以及复杂网络的方法对大规模考试成绩数据进行分析,主要分为复杂网络分析、因子分析以及多元回归分析三个部分。首先,利用复杂网络的方法构建了理科综合试题的空间结构,刻画了理化生三个科目间以及全部试题间的关联关系,发现了最小生成树网络中的社团结构,以及探索了试题间考查能力的关联关系。其次,基于统计学中因子分析方法,对北京市高考理科综合考试成绩数据进行研究分析,结合试题的经典测量指标,得到了反映学生理科综合考试能力的四个公共因子,并探索了利用不同因子得分为学生进行多元评价的方法。最后,根据试题的知识点和能力点,构成理科综合试题的特征属性,建立多元回归模型,预测试题的区分度。对区分度的预测,能够给命题人提供决策意见,且本文所构建的数据模型,对于知识和能力的量化研究具有启发性意义。