论文部分内容阅读
近年来,大规模开放式网络课程——慕课(Massive Open Online Courses,MOOC)发展十分迅猛,掀起了一场教育技术改革的风暴。慕课中的学习者数量庞大,他们在学习慕课课程的过程中产生了大量的数据。通过对这些数据的分析和挖掘,能给学习者、教师和慕课的发展带来现实意义。因此,相关研究正慢慢成为研究者关注的话题。本文以慕课学习者作为研究的切入点,主要进行以下几点方面的工作:(1)从定性(可视化)和定量(统计分析、相关性检验)两个角度探究影响慕课学习结果的因素,为模型特征选择提供重要依据。在分析的过程中发现了“离群”学习者,他们的学习行为对应的学习结果与一般学习者不同。最后,从宏观角度和微观角度总结了分析工作。(2)大量研究只是简单地分析了离群学习者的现象而并未作深入地研究,本文提出一种基于密度聚类的离群学习者检测模型,来全面的认识他们。将学习者的学习行为和学习结果作为聚类变量,采用特征加权算法来联系变量与学习结果的关系。为了适应不同课程的数据,提出一种自适应的参数选择方法来搜索聚类参数。(3)提出一种基于K-means的多角度学习者类型划分模型,有利于教师提供个性化的教育。在特征加权算法的基础上引入课程视角因子用以反映课程对聚类变量的影响。该算法关联了学习者的行为和个人特征对学习结果的影响,并且可以在课程的各个阶段进聚类,使得算法更具普适性。(4)对学习者证书预测问题的难点进行了深入的研究,提出降采样的堆模型来克服数据中的正负样本分布不平衡的问题并且避免了随机降采样时重要训练样本的丢失的问题。为了在混合数据集上建模,引入了课程相似度指标来传递不同课程的信息。通过对比实验,证明了该模型有较好的预测效果、较强的抗干扰能力。