论文部分内容阅读
今春突发的新冠肺炎疫情是对我国在线教育的一次重大考验,在疫情防控期间各类学校开展各种形式的在线教学工作,实现了“停课不停学”的目标,这表明进一步推进在线教育发展的必要性和重要性。大规模开放在线课程(Massive Open Online Courses,MOOCs)作为在线教育的一种形式,以其不受时空限制等诸多优势,近年来吸引了大量学习者,发展迅速。然而,由于宽松的学习环境,目前面向MOOCs的学习存在以下两个问题:课程辍学率较高和学习者学习效果较差。研究表明,学习行为和情感是影响辍学和学习效果的重要因素。面向MOOCs的学习行为和情感分析是新型教育环境下降低辍学率、改善学习效果的突破口,迅速成为当前研究热点。虽然已经涌现出诸多相关研究,面向MOOCs的学习行为和情感分析在实际应用中,仍然面临以下挑战:第一,在辍学行为预测方面,采用不同的学习行为特征预测结果不同,可能导致预测结果波动较大,识别准确率较低。第二,在学习行为和学习效果分析方面,目前大多研究重点关注学习行为和学习效果的相关关系分析,缺乏因果关系分析,导致分析的结论不可靠,无法提供有效的决策支持。第三,在情感分析方面,有监督的方法依赖大量的标注数据,而对这些数据进行标注费时费力,成本较高,且存在大量无标注数据并未充分利用。本文针对学习行为和情感分析研究工作面临的挑战,从建立准确高效的预测和分析模型出发,研究了面向MOOCs的学习行为和情感分析,以准确识别风险学习者及其情感,为降低辍学率和改善学习效果提供支持。本文主要工作和贡献如下:(1)提出一种基于网络日志的辍学行为预测方法。该方法在从网络日志数据中提取学习行为特征的基础上,提出一种基于决策树和极限学习机的辍学行为预测混合模型。该模型的核心是将决策树树形结构映射到极限学习机的网络结构,以同时实现特征选择、快速训练、辍学行为预测功能。实验结果表明,本文提出的方法在辍学行为预测准确率和F1值上优于多数现有方法,且不需要迭代训练。(2)提出一种学习行为和学习效果因果分析方法。该方法首先利用专家知识构建初始因果网络,在此基础上,利用结构学习从数据中学习并构建最终的因果贝叶斯网络。其次基于构建的因果贝叶斯网络进行推理,发现导致学习效果优异和较差的学习行为模式。实验结果表明,构建的因果贝叶斯网络可以较为准确地预测学习效果,进一步在该网络上进行学习行为和学习效果因果分析,根据较差的学习行为模式提出五类干预建议。(3)提出一种基于半监督协同学习的课程评论情感倾向识别模型。该模型从基于字符和单词的视图分别提取文本特征,以同时利用基于大规模语料库训练生成的静态词向量和基于领域语料库训练生成的动态词向量的优势。为选择置信度较高的样本,设计了一种双策略样本选择方法;为解决类别不平衡问题并提高分类准确率,设计了一种适用于半监督学习的混合损失函数,以同时操控标分布不平衡的标注数据和未标注数据的损失。实验结果表明,本文提出的方法在使用少量标注数据的情况下,提高了课程评论情感倾向识别的准确率和F1值,且稳定性更好。(4)提出一种基于无监督规则的课程评论方面和观点提取方法。该方法在词性标注和依存句法分析的基础上,根据词语之间存在的词性标记模式和依存关系,提出一系列方面和观点提取规则,进一步对使用规则生成的方面和观点候选集进行过滤,并识别观点的情感倾向,从细粒度层面分析评论为积极和消极的原因。实验结果表明,本文提出的方法在不使用标注数据的情况下,提高了课程评论方面和观点提取的精确率和召回率,并从教学水平、课程资源和学习平台三个角度进行了分析。