论文部分内容阅读
随着互联网技术和教育大数据的蓬勃发展,以MOOC为代表的在线学习平台如雨后春笋般应运而生。课程资源的数字化和网络共享,使得MOOC平台课程资源与日俱增。面对不计其数、质量良莠不齐的课程资源,很容易导致学习者面临课程资源丰富但选择资源困难的两难境地,使学习者产生信息迷航。如何帮助学习者在爆炸式增长的MOOC资源中快速、精准地找到适合自身的学习资源是当前教育大数据领域亟待解决的问题。个性化推荐作为一种有效地解决信息过载的方式为MOOC平台的个性化资源推荐提供了思路。基于协同过滤的推荐是目前使用最普遍、最奏效的个性化资源推荐技术,拥有计算简单、普适性好、较高的推荐精度等诸多优良特点。然而随着MOOC环境下学习者和教育资源数据量的指数级别增长,传统协同过滤推荐技术在处理较稀疏数据和冷启动时表现效果欠佳,推荐内容重复并且无法有效处理在线学习用户的高维度、非线性数据,导致资源推荐效率低下。随着人工智能领域第三次热潮的来袭,深度学习技术越来越受研究者青睐,其在函数逼近、特征提取和分类预测等方面的高效性能可以有效解决传统推荐方法在相似度计算方法单一、数据稀疏性、高维度属性无法表征、用户潜在兴趣偏好无法挖掘等问题,它给在线学习平台的课程资源推荐提供了新的途径。为了提升学习者的学习效率和学习积极性,本文结合深度学习技术对个性化推荐做出探索。实现对人口统计学特征、学习者行为兴趣偏好以及课程内容属性特征的综合分析与挖掘。主要完成如下研究:①针对传统协同过滤推荐方法相似度的计算方式过于单一,无法深度挖掘学习者与课程资源之间的潜在约束关系,本文提出基于DBN分类的推荐方法代替传统相似度计算方法,采用DBN高效的特征抽象能力和特征提取能力,充分挖掘学习者对课程资源的兴趣偏好。另外,针对传统协同过滤推荐方法普遍存在冷启动和数据稀疏性问题,本文深度挖掘学习者人口统计学特征和课程资源内容属性特征,结合学习者行为特征一同构建基于DBN的学习者兴趣模型,有效地解决了冷启动和数据稀疏性问题,以及学习者对课程资源兴趣偏好表达不精确问题。②针对MOOC环境下学习者广泛的行为特征提取存在复杂性和不完整性,现有技术规范无法全面记录学习者的行为信息,本文提出了一种基于XAPI的学习者行为数据记录规范,通过学习活动流的形式记录学习者的学习行为,采用适合本文所提MOOC平台的常用动词来记录学习者学习活动,完成了对MOOC平台学习者学习行为特征的完整记录,为学习者兴趣模型提供更为宽泛的行为特征。另外,针对DBN分类模型训练过程中参数过多和规模过大导致的DBN-MCPR收敛速度慢、过拟合、训练周期长等现象,本文提出了一种基于Theano的GPU并行加速的方式实现DBN分类算法并训练模型,极大的加速了 DBN-MCPR的训练周期和收敛速度。③在DBN-MCPR的基础上,通过优化模型各参数的初始值以及参数设置规则来提升DBN-MCPR的评分预测准确性。通过使用公开数据集MovieLens和华中师范大学师大学堂MOOC平台真实学习者选课数据集进行实验分析。首先使用公开数据集验证DBN-MCPR的分类准确率,并与几种传统推荐方法作对比突出其优秀的推荐准确度;然后使用DBN-MCPR训练师大学堂MOOC平台真实数据集,挖掘学习者与课程资源之间的推荐规则,进一步完成学习者对课程的预测评分,并分别验证训练数据集、学习者特征向量、GPU加速对DBN-MCPR性能的影响。实验结果表明DBN-MCPR具有较好的推荐精度,并且拥较快的收敛速度。