论文部分内容阅读
在线学习的发展使得学习者可以灵活支配自己的时间,然而在线学习却也有弊端,如高灵活性使得部分学习者投入度较低,而导致较差的学习效果;同时,由于缺乏监督性以及评估的滞后性,部分学习者可能在快要结课的时候,才开始“努力”学习,导致学习效果无法得到保证。随着教育数据挖掘与学习分析技术在教学中的发展应用,存储在平台中的学习者数据愈来愈成为学者们研究的重点,通过分析学习者在平台中的各类数据,可以为学习者自我调整、教师及时干预和提供支持服务提供实践上的可能。本研究从学习投入中的行为投入维度入手,探究在线学习环境下对学习者行为投入及时评测的方法,并搭建系统将评测结果可视化给学生和教师,以期促进在线学习环境下高投入学习的发生。本研究首先通过梳理国内外相关文献,归纳总结学习投入在教育教学中的研究应用,梳理学习投入度在传统学习与在线学习的评测方法和效果,构建在线学习行为投入评测指标,并根据目前在线学习行为投入评测存在的局限提出搭建行为投入评测系统,对学习者在线学习行为投入度进行及时评测,在第八周开始即将评测结果及时反馈给学习者和教师,帮助学习者及时自我调整,教师更好地开展教学。其次,本研究以实现对在线学习行为投入度的及时评测为目的,通过分析处理在线学习行为投入的评测指标,构建五维度指标模型,模型包括:参与、专注、坚持、交互和绩效努力,共包含十三个指标,并运用数据挖掘技术和SPSS对十三个指标进行分析,分析后剔除空值过多的指标和相关性较高的指标,最终确定视频观看比例、章节测验完成比例、高访问量的保持、视频观看反刍比大于100%的次数和视频平均观看时长作为本研究的主要指标,并根据五个指标进行聚类分析、聚类质量检验以及单一指标与成绩相关性分析,验证五个指标的有效性。最后,通过Python机器学习算法搭建逻辑回归、随机森林、支持向量机和集成方法Stacking四类模型,经过训练后发现前8-13周的效果并不好,最主要的问题是:数据集不平衡。针对此问题,通过过采样方法平衡数据集样本,再次训练发现模型在8-13周的效果有所提升,对比发现,随机森林模型效果优于其它三类模型,故采用随机森林作为行为投入评测系统开发的主要算法,并将随机森林模型应用于另一个数据集上,发现在14-16周模型性能较好,8-13周的性能不尽人意,后续可能需要重构集成学习的个体学习器或者在模型训练之前应用特征工程对特征做改善处理。而后使用Flask Web开发系统,并将数据存储在本地SQLite数据库中。系统分为学生端与教师端,学习者可以从第八周开始查看到自己每周的行为投入具体数据,在班级中的排名以及行为投入评测结果。教师则可以综合查看班级所有学习者的行为投入五指标数据以及与成绩的相关图。