论文部分内容阅读
教育要面向信息化、面向现代化。教育大数据趋势下,信息技术辅助教学的需求日趋强烈。开展MOOC课程教学不仅需要提供质量优异的教学内容,更需要获取数据驱动型教学的过程性、总结性分析结果,使分析结果成为师生互动、生生互动的纽带。促使教学者有效地掌握课程动态,实时地调整教学策略,正确地引导学习者学习过程,这些分析结果对于学习者则是最直接的学习反馈,有助于学习者更加自觉、主动地参与学习。在MOOC课程教学过程中,讨论区文本数据是重要的课程互动、交流协作的体现,是掌握学习动态、评估教学质量的重要数据支撑。MOOC课程平台上时刻产生着大量的文本数据,通过人工阅读和标注的方法很难完成语义信息的统计工作,此外,学习者之间的文本语义存在相似性,不同话题随时间也会发生变化,对文本中隐藏的语义信息实现自动、有效地挖掘和展示是在线学习分析的重要研究问题。本研究以中国大学MOOC平台陕西师范大学《现代教育技术》课程为实验对象,分析讨论区文本的学习者话题内容和话题演化情况。基于文献研究梳理了MOOC学习者话题挖掘的现状和相关技术,选定《现代教育技术》各单元学习体验与反思的讨论文本为实验数据并对实验数据进行预处理,包括文本过滤、基于jieba的中文分词、去停用词和基于TF-IDF算法的文本特征化处理等过程,使文本数据转化为话题模型能够处理的特征向量形式,通过对话题分类、聚类相关技术的比较,厘清了话题模型在处理隐含语义信息方面的优势,选取作者话题模型和动态话题模型作为本研究的核心技术方法,探讨学习者讨论话题内容、话题相似的作者推荐、话题随时间的演化等问题,并对数据结果进行可视化展示,针对已经产生的数据结果的特点,将文本数据可视化形式分为基于文本内容的可视化和基于话题模型的可视化两类,使用到的可视化技术有柱状图、词云图、热图、pyLDAvis和t-SNE。话题挖掘是对MOOC践行关联主义学习理论的有益尝试,为促进在线开放课程的师生交互、感知学习共同体方面提供了一定的帮助。实验结果表明:并不是每个单元内容都能匹配到话题挖掘结果,学习者话题大多讨论的是课程中前期的内容,尤其第八、第九单元并未发现显著话题;基于话题相似作者推荐功能的实现,学习者能够更简单快捷地找到相似学习群体,并且在一定程度上对讨论内容的抄袭行为起到了监督作用;话题“信息时代教学要求”体现了“信息时代学习者”的观念转变,“信息技术能力提高”是信息时代的教学要求;话题内关键词概率的变化表明话题讨论重点的变化,例如话题“学习理论基础”前期的讨论重点是学习理论,后期的讨论重点是信息技术;学习者在选择讨论用语时倾向围绕“核心关键词”进行描述,并会倾向一同使用有关联的词汇组合,例如学习者倾向绑定“认知”主义、“行为主义”、“建构主义”和“人本主义”四个学习理论一同使用,反映出学习者普遍对“学习理论”专题的掌握较为全面,“多元智能”理论作为专题“理论研究新进展”中最常被谈及的理论,其他新理论的关键词似乎并没有受到足够关注;话题内关键词的使用概率与单元的开设时间有明显的相关关系,部分学习者能够跟随课程单元按时学习;对课程正面评价的情感词汇在课程中后期成为高概率词汇,学习者对课程的认可存在一个渐进的过程;各话题热度大多呈现平稳或上升趋势,课程学习中的话题讨论具有稳定性和持续性:可视化结果反映:抽取的话题概率大小接近,课程讨论中并没有出现绝对的热门话题,MOOC讨论区还存在大量话题识别困难的讨论文档,这些学习者的讨论话题十分分散,通过t-SNE图学习者可以清楚地了解到自己与主流话题的契合程度。这些分析结果能够让教学者清楚地把握课程内容的讨论情况,促使教学者对课程内容和结构进行评估和优化;学习者能够快速发现共同学习群体,促进学习者对共同话题的深入讨论。为进一步实现MOOC课程的自适应学习和个性化学习提供参考。