论文部分内容阅读
人类通常以创造新概念或拓展旧概念的方式来更新知识体系,维基百科是这个知识体系中最具代表性的缩影和镜像之一。近年来的研究发现,在不断演化的知识库中蕴含着有价值的概念关联网络,通过探寻维基网络的概念迁移规律,可以构建面向优化学习路径的知识表示模型。本文在证明维基百科的概念间具有全连通性的基础上,利用该网络中的概念间的通路、最短路径和双向长度等性质,研究其语义层面的知识网络的表示方法和相关构建算法,最后将知识点关系和学习者知识状态的估计引入学习路径的优化中。我们的工作首先通过典型的知识网络演化案例展现学习内容的迅速变化,随后经过建立概念关联、构建概念网络和学习路径规划三个循序渐进的任务解决优化问题。 本文的主要贡献包括: 1)首次收集并构建了基于层级结构的课程指导大纲数据集,研究面向学科领域的知识图谱框架,为构建普适的学习路径优化的概念序列提供理论基础。在此基础上建立了一个动态可扩展的框架来处理和分析这些数据,为展现学科之间联系和随时间的演化规律提供了一种途径。利用这个框架,我们对ACM/IEEE从1968年到2016年发布的课程指导大纲进行了分析,发现计算机学科的具有自顶向下的5层知识结构,包含了5门课程,73个知识领域,544个知识单元,3727个主题和7311个核心概念。 2)概念之间的相似度是构建学习路径的基础,传统的评估方法往往依靠特定领域的知识图谱,在更新速度和覆盖面上受到制约,在全科学领域难以实现。本文提出一种创新的利用维基网络链接关系进行概念相似度评估的算法,首次验证了维基百科之间的普遍连通性,在公开数据集上进行的实验结果显示,算法在单词相似度得分上能够达到0.90,在文本相似度的得分上能够达到0.77。 3)通过知识点之间的联系可以构建概念网络图,之前的研究没有充分利用知识库,有很大的局限性,本文提出了一种利用维基百科的网络结构自主化完成知识表示的方法,通过探究概念和临近概念的关系,进行关联性评估并判断概念所属分类,从关联概念角度进行知识表示。实验结果显示,提出的算法准确率能够达到80%,通过与其它知识表示方法的对比,验证了该方法的有效性。 4)为了解决学习路径优化的问题,必须对学习过程和学习效果进行建模,本文在建立概念关联和构建概念网络的基础上,首次提出了一种基于概念网络拓扑结构的学习路径优化方法,充分考虑了所学新知识与学习者已掌握知识之间的相互作用,同时根据知识的基础性和重要性程度差别提供不同的复习间隔。通过对本文算法生成的学习路径在全面性、一致性和准确性三个方面的实验评估,验证了提出的学习路径优化策略对所需掌握的知识点涵盖率达到85%以上,生成的学习序列与专家设计的合理序列的吻合程度最高达到95%,并且通过学习者的实际测试显示了良好的学习效果。