基于不完整数据库的基础教育知识图谱的连通性构建

来源 :湖南师范大学 | 被引量 : 0次 | 上传用户:hnkfxndz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基础教育知识图谱是一个正在建设的项目。本论文是其中的一个小分支的工作——通过连通性的建立,试图挖掘和展示概念与概念之间的联系,甚至是不同学科的概念之间的联系,以方便后续教学应用的进一步开发。具体研究内容如下:在创建基础教育知识图谱时,需要对数据库中的语料进行分词。由于词典可以简单高效的实现对语料的划分,所以本文采用Han LP分词器中的词典进行分词,但词典在基础教育方面存在着未被收录的词语,即未登录词。为了提高知识图谱连通性构建的成功率,需要向词典中添加基础教育领域方面的未登录词。文中采用N-Gram方法对原始数据分词,并统计词频,设定阈值筛选种子词语,运用左右熵和互信息方法进行过滤,筛选出未登录词,进一步完善词典。本文在构建基础教育知识图谱连通性的过程中,提出了一种基于混合语义的A*算法,并以双向广搜算法作为对比。在该算法的启发式函数中,针对余弦相似度方法计算实体间距离时存在的缺陷,提出了一种基于词性权重的余弦相似度算法。此算法通过添加词性权重来提高实体间的联系,同时引入相关参数来调整误差。最后本文设置不同的条件对提出的算法进行验证。在添加登录词和未添加登录词这两种情况下,分别从时间、度数和连通数这三方面展开分析。结果表明在构建基础教育知识图谱连通性的实验中,基于混合语义的A*算法中所运用的关于词性权重的余弦相似度方法在时间和连通数方面要远远好于双向广搜算法。实验表明在现有条件下,基于混合语义的A*算法能够完成连通性构建的任务。
其他文献
1998年1月-2002年6月,笔者采用输卵管通液术联合中药通管汤共治疗输卵管阻塞患者27例,效果显著,现报道如下.
随着医疗检查仪器的发展,腰椎间盘突出症的诊断并不十分困难,但由于手术方式的选择不当,定位不准确或切除不彻底等原因,使部分患者出现临床症状不缓解或再次复发,需二次手术
<正> 前言数千年来祖国医学家广泛采用中药医治百病千疾,积累并创造了运用中药的丰富经验。中医治病是以辨症论治的方法零活巧妙的执配方剂。如宋代寇宗奭的"本草衍义"朱丹溪
舌咽、迷走、副、舌下神经发源于延髓,又称为延髓神经.由于动脉硬化、多发性脑梗死、脑炎等引起的双侧皮质脑干束损害,临床表现为构音障碍,声音嘶哑,吞咽困难,饮水呛咳,咽反
<正>这个水龙头是目前我看过的最好的设计了,可以毫不夸张的说,设计者把"涟漪"这个概念融入到水龙头的设计,在传统的水龙头的位置用一个下面装置有LED灯的面板来代替,水流LED
期刊
针对研究生教育多年来积累的大量数据信息,引入数据挖掘技术中关联规则挖掘算法对研究生课程、学生计划、课程成绩等数据间的相关性和依存性进行挖掘,挖掘出的结果将为研究生
<正>6月13日,国务院印发《关于建立企业职工基本养老保险基金中央调剂制度的通知》(以下简称《通知》),决定建立养老保险基金中央调剂制度,自2018年7月1日起实施。《通知》要
会议
脑脊液实验室检查用于各种中枢神经系统疾病的诊断已有1000a的历史,但至今脑脊液常规检查,如细胞计数与分类、糖与蛋白定量、革兰染色、细菌培养仍然是主要检查内容[1].近年