知识图谱表示学习及其关键算法研究与应用

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:huahua7717
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识表示学习(KRL)旨在将知识图谱所包含的实体和关系嵌入进张量表示空间当中,从而在表示空间中完好地保存图谱的语义和结构信息,该技术广泛应用于自动问答、信息检索等各式各样的领域中。然而,先前工作的嵌入式表示学习结果往往是通过同质学习策略所获得的,即在学习过程中平等地对待每个实体和每个关系,从而忽略知识图谱所固有存在的不平衡性与异构性。因此,知识表示学习算法需要针对知识图谱的复杂结构进行改善,算法学习目标需要适应于知识图谱的异质性,进而在学习过程中有能力区别对待不同的知识类型。首先,本文对经典知识表示学习算法TransE的嵌入式表示结果进行了详细的可视化,揭示了同质学习策略的弊端,并对这种学习策略的改进思路与方法进行了研究,深入分析了嵌入式表示的空间密度与KRL模型质量之间的密切联系。由于不同知识类型的空间密度存在差异,固定的分离边距无法将嵌入式表示空间中的真实样本与伪样本分离开,因此不再适用于复杂的图结构。基于此,本文在基础KRL模型当中引入自适应分离边距,提出了一种基于分离边距的自适应表示算法提升框架AML。实验表明,AML算法提升框架能够在两大现实世界知识图谱Freebase和WordNet之上,帮助基础知识表示算法在链接预测与三元组分类的任务中获得更好的性能。接着,本文又对KRL算法当中两类样本的学习充分性进行了可视化分析,并发现真实样本与伪样本的学习是不够均衡的。因此,本文提出了一种基于成对权重的自适应表示学习算法提升框架AWL。该框架能够与基础KRL算法相结合,并根据知识异构程度在基础表示算法当中引入自适应成对权重,进而自适应地权衡真实样本与伪样本在算法目标当中的贡献程度。实验表明,AWL同样能够在两大知识库上提升基础表示学习算法的链接预测质量与三元组分类质量。最后,本文利用上述两个自适应表示学习算法提升框架AML与AWL对校园知识图谱BUPT-CampusKG(CKG)进行表示存储以及预测补全,综合开发了一套智慧校园知识图谱信息检索与可视化平台。
其他文献
极光是由携带有高能带电粒子的太阳风在与地球磁场和大气层相互作用过程中产生的发光现象。因其独特的成因,极光现象的背后隐藏着大量极区日地相互作用和地球大气层活动的相关信息,同时极光形成和发展过程中在电离层中产生并传播的大量能量又会给通信等人类活动造成干扰。所以对极光现象的观测和分析对研究日地间作用和极区大气层活动有着重要意义,掌握极光现象发生的规律,还可以有效降低极光对人类活动的影响。我国在南北极的多
在互联网快速发展的今天,研究如何高效准确的对不断膨胀的文本数据进行处理,从中挖掘出潜在的情感倾向信息,已经成为了自然语言处理领域中重要的研究任务之一,具有重大意义和应用价值。在情感分析任务中,由于传统方法存在一些缺点,基于深度学习方法得到了快速的发展并成为主流。当前存在着很多高质量的情感知识和语言资源(如情感词汇,否定词,强度词)在传统情感分类方法中起着至关重要的作用,但是这些高质量的情感知识和语
异型薄壁管结构广泛应用于石化设备、航空航天、建筑桥梁、海洋船舶、汽车制造、管线铺设中,根据截面形状不同可以分为方形管、矩形管、圆形管、椭圆管、平椭圆管、半圆形管、菱形管、多棱柱管、双槽圆形薄壁管等。由于加工工艺、使用工况(腐蚀、载荷)等因素影响,常出现裂纹及裂纹类缺陷,其断裂扩展成为异型薄壁管结构主要失效形式之一。断裂力学研究的主要内容就是裂纹开裂行为和扩展规律。应力强度因子K是裂纹尖端奇异应力场
含SiO/C复合材料的锂离子电池具有较高的能量密度(大于400瓦时/千克)和较低的成本,但在寒冷气候条件下仍存在性能退化快和安全方面的问题。这主要与脆性固体电解质界面层和锂枝晶的形成有关。在此,我们报道了一种电解质添加剂(优化亚硫酸二乙酯、亚硫酸二甲酯和氟代碳酸乙烯酯的溶剂),在200次循环中仍有了66.7%的容量保持率和0.5C的优异倍率性能,其中在复合负极中含有10%的微米级SiO颗粒和90%
学位
随着建筑业的高速发展,建筑能耗呈现出不断增长的趋势。我国居住建筑能耗中采暖空调能耗约占生活中能耗量的60%,采暖能耗成为建筑能源消耗的最大组成部分。通过充分挖掘建筑
频发的食品安全、商品假冒伪劣问题使消费者对商品流转信息的关注度日益提升,商品溯源系统作为商品质量的保障之一,得到了广泛的关注和应用。商品溯源系统面临着数据易被捏造篡改、可信度低的问题。使用区块链技术能够保障商品溯源系统中的数据难以被篡改。如何将区块链技术与商品溯源系统结合,在保障数据安全的同时尽量提高数据查询速度,减少冗余数据存储,是本文的研究点。针对商品溯源系统中存在的数据易被篡改、捏造的问题,
现阶段我国经济虽然增长迅速,许多建设取得很大的成就,但与之对应也付出了巨大代价,资源和环境被严重破坏,二者之间的矛盾日趋尖锐。这种情况是经济结构与增长方式不合理导致
会展业作为新兴的第三产业蓬勃发展,已经成为世界经济的重要组成部分。与传统产业相比,会展业有许多突出优势,如高效益、无污染、拉动经济能力强、社会影响力巨大等等。为响应澜湄合作机制,D公司发起举办澜湄合作博览会。展会采用政府引导,市场化运作的运营方法,目前遇到了招展困难等现象。本文以澜湄合作博览会为研究对象,从展会促销这一方向展开研究,以目标营销战略理论和促销理论为理论基础,并通过访谈调查发现提炼展会
数字全息术将传统光学全息术和数字图像处理技术相结合,可以记录和显示物体的三维信息,在众多领域中得到了广泛应用。由于激光源具有高相干性,照射到光学粗糙表面的物体上,造成散射光的随机干涉,形成散斑噪声,不同于非相干的加性噪声,散斑噪声是一种非常难处理的乘性噪声,散斑噪声的存在严重影响了重建图像的质量,因此,散斑噪声的去除在数字全息领域必不可少。本文首先对散斑噪声的成因进行了研究,由散斑的统计特性可知,
随着社会发展,生态环境问题日益受到人类重视.近些年来,学者们通过研究基于实际情况建立的生物种群模型,获得生物种群的发展变化规律,所得结果为保护稀有物种,管理生态资源,维护生态平衡提供了关键性策略,具有重要实际意义.本文基于实际建立了几类有脉冲、时滞和扩散等因素影响的生物种群模型,利用脉冲微分方程理论、Mawhin重合度理论、李雅普诺夫泛函和一些分析技巧,研究系统解的存在性、全局吸引性、持久性等动力