【摘 要】
:
随着互联网的快速发展,网络数据量呈爆炸式增长。如何对海量数据中的知识进行组织和表达,以更好地对知识进行分析和应用,逐渐成为学术界和工业界所关注的热点。知识图谱由<头实体,关系,尾实体>形式的三元组构成,能够将海量数据中的知识以图的方式进行组织,从而为智能服务的实现提供支持。然而相比于现实中的海量数据和知识,知识图谱仍是十分稀疏和不完备的。因此,如何从外部数据源获取三元组以扩充知识图谱,
论文部分内容阅读
随着互联网的快速发展,网络数据量呈爆炸式增长。如何对海量数据中的知识进行组织和表达,以更好地对知识进行分析和应用,逐渐成为学术界和工业界所关注的热点。知识图谱由<头实体,关系,尾实体>形式的三元组构成,能够将海量数据中的知识以图的方式进行组织,从而为智能服务的实现提供支持。然而相比于现实中的海量数据和知识,知识图谱仍是十分稀疏和不完备的。因此,如何从外部数据源获取三元组以扩充知识图谱,是当前亟待解决的一个关键问题。通过关系抽取和实体对齐能够从不同外部数据源中获取三元组。关系抽取从文本中获取给定头尾实体间的关系,进而获得三元组;实体对齐能够在不同图谱中发现指向真实世界中同一事物的实体,之后可从外部图谱中获得三元组。现有的关系抽取和实体对齐算法,多为监督场景下提出,而实际场景中并没有充足标签信息,更多是半监督场景。此外,半监督的方法中,Bootstrap类的迭代式方法在少量种子的情形较为适用,但若前面轮次出现错误,后面的轮次会将错误放大。强化学习对于状态-动作的探索过程,可用于迭代中对于种子是否扩充的探索,从而减少错误在后面轮次的扩展。本文设计并实现了半监督场景下,结合强化学习的关系抽取和实体对齐算法。针对半监督场景下的关系抽取,本文提出了结合强化学习的基于Bootstrap的关系抽取算法。在该算法中,为提高文本的表示质量,提出了基于自动编码器的半监督场景下的文本表示方法;为了防止语义漂移,提出了 Bootstrap框架下的策略梯度方法。在真实数据集进行实验测试的结果表明,本文提出的关系抽取算法与现有工作相比,显著提高了 F1等指标,验证了所提算法的优越性。针对半监督场景下的实体对齐,本文提出了结合强化学习的基于迭代式的实体对齐算法。在该算法中,为提高图谱的表示质量,提出了基于图神经网络的半监督场景下的联合映射方法;为防止错误传播,提出了迭代式框架下的策略梯度方法。在真实数据集进行实验测试的结果表明,本文提出的实体对齐算法与现有工作相比,显著提高了Hits@k等指标,验证了所提算法的优越性。
其他文献
英语学习自我效能感和归因方式是影响学生英语学习的重要因素,英语学习自我效能感的不足以及不恰当的归因方式会直接影响英语成绩的提高。本研究采取调查问卷法和访谈法相结合的形式,以240名新疆乌鲁木齐市68中初二学生为研究对象,探索研究英语学习自我效能感及归因方式的发展特点,并探讨了初中生英语学习自我效能感、归因方式与英语学习成绩之间的相关性。具体回答以下4问题:(1)初二学生英语学习自我效能感和归因方式
随着互联网时代的不断发展,越来越多的用户在各种网络平台上获取信息,使得网络上的各种文献资源呈指数上升趋势。在当前快节奏的生活中,为了让用户能够快速高效地获取感兴趣的信息,必须将长文本信息压缩成内容凝练的短文本。文本自动摘要生成技术就是通过训练自动摘要生成模型将长文本压缩成内容凝练的摘要。本文研究了传统TextRank模型和基于Word2Vec的TextRank模型,经过实验对比分析,总结了目前抽取
作为常见的语言现象,多义词是英语词汇的重要部分,也是英语学习的重难点。原型范畴理论对多义词的研究认为多义词的所有义项中通常存在一个原型义,其他边缘义以原型义为基础通过认知理据衍生而来,所有义项构成以原型义为核心的语义范畴。理论上,原型范畴理论能够为英语多义词的习得提供更加高效的指导。本研究旨在以高中英语学习者为研究对象,主要回答以下问题:1)对照传统教学法,原型范畴理论指导的教学法对高中英语多义词
随着社会经济和文明的发展与科学技术的不断进步,人们对于准确地识别人物身份信息越来越重视。其中,人脸识别因其识别方式友好等优点而广受关注,当前成熟的人脸识别技术已广泛应用于多个领域。然而,在一些特殊场景下,有时很难直接获得目标人物的面部照片,而采用通过目击者或知情者的面部特征回忆,绘制一幅人脸的手绘草图,并通过这张草图寻找目标人物。在该场景下,如何通过人脸草图准确识别人物身份这一问题至关重要。当前,
思维导图是一种很方便很实用的学习工具,对学习有很大的帮助。而生物也是高中学习阶段中的一门重要的学科,也是基础学科。在高中的学习,很多时候都是靠死记硬背。运用思维导
建立知识结构、培养发散思维、增强迁移能力是初中地理教学的教学目标,也是教师可以使用思维导图达到的教学目标。思维导图有多种类型,包括括号类、气泡类、桥状类,而不同类
初中历史是初中学习中最重要的组成部分,是我国千年来的文化传承,是现在学生了解文化历史的重要途径。为促进初中生对历史文学素养,教师在进行教学时可以适当地使用思维导图
在海上目标监测系统中,有多种设备用于监测目标的运动轨迹、行为方式,这些设备的原始数据经过时间的累积形成庞大的历史数据。在对监测目标进行历史回顾时需要一个将目标的历史数据以可视化形式呈现的系统。现有的系统中已经实现了目标历史数据的存储,但是在历史数据回放方面尚有欠缺,系统缺乏对目标多设备历史监测数据的可视化回放,难以全面的反映目标在回放时间段内的行为信息和运动状态。系统缺乏对目标历史运动轨迹的动态呈