基于语义依存图的关系提取方法研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:wffgwffg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在人工智能时代,日常生活的多方面正在走向智能化,包括网页搜索,智能推荐,智能问答等。在推进智能化的过程中,需要机器拥有和人类类似的知识储备。因此,如何构建一个完善可靠的知识图谱成为一个十分有价值的工作。其中,从文本中提取实体间的关系是构建知识图谱过程中重要的一环,也是难点之一。实体对的关系提取方式根据是否有上下文信息可以分为两种。一种是关系抽取,在一个包含待提取关系实体对并且表达的关系不会发生变化的句子文本中,根据句子的信息抽取实体对的关系。目前,大多数方法采用远程监督学习,并且,采用多实例学习方法减少噪声数据的影响。另一种是关系推理,在由多个陈述句组成的事实且实体间的关系随着事实的描述会发生变化的文本中,根据上下文信息回答问题,问题涉及事实中的实体和关系。目前,大多数方法采用提取句子级别的特征信息,再将句子信息进行融合,最后结合问题信息给出答案。本文在对基础技术学习的基础上,着重研究并提出了句子中实体间语义特征提取方法和在词语层的关系推理方法,主要研究内容如下:(1)针对目前提取句子特征的方法只能提取出句子的结构特征,而忽略了句子的语义特征,影响模型准确率的问题,通过引入语义依存图的最短路径,并提取实体间语义特征,提出了基于语义依存图的关系抽取方法。本文将从语义依存图中提取的实体间最短路径作为神经网络模型的输入,并构建双向循环卷积注意神经网络模型(BLCANN)。在模型中提取形式为<词,依存关系,词>的最小依存单元特征信息。从而,在语义相同而表述不同的句子中提取到相同或类似的特征信息。最终,通过实验表明,该方法与基线方法相比准确率有明显提高。(2)近几年,图网络模型被提出并广泛应用。针对面向关系推理的图网络构建问题,本文通过引入语义依存图表示词之间的关联信息,提出了一个词级别的关系图网络模型,与句子级别的关系推理相比,该模型可以细粒度反映关系推理中实体间的关系。基于语义依存图的关系图网络模型将词作为节点,语义依存图的词间依存信息作为节点与节点的边信息,并逐句将整个事实信息融入更新到图网络中。同时,为了在保留节点间关键信息的条件下,降低基础完全图的更新计算量,本文通过在图中引入Master节点,提出了一种基于信息汇聚的节点更新操作。该方法将所有的词节点信息汇聚并更新Master节点,将更新后的Master节点信息作为各个词节点更新的依据,从而减少了更新节点时的计算量。最终通过实验表明,基于语义依存图的关系图网络在准确率上与基础方法相比能有所提高。(3)汉化与改进Pydial系统,系统中汇聚了大量的千岛湖景区周围的餐饮与酒店信息,并能向用户提供一些简单的景点、住宿和餐饮信息咨询。在系统中,对于从网络上抓取的景点、住宿和餐饮信息使用BLCANN模型抽取实体间的关系并将信息结构化存入知识库。其次,在对话动作推理阶段,使用基于语义依存图的关系图网络模型结合整体对话过程推理下一步的对话动作。
其他文献
新形势下,高校基层党组织建设要不断地改进工作方式,创新工作载体,适应十八大提出的创新型、学习型、服务型党组织建设新要求。本文通过对当前高校基层党组织建设载体的运用
中国的影子银行兴起于2005年,它缓解了中小企业融资难的问题。但由于监管不到位,逐渐积累了系统性风险。目前,商业银行内部的影子银行业务在我国影子银行体系中占比最大,尤其
庄文中,孔子是方内之人,不同于道家之方外之人,外内不相及,崇方外而贬方内。郭象注文中,孔子是"游外以冥内"的圣人:一是孔子以无心无意无情的山林之心,行仁义礼法等世俗之事,
<正>~~
会议
“五四”时期的无政府主义基本伴随着现代国家建设的失败而诞生,故其首先对民国初年上层的政治体制改革提出了全面质疑,随后尝试在基层建立起一个能够杜绝和预防政治腐败的良
仿生技术是仿生学研究在实际工程中的应用。仿生技术通过研究生物体对生存环境独特神奇的身体形态、微观机构和生物功能为实际新技术研究和应用激发仿生灵感和提供生物参考原
<正>史蒂文·温伯格(Steven Weinberg),既是诺贝尔物理奖获得者,同时又是一位口碑俱佳的作家——通过深刻的物理洞察力清晰地描述物理现象——直到现在,他的书总是赢得普通大
目的:比较早期左侧乳腺癌保乳术后全乳放疗“野中野”正向调强治疗计划(FIF-IMRT)和5野逆向调强治疗计划(5F-IMRT)的剂量学差异,统计两种计划的剂量分布特点,以期明确两种方