基于远程监督的实体关系抽取方法研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:viclee0716
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
实体关系抽取作为信息抽取的主要任务之一,其目的在于确定无结构文本中两个实体的关系类别,为进一步构建知识图谱、智能问答等应用奠定了理论基础。目前实体关系抽取最常用的方法是有监督的关系抽取方法,尤其将深度学习框架的神经网络模型应用到实体关系抽取任务上,关系抽取的效果更加显著。虽然有监督的关系抽取方法准确率高,但该方法需要大量的人工标注语料,语料的标注过程耗时耗力,因此限制了大规模的实体关系抽取任务。针对人工标注语料严重缺乏的问题,远程监督方法能够通过知识库与语料库进行启发式对齐获取大量标注数据,成为了解决大规模关系抽取任务的主要途径。然而,远程监督关系抽取方法容易产生大量噪声标注数据,影响实体关系抽取的性能。针对该问题,本文提出了一种基于语义相似度的降噪方法,同时结合注意力机制构建了一种融合多层次注意力机制的远程监督关系抽取模型,进一步提高远程监督关系抽取的效果。本文的主要研究工作如下:(1)针对传统远程监督关系抽取方法容易产生大量噪声标注数据的问题,本文提出了一种基于语义相似度的噪声标注数据过滤方法。该方法通过基于词向量的Jaccard相似性度量方法计算句子中实体对之间最短依存路径与关系短语的语义相似度来判断句子是否被正确标注,语义相似度越高,句子正确标注的概率就越高,再将过滤后的标注数据输入到分段卷积神经网络(Piecewise Convolutional Neural Networks,PCNN)关系抽取模型中进行关系分类。最后通过实验验证,本文提出的降噪方法能够显著提高实体关系抽取的效果。(2)针对目前远程监督关系抽取的研究未能充分利用句子上下文词语的高层语义,以及未考虑关系之间存在依赖包含问题,本文提出了一种融合多层次注意力机制的远程监督关系抽取模型。该模型分别在词语层、句子层以及关系层采用了注意力机制,词语层注意力能够充分获取句子上下文的高层语义信息,句子层注意力能够减少标签的错误标注问题,而关系层注意力则能够自动学习不同关系之间的依赖包含关系。在公共真实数据集上的实验结果表明,本文提出的模型相较于当前主流方法的准确率-召回率曲线提高了4%左右,实现了更好的关系抽取效果。
其他文献
社交网络关系的应用领域和应用场景广泛,分析和可视化形式多样。现有的社交网络可视化形式关注于网络结构中的节点和链接的变化,关注角度较为单一,大多是可视化一个组织内部
随着5G普及率的不断提高,对5G室内覆盖的要求也越来越高,但是室外宏基站已经难以满足5G室内覆盖在带宽、同步、时延这三方面的要求。因此本文提出了基于广电双向接入网的5G室
《资治通鉴》对惠帝高后年间史事的记载,是尊重历史史实的信史。司马光通过对惠帝高后年间史料的汇编、对不同来源史料的整理与考证,获得了最接近史实的史料,为其编撰惠帝高后年间史事提供了可靠的史料。《通鉴》所载事实大部分与史籍记载一致,且无异议;然仍有部分史事记载值得商榷。一方面,若史籍记载有差异,为使《通鉴》所载史事最大限度的尊重史实,司马光针对具体情况作出相应处理:当史籍记载相左时,通常采用多种史料相
花朵授粉算法是模拟开花植物过程的启发式算法,其特征表现为操作简便、鲁棒性强、搜索速度快、精度高和适用性强,在优化选择领域被广泛应用。但随着处理数据规模的大量增加,存在收敛速度慢、局部深度搜索能力弱、不易跳出局部最优、全局搜索能力弱的问题。针对上述问题,提出一种基于混合蛙跳和中心随机替换的改进花朵授粉算法。首先,改进混合蛙跳算法,通过较好个体的平均值调整最差个体的位置,提高算法的局部深度搜索的能力;
随着智能监控,自动驾驶等计算机视觉应用的普及,图像分类作为这类应用的底层支持,近几年来获得了快速的发展。然而在现实生活及生产活动中,获取的图像大部分都是没有标签的,
随着油气资源勘探开发程度的不断提高,页岩油气资源成为勘探开发的热点,有机质含量是页岩储层测井评价的重要参数,可靠的页岩储层有机质计算方法对页岩油气资源的勘探开发具
函数优化问题广泛的存在于各个工程领域之中,因此对优化算法的研究具有重要的理论意义和现实意义。群智能优化算法是当前优化算法中的研究热点,飞蛾扑火优化(Moth-flame Optimization,MFO)算法作为一种全新的群智能优化算法,渐渐受到学者们的关注。本文针对MFO算法存在的容易出现早熟收敛现象和无法快速收敛的问题,提出一种融合折射原理反向学习的飞蛾扑火优化算法(Moth-flame op
石墨烯将人们的注意力吸引到二维材料领域,加速了对其它二维材料的研究和发现。通过周期表第IV族元素(Si,Ge,Sn)代替石墨烯中的碳(C)原子,人们提出并制备了具有相似结构的蜂窝状
随着无线充电技术的发展,催生出无线可充电传感器网络,该新型网络采用无线充电技术给传感器补充电量,提升传感器整体寿命而获得广泛关注。然而,无线充电技术较高的能量损耗导致在现实中应用困难。为了减少充电资源消耗,提高充电效用,本文研究了两个无线充电器部署优化问题,其主要内容如下:研究面向充电效用最大化的充电器部署优化。该部分求解的问题是给定充电功率预算,和平面上一组传感器,将无线充电器部署在2D平面上,
轮胎磨损产生的细小颗粒物包括橡胶颗粒、炭黑及氧化锌颗粒等,磨掉的橡胶颗粒尺度在几微米至几百微米,而与橡胶结合不好被磨下的炭黑颗粒为纳米尺度,纳米氧化锌颗粒尺寸在1-1