基于深度学习的联合实体识别和关系抽取模型研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:britney0
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
实体识别和关系抽取是自然语言处理领域中两个十分经典的问题。能够快速准确的识别出实体对及其之间的语义关系,对于信息抽取有着必不可少的作用,同时在进行知识图谱的创建过程以及信息搜索等领域都有着至关重要的意义。随着互联网的快速发展,数据量暴增,对知识服务的要求越来越高。因此实体关系抽取技术也成为了近年来学术界和工业界的研究热点之一,并在信息检索、问答系统、知识库创建、知识图谱等众多领域发挥着极大的作用。随着深度学习的发展,基于神经网络的实体识别和关系抽取技术的优势得到充分的显现,逐渐成为了当前使用主流的方法之一。本文研究了基于深度学习的联合实体识别和关系抽取模型,文章所做的主要工作内容和创新点包含如下的几个方面:1.总结了实体识别和关系抽取作为自然语言处理领域的两大热点任务的研究背景和研究意义,介绍了实体识别和关系抽取任务的原理、质量评价指标并回顾了实体识别和关系抽取的发展历史和国内外研究现状。概括介绍了深度学习和神经网络相关的基础理论如基于神经网络的词向量技术、卷积神经网络结构、循环神经网络、长短期记忆网络和优化算法等。2.提出了一种基于双向长短期记忆网络的深度学习实体关系抽取联合模型。该模型采用双向长短期记忆网络对实体所在的语言上下文进行编码,通过共享参数的方法达到联合实体识别和关系抽取两个任务的目的,深层次的利用了语义信息且减少了错误传播,最后在Co NLL04数据集和COAE2016数据集上的实验表明本文提出的模型明显优于多个基准模型。3.提出了基于远程监督的端到端模型来进行实体关系抽取任务。该模型同样采用了双向长短期记忆网络对实体所在的语言上下文进行编码,采用一种新的标注策略将实体识别和关系抽取任务完全转化成序列标注问题,然后加入自注意力层来充分表示文本,通过带偏置项的损失函数来增强了模型对于有关系的实体对的识别能力。最后在NYT数据集上的实验效果证明了本文提出的模型的有效性。
其他文献
从单个多图中挖掘频繁模式现已经成为研究热点,如社交网络中,两个人之间可能有诸如Facebook、Twitter和LinkedIn等多个关系,挖掘社交网络多图中的频繁子图对发现社会互动机制
极化码于2009年由Arian教授所提出。凭借基于信道极化现象的特殊编码方式,极化码成为了一种被理论证明可达香浓极限的信道编码方案,吸引了信道编码领域专家的关注。在专家们
在无线网络中,将一个共同的信息同时传递给多个用户,多播技术在其中扮演了一个十分重要的角色。多播波束成形技术能够通过利用基站(BS)端的信道状态信息(CSI)进一步提升系统
乳腺癌是当今女性多发的癌症疾病之一,且发病率逐年上升。尽早发现乳腺癌并配以合理的治疗手段对于提升病发人群存活率具有重要意义。由于高敏感度与特异性,磁共振成像(Magne
教育是民族振兴、社会进步的基石。近些年来,面对稳定增加的生源,高等院校不断加强自身改革,坚持内涵发展,提高自身教学质量和教育水平,由过去粗放式的发展转变为提升教学质
频谱感知作为认知无线电关键技术和研究内容之一,对于缓解静态频谱分配策略与动态频谱需求之间的矛盾具有重要的研究意义。本文针对传统频谱感知性能不足和进一步提高频谱利
为了简化腹腔微创手术的导航系统,产生了基于SLAM的腹腔镜导航系统。将医学图像信息与实时腹腔镜视频融合在一起,可以极大的增加外科医生的视野,使医生能看到位于表面一下的
目前智能移动机器人是很多学者研究的主要方向,而同步定位与地图构建技术是移动机器人能够实现自主移动的关键。视觉SLAM系统是指搭载相机为传感器主体,能够同时进行定位与地
传统的手势识别方法依靠人工设计复杂的特征提取算法进行图像的特征提取,该方法对手势图像的采集设备、背景及人的手势动作要求较高。基于卷积神经网络的图像特征提取可以直
行人再辨识可应用于刑探侦查、社会安保等领域。已有许多行人再辨识方法被提出,主要分为两大类:基于人工设计特征的行人再辨识方法和基于深度学习的行人再辨识方法。早期行人