基于弱监督和注意机制神经网络的生物实体关系抽取研究

来源 :北京交通大学 | 被引量 : 1次 | 上传用户:huangyi101
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关系抽取是自然语言处理(Nature Language Processing,NLP)任务的一个重要分支,关系抽取任务的主要内容是获取语料中目标实体间的关系信息,其实是一个多分类的过程。关系抽取在“知识图谱构建”、“问答系统”等任务中都有很广泛的应用。关系抽取任务早期使用“条件随机场”等传统方法比较多,但面对日益复杂的数据结构和海量的待处理数据,传统方法逐渐无法达到期望的效果。近年来,随着深度学习技术的发展,使用卷积神经网络、循环神经网络等进行关系抽取任务可以获取更多的语料信息,抽取结果也更加准确。与此同时,关系抽取在生物医学实体中的应用也越来越广泛。生物知识库的构建、医学数据的整理都离不开关系抽取。在关系抽取任务中,存在着处理的过程中对目标词的集中度不够,对词的语义信息缺乏利用等问题。同时鉴于生物医学实体的特殊性,需要对网络模型进行针对性的调整。本文设计了两个关系抽取模型:(1)针对长文本上下文信息容易丢失的问题和语料中不同句子以及句中不同词对实体关系抽取结果影响不同的情况,提出了多重注意机制门控循环单元模型(Multiple Attention GRU,MAGRU)。模型以双向长短期记忆网络(Long Short-Term Memory,LSTM)的变型门控循环单元(Gated Recurrent Unit,GRU)为基础,并在此基础上分别在对词和句子进行处理的时候增加注意机制,形成多重注意机制GRU模型。同时考虑到生物医学文本的特殊性,通过调整模型的注意机制来适应生物医学实体关系抽取的要求。使用模型分别在传统数据集和生物医学数据集上与现有效果较好的方法进行对比实验,实验结果表明,MAGRU模型比现有模型F值有至少1%的优势。(2)针对关系抽取任务对语料中的语义信息利用不足,尤其是生物医学文本中语义信息对关系抽取效果影响更大的情况,本文在多重注意机制模型(MAGRU)的基础上引入词的命名体信息和词性信息等其他语义信息作为输入数据的补充,同时在生物医学文本关系抽取实验中增加具有生物医学背景的语义信息,并结合注意机制进行调整。本文使用模型分别在传统数据集和生物医学数据集上进行与现有效果较好的方法以及无语义信息的MAGRU模型进行对比实验,实验结果表明,引入语义信息的MAGRU模型比其他模型在F值上有3%左右的提升。
其他文献
在经济迅速发展的时代里,伴随着现代文明的推进和外来文化的冲击,中国地域文化正面临着严峻的考验。特别是随着城乡改造的深入推进,原著居民的频繁流动,部分古村落也正在逐渐
本文对6类(共37例)癌症患者的癌组织和癌旁组织中12种微量元素水平和微量元素在癌症患者的癌组织和癌旁组织中分布的影响因素进行了研究。结果表明,微量元素在各种癌症组织中
现今很多企业和服务商收集的用户数据蕴藏着大量的有用信息,所以经常需要数据共享,但是由此带来的隐私泄露事故层出不穷,因而人们将注意力投入到开发精确的隐私保护数据发布
目的:探讨血栓弹力图(Thromboelastography,TEG)在评估妇科恶性肿瘤患者围术期凝血状态及预防血栓发生中的临床意义及价值。方法:选取2017年10月-2018年12月于大连大学附属中
目的:检测冠心病慢性心力衰竭患者血清富亮氨酸α2糖蛋白1(Leucine-rich α2 glycoprotein 1,LRG1)含量,探讨LRG1与慢性心力衰竭的关系。方法:①连续收集延边大学附属医院住
实行理实一体化教学策略是当前许多高职院校教育体制改革规划中必经的道路,是全面发展应用型人才的有效措施。以培养应用性人才为教学目标的家具设计课程教学要求具备生动,综
高校教室作为培养学术人才的重要场所,其室内照明环境的质量不单影响学生的眼部健康,而且对学生的学习效率有较大影响。本文拟通过对高校教室的照明环境进行实地勘察,对调研
前言 胃癌是最常见的恶性肿瘤之一,虽然近年来在世界范围内胃癌患病率呈持续下降趋势,但在我国其死亡率仍居首位。而且由于受我国人均寿命的延长和人口老龄化的影响,目前胃癌
在案例分析的基础上,构建基于危机生命周期的企业竞争情报机制实施主要影响因素的初始集合;采用问卷调查法获取主要影响因素对机制实施影响的相关数据;采用因子分析法提取机
软件测试是软件开发过程中保证软件质量的至关重要的一个环节,是提高软件质量的关键。软件开发中的问题被测试出来的越早,解决问题的成本越低。而在软件测试的过程当中,测试用例的质量好坏对测试工作的有着举足轻重的影响,好的测试用例可以使测试工作事半功倍,差的测试用例却可能会导致软件开发成本的提高。基于模型的测试其测试工作不必拘泥于软件开发的进度具体实施完成度,能够在各个阶段开始工作。只需根据需求规格说明便可