面向生物医学领域的实体关系抽取研究

来源 :苏州大学 | 被引量 : 10次 | 上传用户:yqwang1023
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物医学实体关系是生物医学知识获取的基石,也是复杂生化网络构建中的必要组成部分。随着生物技术和信息技术的快速发展,生物医学领域的实体关系抽取已逐渐成为跨学科研究的热点。如何从海量文本中快速、准确地抽取出人们感兴趣的生物医学实体关系对于生物医学的发展具有重要意义。本课题选择当下最为热点的化学物与疾病之间的文档级关系抽取问题进行研究,旨在充分利用生物医学文献资源,抽取出具有高度价值的生物医学信息,以期更好地服务于生物医学领域的研究、生产和实践工作。本文的主要研究内容包括:1.针对生物医学文献中化学物与疾病间的文档级实体关系抽取问题,本文提出一种基于上下位过滤与层次化特征提取的关系抽取方法,并发布了相关实验平台。本文首先将文档级的实体关系分解为句内关系和句间关系两个层次,进而采用词汇、词性、句法等多种语言学特征对不同层次的实体关系分别进行抽取;在抽取出不同层次的实体关系后,本文将所得结果进行融合,以获得最终的文档级实体关系抽取结果。在实体关系抽取的过程中,本文提出一种上下位过滤方法以解决实体间复杂的语义包含现象,从而保证关系抽取结果的准确性。实验结果表明基于上下位过滤与层次化特征提取的关系抽取方法对生物医学文献中的文档级实体关系具有良好的抽取效果。2.针对文本中实体关系的表示问题,本文进一步提出一种基于上下文与依存表示模型的关系抽取方法。本文重点针对句内关系抽取问题进行了改进。在进行句内关系抽取时,本文提出将实体间的上下文信息与依存信息相结合,利用深度学习中的卷积神经网络对其进行抽象的语义表示,以捕获实体关系更深层次的抽象特征,从而提升关系抽取的效果。实验结果表明,基于上下文与依存表示模型的关系抽取方法可以显著提高文档级实体关系的抽取性能。3.针对语料库中训练数据不足的问题,本文提出一种基于远程监督学习的关系抽取方法。本文首先将数据库中已有的知识通过实体对齐方式从文本中自动构建出大量训练实例,然后利用这些实例训练关系抽取模型,并对句内关系和句间关系分别进行抽取。在句间关系抽取层面,本文提出一种基于栈式自编码器的神经网络关系抽取模型。在句内关系抽取层面,本文提出一种基于注意力机制的循环神经网络关系抽取模型,并在关系抽取过程中结合了多种关系实例的语义信息,充分考量了不同关系实例的重要性程度。实验结果表明,基于远程监督学习的关系抽取方法在面对文档级的生物医学实体关系时,具有良好的抽取效果,可以达到当前最为先进的关系抽取水平。综上所述,本文致力于面向生物医学领域的实体关系抽取研究,希望通过提出行之有效的实例表示和生成方法来提高实体关系抽取的性能,从而协助推动生物医学领域信息抽取技术的进步。期待本文所取得的初步成果能够对该领域的相关研究提供一定的参考价值,从而促进生物医学领域自然语言深层理解技术的发展。
其他文献
通过分析雷电波侵入变电站微机保护装置的三大途径:即由供电电源线路入侵、由变电站内的计算机通信等信息线路入侵、由地电位反击电压通过接地体入侵,提出采用屏蔽、均压、过压
目前许多设计单位均将绩效评价作为考核员工工作成果、实行奖惩的主要依据。由于水电站水力过渡过程计算对不同的工程工作量差别很大,如果简单参考其他工程,就很难保证绩效考核
重庆地票制度是我国城乡建设用地增减挂钩政策的重要实践,我国农村土地制度改革的重大创新,其在统筹利用城乡土地资源、严格保护耕地、推动土地节约集约利用、消化楼市库存、
水电工程造价控制是合同管理的重要组成部分,贯穿于工程始终.监理单位通过熟悉和掌握合同文件,本着公平、公正的原则,实事求是仔细认真的审核处理每一项变更、索赔,严格控制
高职院校实验室是个很特殊的场所,万一发生安全事故会造成严重的人身和财产损失。根据高职院校实验室的特点,如何保证实验室安全有序地进行教学和科研工作的同时预防实验室安
构皮滩水电站大坝为抛物线双曲拱坝,施工单位根据本工程施工技术复杂、质量要求高、工期紧等特点,采取了一系列先进的施工技术措施,目前已浇筑混凝土约18万m^3,本文对前期混凝土
<正>慢性肾小球肾炎是临床上的多发病、常见病,是慢性肾衰竭的主要原发病,严重威胁着人们的健康。由于没有可根治的药物,因此对慢性肾炎病人在积极药物治疗的同时,自我养生就
会议
综述土壤污染物的种类及影响、土壤修复技术的种类、土壤污染生物修复技术的类别以及相应的展望.
学术讲座可以促进学术交流,拓宽学生视野,营造良好的学术文化氛围。但目前由于许多高校对学术讲座重要性认识不足,内容安排不够合理,宣传力度不够等原因造成了学术讲座往往流