【摘 要】
:
当前随着人们对快捷获取知识的渴求和自然语言处理的快速发展,实体关系抽取技术作为该领域经久不衰的重要研究方向,对于领域知识图谱的构建和各种自然语言处理应用,它都具有重要贡献。虽然关系抽取技术已经发展出了各种层出不穷的理论,但是自动化抽取的精准性不能达到较好的实用性。而基于深度学习的方法,比如传统管道方法存在错误传播和信息冗余,联合抽取方法存在实体重叠、关系类别标签不平衡问题,最终会导致关系抽取模型总
论文部分内容阅读
当前随着人们对快捷获取知识的渴求和自然语言处理的快速发展,实体关系抽取技术作为该领域经久不衰的重要研究方向,对于领域知识图谱的构建和各种自然语言处理应用,它都具有重要贡献。虽然关系抽取技术已经发展出了各种层出不穷的理论,但是自动化抽取的精准性不能达到较好的实用性。而基于深度学习的方法,比如传统管道方法存在错误传播和信息冗余,联合抽取方法存在实体重叠、关系类别标签不平衡问题,最终会导致关系抽取模型总体精度不高。因此本文基于深度学习联合实体关系抽取方法,针对上述存在的问题,进行了理论研究和实验分析,提出了一些针对实体关系抽取算法模型的改进和创新:(1)针对实体关系抽取算法难以完成对单句中的重叠实体关系和局内多种三元组的精准抽取难题,深入研究Bi-LSTM实体关系抽取框架,提出一种有序结构编码指针网络解码的实体关系抽取模型。改进的联合实体关系抽取模型在输入层加入生成对抗扰动项,在编码层使用改进的有序长短期记忆网络,在解码层使用指针网络,解码层采取先识别头实体,再共同识别尾实体和关系的提取策略。经过实验表明,改进的网络在提取句子重叠实体关系上总体精度有较好的提升,在对句子含有不同个数三元组的提取上也有良好的提升,说明本文改进的网络对比其他网络具有更好更稳定的抽取性能。(2)针对指针网络加剧关系类别标签不平衡问题,在编解码网络的基础上,提出了一种基于细粒度语义信息增强的实体关系抽取方法。传统模型在训练关系样例的过程中偏向于训练样例数较多的关系,这会造成模型精度虚高,对于样例数较少的关系训练和抽取都不太友好。而本文通过提出一种构建细粒度关系类别词典的方法,使用注意力机制赋予样例数较少的关系更高的权重,从而减少实体关系抽取过程中的样本不平衡问题。其次,引入上下文信息和实体类型信息,构建出细粒度语义信息增强模型来帮组提高模型抽取实体和关系的能力。最后,经过实验表明本文模型在关系类别标签样本不平衡问题上有明显改善,对比其他模型,在NYT标准数据集上总体精度提高4.5%,在WebNLG标准数据集上总体精度提高6.8%。(3)针对当前问答系统只能基于问答对完全匹配才能得到答案,不能很好地理解用户意图。本文使用改进和提出的关系抽取算法模型结合问答系统相关技术,构建改进的问答系统,做到有效地识别用户意图,从而得到用户所需答案。
其他文献
Web应用程序防火墙(Web Application Firewall,WAF)在保护Web应用程序免受SQL注入、XML注入和PHP注入等恶意攻击方面发挥着不可或缺的作用。然而,新的攻击层出不穷以及它们的复杂性不断提高,WAF必须定期更新和测试,以防止攻击者轻易绕过它们。测试和修复WAF也是安全分析人员面临的两个相关和互补的挑战。自动化测试通过生成有效的测试输入(即攻击),有助于低成本高效益地检
模型检测是一种验证软硬件系统的强有力方法,它首先用形式化语言来描述待检验系统和系统需要满足的规范,然后使用DFS(Depth First Search)等算法遍历系统模型的状态空间,找出不满足规范的地方并返回反例以指导系统修改。但是现有的模型检测器都是基于单反例的,其在验证系统时往往需要人为的多次干预才能完成验证过程。另一方面,随着移动互联网时代下各种应用和平台的用户量爆发增长,人们将自己在某个平
云计算历经十几年的发展,已经极大地改变了计算资源的使用模式,这种模式不仅提高了资源的利用率,还降低了企业和个人开发新应用的成本。但是云计算在带来便利性的同时,其面临的安全问题也日益突出,云安全事件频发,已经成为企业最关心的问题之一。在云安全中,虚拟机的安全是最根本也是最迫切需要解决的问题。而虚拟机面临的最大威胁就是具有较强隐蔽性和持久性的恶意代码攻击,隐藏进程就是其最主要的特征。因此,针对隐藏进程
在云计算技术突飞猛进,云平台使用日益广泛的今天,用户在生产环境中产生与使用的数据和文件体积随时间发展而极速扩张。针对云平台下的海量数据管理,研究人员提出了云存储概念,其意义是结合云概念,将用户的海量文件存放在大规模分布式文件系统中,结合服务器集群技术,对用户提供访问接口,用户无需关注文件存放的物理位置与组织形式,只需要使用云储存服务访问文件即可。云存储结合分布式文件系统,具有扩容方便,冗余备份,单
随着互联网技术的发展与普及,IPTV作为集通讯、互联网、多媒体等多技术于一体的崭新技术横空出世,为提升我国智能化终端电视产业的发展做出了卓越的贡献。然而IPTV业务承载网络以IP网络作为基础承载网,直接与Internet等网络互联,所以面临着IP网络所具有的各种网络安全风险。但是IPTV网络的渗透测试与安全评估缺乏相应的技术理论支持,当前攻击图模型存在量化指标较单一、客观性差、生成效率较慢,针对目
目前深度学习算法已广泛应用于合成孔径雷达(SAR,Synthetic Aperture Radar)图像的目标检测。然而,当前主流基于深度学习的检测方法存在模型复杂度高、检测速度慢以及对特殊尺寸目标检测性能低等问题。针对上述问题,本文将着重研究基于改进Faster R-CNN(Faster Region-based Convolutional Neural Network)的SAR图像舰船目标检测
在5G中,超高可靠和低延迟通信(Ultra-Reliable and Low-Latency Communication,URLLC)可以有效降低实时无线控制系统中的时延以及丢包率,以满足工业互联及自动化中实时、可靠等高性能要求。然而,为了满足严格的服务质量(Quality of Service,QoS),URLLC消耗了大量的无线资源,严重阻碍了该技术的实施和大范围部署。因此,针对多控制回路的实
伴随着云计算的不断发展,越来越多的企业将数据和服务转移到云端。在传统模式下,企业运营维护数据中心存在设备管理困难、资源利用率低、且硬件升级成本高的问题。而云计算平台能将计算资源、网络资源、存储资源等资源弹性地按需提供给企业用户,极大地为用户节省了硬件管理维护成本。当前的云平台重点在于如何按需切分调度资源,给用户提供高效稳定的服务。但在消息推送方面,缺乏专门的功能组件进行处理,平台控制中心与各业务模
近年来,在图像识别、语音识别等领域,深度学习的表现越来越突出,成为业界内很多人的研究对象。而在一个的神经网络中,包含了大量的参数,在进行网络训练时,参数量越大,单次训练需要的时间越来越长。其次,现有的深度网络框架并不能满足任何环境下的网络运行。而近年来,图形处理器GPU(Graphic Processor Units)硬件设备得到了快速升级,通用计算技术因此而有了飞跃性的成长,到如今已慢慢开始走向
后疫情时代,“新基建”、“智慧城市”俨然已成为“十四五”期间最热的关键词之一。兼具分布范围广和承载能力强等优势的智慧合杆,其上搭载与城市运行息息相关的诸多Io T设备,是天然的信息采集、展示入口。围绕智慧合杆上搭载的大量Io T设备进行管理,进而打造串联万物的物联网平台成为近年来的研究热点。本文面向河南省鹤壁市5G智慧合杆一期横向合作项目,基于实验室已有云计算相关产品,提出云边端协同系统性方案,解