少样本关系抽取方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:quentin324
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在互联网中存在着大量的文本数据,信息抽取可以从文本中提取出有效信息为我们所用,而关系抽取是信息抽取中重要的步骤之一,现有的关系抽取方法通常需要较多的标注语料,这需要大量的人力物力,而远程监督的方法又存在着噪声和长尾分布问题。由此,少样本关系抽取问题被提出。在少样本关系抽取任务中,模型需要使用极少数据进行关系抽取。本文针对少样本关系抽取问题,从以下几个方面进行研究:(1)基于类别特征表示的少样本关系抽取方法研究。基于类别特征表示的少样本关系抽取方法有着较快的预测速度和较低的硬件资源占用,有着广阔的应用场景。本文使用与训练模型BERT作为关系实例的编码器,研究了两种类别特征表示方法,分别基于图注意力网络和动态路由机制进行类别特征表示。(2)基于匹配的少样本关系抽取方法研究。针对类别特征表示方法中存在的实例特征表示过程和类别特征表示过程中所存在的特征损失问题,使用查询实例与支持集合中的每个实例进行匹配,得到查询实例与该支持集合的相似度。提出模型BERT+ESIM,并从编码层,句子匹配层,损失函数,对抗训练多个方面进行研究。(3)进一步研究基于匹配的少样本关系抽取方法,提出分段注意力匹配网络,针对关系抽取实例进行模型结构优化,在编码层使用BERT-Sequence并根据实体位置进行分段,针对不同领域验证集段长分布差异问题,使用动态段长进行领域自适应,在句子匹配层,使用分段注意力机制计算句子相似度,能够更准确的计算关系实例间的相似度。分段注意力匹配网络在Few Rel1.0测评中取得了较好效果,在Few Rel2.0测评中取得了目前榜单中的最好效果。
其他文献
随着网络的快速发展,传统网络灵活度低,已经不能够满足当前的需求。近些年来,软件定义网络(Software-defined Network,SDN)受到了广泛关注,并且得到了快速发展。SDN是一种新
二维不规则样件的排样优化是典型的组合优化问题,具有广泛的应用意义。多年来,国内外学者对此问题作了大量研究,针对相关行业需求而开发设计的系统和软件亦出现有效成品。利
近年来基于OA(Open Access开放存取)的信息资源品种数量越来越多,但是我们发现OA信息资源在高校图书馆和一些资源整合平台上存在学科分类简化单一,整合率不完善的状况。导致
近年来,多智能体系统协同控制问题已经成为系统控制领域研究的一个热点,其研究内容主要包括一致性、群集、蜂拥、编队和跟踪等问题,其中多智能体系统的一致性是最为基础和关
铅液流电池由于无膜、单一储存罐、低成本等特点,在维持可靠的清洁能源供应方面具有潜在价值。但是,铅液流电池目前还处于发展研发阶段,存在循环稳定性不足等问题。本论文研究了可溶性铅液流的电解液的电化学性质,探究了铅液流电池生命周期的影响因素,以及阐释了铅液流电池失效机理。主要包含以下三个方面:1、不同浓度的电解液以及添加了不同表面活性剂的电解液的电化学性质当甲基磺酸的浓度为1.00 M时,电导率随铅离子
在过去的三十年中,有机发光器件(OLED)在照明和平板显示器中的应用引起了极大的关注。除了传统的荧光和磷光OLED材料,通过给体和受体之间形成分子间CT激发态(即激基复合物)是一类
随着生活水平的提高,香稻的市场需求量也呈现上升趋势。但目前生产中所使用的香稻品种产量普遍偏低,因此选育优质、高产的香稻品种显得愈发迫切。本研究中,运用咀嚼法、KOH浸泡法与香味代谢物靶标分析法对团队选育的多年生稻PR107的161个品系进行香味性状鉴定,同时利用文献报道的已知香味基因功能分子标记进行检测,并对香味基因Badh2全长测序分析。主要结果如下:1、在利用咀嚼法和KOH浸泡法对PR107品
人体运动主要是通过中枢神经系统(Central Nervous System,CNS)对多骨骼肌肉进行模块化控制以及神经振荡的调节产生的,在该过程中,肌肉的肌电信号(Electromyography,EMG)之间的相互关联关系可以用来反映中枢神经系统的不同控制过程以及肌肉的运动功能状态,其中包括运动过程中多通道肌电信号之间的协同机制与双通道肌电信号之间的耦合关系。为此,将肌电信号引入运动功能定量分
复杂性科学及其复杂性研究,在21世纪之初便引起了国内外的普遍关注,而无标度网络研究是复杂性科学研究的一个重要部分。研究表明,从生物体中的大脑结构到各种新陈代谢网络,从Internet到WWW,从大型电力网络到全球交通网络,现实世界中许许多多的网络都是有小世界现象或无标度网络特征的复杂网络。复杂网络的研究已引起了不同学科的广泛重视,已成为当前富有挑战性的研究课题。在教育技术领域中,被广泛研究的网络教
在阵列信号处理中,信号源的波达方向(direction-of-arrial,DOA)作为一个热门的研究方向在声纳、雷达、通信、医学检测、电子对抗等领域有着广泛应用。传统经典的DOA估计算法