基于多尺度信息融合的端到端事件提取方法的研究与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:alkjhgfdsa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
事件提取是一项颇具挑战性的任务,通过从非结构化文本中提取出结构化的事件表示,可以服务于问答系统、信息检索等下游任务。其目标又可以细分成实体识别、事件检测和论元识别三个子任务。早期的事件提取方法主要是针对一到两个子任务进行研究,且通常是管道模型的形式;近两年,端到端的事件提取方法渐渐受到关注。但是现有的端到端方法都存在一些问题,本课题主要关注以下两大技术难点:一是多任务需求的不一致性,即不同子任务所关注的信息尺度是不同的,但是现有的方法里这些子任务都共享一个编码器产生的信息表示,导致特定任务敏感的上下文信息缺失;二是事件元素关联性利用不充分,同一句话可能包含多个事件与论元,不同事件的触发词、同一个事件的多个论元是相互影响、相互制约的,但是现有方法对这种关联关系的建模存在一定的局限性比如时序依赖问题,先确定分类的事件会影响下一个事件的分类,但这种影响却无法反向传递。这类问题导致句子中事件元素之间的关联关系得不到充分的利用。针对上述两个问题,本课题提出了一种基于多尺度信息融合的端到端事件提取框架(Multi-Grained Information Fusion Network for Event Extraction,MGIFN)。框架由融合多尺度特征的动态文本片段编码结构(Multi-Grained Dynamic Span Generator,MDSG),和基于片段排序网络与元素感知注意力的事件提取结构(Span Ranking Network with Elements-Aware Attention,SRNEA)两个部分构成,每个结构处理一个问题。前者着重处理多任务需求的不一致性问题,通过为每个子任务设置专门的文本片段编码结构,对句子、临近、片段内容三种不同尺度的上下文信息进行捕获与融合,在多任务联合的场景下针对性地捕获子任务感兴趣的特征。后者则更加注重探索触发词与实体、触发词与触发词之间关联关系的利用方式,通过注意力机制的多种应用,有效地对上述事件元素之间的关联信息进行建模,提升事件检测与论元识别子任务的效果。本课题使用ACE-2005的英文数据集对模型进行验证,所提出方法在实体识别与事件检测子任务上均可以超过目前最好的效果,在论元识别子任务上也可以与当前最好结果相媲美,证实了所提出端到端事件提取方法的有效性。
其他文献
TC-OFDM系统是广域高精度无线网络定位系统,能够在室内和室外环境中提供无缝高精度位置服务。TC-OFDM有线室分系统和无线室分系统负责在室内环境中播发定位信号。为了方便布设和维护,通常使用无线室分系统布设大型场馆。TC-OFDM系统要求信号源之间保持高精度的时间同步,而无线室分系统中信号源之间没有直接的物理连接,因此,必须为无线室分系统提供时间同步服务。本文针对无线室分系统的时间同步需求进行了
文本情感分析是自然语言理解的重要研究方向之一。对话情感分析是文本情感分析的新兴研究领域,指在多轮对话的上下文中,分析每一句对话的情感。该研究可以更好的帮助机器理解现实世界交流,推动如数据挖掘、人机交互等多个领域的发展。文本的情感分析领域已经有了很多出色的研究成果,但是在对话情感分析领域,仍然有很多问题有待解决。本文主要针对以下几点问题进行研究探索:1)相同的对话文本在不同的上下文中会传达不同的情感
随着移动物联网新应用的蓬勃发展,移动设备有限的存储和计算能力与应用程序激增的计算需求之间的冲突日益明显,移动边缘计算(MEC)已成为解决该问题的有效技术之一。并且,将MEC与网络虚拟化技术结合,可以进一步提升服务的灵活性和经济性。然而,现有面向虚拟网络功能(VNF)的映射和迁移方案中,大多采用被动服务方式,难以即时响应用户的服务需求和应对故障导致的资源变化。因此,基于对业务需求和资源状态的预测,研
快速响应码(Quick Response Code,QR Code)又称 QR 码,是当前使用较为广泛的一种二维码。作为移动互联网时代重要的工具,QR码在给人们生活带来便利的同时也产生了许多安全隐患,比如有不法分子仿冒、篡改二维码来实施诈骗、植入恶意病毒攻击手机,对公众的财产和信息安全造成很大威胁。为了保证QR码安全,防范虚假欺骗行为,本文对基于信息隐藏的QR码进行研究,主要研究内容如下:针对有徽