论文部分内容阅读
事件提取是一项颇具挑战性的任务,通过从非结构化文本中提取出结构化的事件表示,可以服务于问答系统、信息检索等下游任务。其目标又可以细分成实体识别、事件检测和论元识别三个子任务。早期的事件提取方法主要是针对一到两个子任务进行研究,且通常是管道模型的形式;近两年,端到端的事件提取方法渐渐受到关注。但是现有的端到端方法都存在一些问题,本课题主要关注以下两大技术难点:一是多任务需求的不一致性,即不同子任务所关注的信息尺度是不同的,但是现有的方法里这些子任务都共享一个编码器产生的信息表示,导致特定任务敏感的上下文信息缺失;二是事件元素关联性利用不充分,同一句话可能包含多个事件与论元,不同事件的触发词、同一个事件的多个论元是相互影响、相互制约的,但是现有方法对这种关联关系的建模存在一定的局限性比如时序依赖问题,先确定分类的事件会影响下一个事件的分类,但这种影响却无法反向传递。这类问题导致句子中事件元素之间的关联关系得不到充分的利用。针对上述两个问题,本课题提出了一种基于多尺度信息融合的端到端事件提取框架(Multi-Grained Information Fusion Network for Event Extraction,MGIFN)。框架由融合多尺度特征的动态文本片段编码结构(Multi-Grained Dynamic Span Generator,MDSG),和基于片段排序网络与元素感知注意力的事件提取结构(Span Ranking Network with Elements-Aware Attention,SRNEA)两个部分构成,每个结构处理一个问题。前者着重处理多任务需求的不一致性问题,通过为每个子任务设置专门的文本片段编码结构,对句子、临近、片段内容三种不同尺度的上下文信息进行捕获与融合,在多任务联合的场景下针对性地捕获子任务感兴趣的特征。后者则更加注重探索触发词与实体、触发词与触发词之间关联关系的利用方式,通过注意力机制的多种应用,有效地对上述事件元素之间的关联信息进行建模,提升事件检测与论元识别子任务的效果。本课题使用ACE-2005的英文数据集对模型进行验证,所提出方法在实体识别与事件检测子任务上均可以超过目前最好的效果,在论元识别子任务上也可以与当前最好结果相媲美,证实了所提出端到端事件提取方法的有效性。