基于平行推理机制的隐式篇章关系检测研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:m237912904
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
篇章关系分析是自然语言处理的一个核心问题。在篇章研究领域中,篇章是指一系列连续子句、句子或语段构成的语言整体;而篇章关系是指同一篇章中,不同论元之间的语义逻辑关系(如因果关系、转折关系等)。其中,论元是一种具有完整语义并表述独立观点的文字片段。篇章关系分析任务即是对两个不同论元(也称一组论元对)之间的具体篇章关系类型进行识别与判定。根据论元之间是否存在显式连接词(也称作线索词,如“因为”、“但是”等),可将篇章关系分为显式关系和隐式关系,相应的论元即被称为显式论元与隐式论元。现有研究对显式关系分析已具有较好的推理效果,而对缺失连接词的隐式关系尚无法有效处理。本文针对两个毗邻且隐式相关的论元,提出了一种基于平行推理机制的隐式篇章关系检测方法。核心思想是根据“论元语义平行,则论元关系平行”的理论假设,即某显式论元对与隐式论元对在句子结构以及语义层面上均相近,也就是说语义平行,则这两个论元对的语义连接关系应相同,并借助信息检索技术,从大规模数据集中挖掘平行的语义论元集合及其论元关系的显式线索,从而建立无指导的隐式篇章关系检测系统。主要研究内容包括以下三个方面:1)检索驱动的隐式关系平行推理机制借助大规模Web信息,实现平行论元的自动挖掘和平行关系的自主推理。一方面,在挖掘平行论元过程中,重点依赖信息检索技术,通过构建高质量查询关键词,从搜索引擎中挖掘语义表述相近的平行论元及线索;另一方面,构建三种篇章关系推理模型,从各方面对挖掘出的平行论元及语义线索进行质量评估,最终选择质量最优的N个平行论元,借助高质量平行论元中语义线索与篇章关系的映射体系实现隐式篇章关系推理。2)平行推理中歧义线索消歧在基于平行推理机制实现隐式篇章关系检测任务中,推理线索存在两方面的歧义:(1)线索连接词本身的一词多义现象;(2)混淆连接关系的伪线索词存在。两类歧义都将影响最终隐式篇章关系检测性能。因此,本文从基于局部最优的连接词词义消歧以及基于潜在连接词识别的伪连接词过滤两个方面,对平行推理过程中的歧义线索进行消歧,以提高隐式篇章关系检测性能。3)基于双语协作的平行推理优化在检索驱动挖掘平行论元及语义线索的过程中,由于部分隐式论元的词汇信息有限或搜索引擎检索性能限制,导致挖掘的平行论元数量少甚至为零,不利于平行论元与隐式论元之间平行关系的正确推理。因此,本文尝试通过跨语言信息检索技术,从搜索引擎中挖掘另一种语言的平行论元及推理线索,以此来扩充平行资源,使得平行关系推理依据更充分更丰富,从而进一步优化隐式篇章关系检测。
其他文献
互联网技术的高速发展使得在线购物得到极大普及,国内以淘宝、京东为代表的各类电子商务网站发展尤为迅猛。在线商品交易需要在网页中对商品属性信息进行尽可能详细的展示,这使
近年来随着各类信息的日益增多,人们对信息处理的需求促进了自然语言处理技术的空前发展。与此同时,人们对如何在海量的信息中及时找出有价值的信息越来越关注,语句压缩作为自然
随着计算机硬件、云计算和大数据等相关技术近年来的大力发展,数据安全已经成为广大计算机、互联网络用户的一个不可缺少的需求。人们无时无刻不与安全打交道。而随着互联网络
突触是神经元之间以及神经元与非神经细胞之间相互连接并进行信息传递的部位,也是人工神经网络中模拟的关键,而传统突触的模拟采用的是集成电路以及超大规模的集成电路,随着电路
在图像处理中,图像分割、特征提取和目标识别构成了由低层到高层的三大任务,目标识别与特征提取都以图像分割作为基础,图像分割的好坏直接影响着后续的特征提取和目标识别。阈值
随着网络的不断发展和应用的普及,人们对网络的依赖越来越多,网上聊天、休闲娱乐、电子购物等随处可见。在网络应用的进行中,其中产生了大量的数据。而流量日志数据就是其中的一
计算机网络的日益发展,促使信息安全技术得到了众多学者关注,并成为一个热点问题。针对信息安全的攻击方式和复杂性日新月异,研究开发出更多安全、高效、可靠的信息安全技术迫在
粗糙集理论作为一种处理不精确、不完全和不确定数据的有效数学方法,在许多领域得到了成功地应用,已发展成为一种重要的智能信息处理技术。由于对不精确路径的研究较少,但是实际
复杂场景下行为分析,尤其是稀少行为分析是目前计算机视觉研究领域的基础性课题,由于在该领域研究中需要融合模式识别、人工智能、图像处理等多领域知识,如何有效进行融合,并针对
基于内容的图像检索技术是智能化信息搜索领域研究的重点之一,同时也是图像处理和人工智能相结合的产物,其对数字化信息时代的发展,乃至人们生活方式的改变都起着积极的促进作用