数据驱动的浅层篇章结构分析研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:feng_zj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
浅层篇章结构分析任务是通过分析自然语言句子之间的逻辑语义关系,例如并列关系、递进关系、转折关系、因果关系等最终获取文章的浅层篇章结构。浅层篇章结构分析的结果可以广泛的应用于自然语言处理任务中,例如机器翻译、自动文档摘要、问答系统等。目前浅层篇章结构分析可以划分出多个子任务,如篇章连接词的识别、浅层篇章结构关系相关的论元对识别(细分为论元1句子定位和论元对词语识别)、浅层篇章结构显式关系分类、浅层篇章结构隐式关系分类,本文在前人工作的基础上进行了一系列尝试和改进。本文的工作内容如下:(1)基于传统离散特征的浅层篇章结构分析系统:我们总结了前人在浅层篇章结构分析工作上的经验,精心的设计了一个完整的基于传统离散特征的浅层篇章结构分析系统,我们在充分借鉴了前人的工作的基础下,针对论元1句子定位子任务提出了基于窗口的有约束序列标注方法,定位论元1在篇章中的具体位置,结合了有效的特征,提高了整个论元对识别任务的准确率。(2)基于神经网络的浅层篇章结构隐式关系分类:浅层篇章结构隐式关系分类任务是目前浅层篇章结构分析工作中的难点。不同于显式关系分类任务,隐式关系缺乏显式连接词来作为两个论元之间所蕴含的逻辑语义关系的有效的指导信息,因此隐式关系分类只能通过两个无连接词的论元发掘其中蕴含的逻辑语义关系。借鉴前人提出的基于深度学习的浅层篇章结构隐式关系分类方法,本文尝试并实现了基于神经网络并结合自注意力机制的方法处理浅层篇章结构隐式关系分类任务。(3)基于句法信息的浅层篇章结构隐式关系分类:考虑到只使用自然语言文本不足以提供充分的输入信息的情况,本文提出了结合自动句法信息的方式增强模型的输入,为模型提供更充分的额外信息量,使得模型的性能得到了进一步的提升。本文基于传统机器学习方法和深度学习方法,尝试提高浅层篇章结构分析系统和隐式关系分类任务的性能,并取得了一些初步效果。我们期待这些研究成果未来可以被应用到其他自然语言处理任务中。
其他文献
安全文化是煤炭企业安全工作的灵魂,是企业安全工作的经验总结,是将安全由感性认识上升到了理性认识,是实现安全长治久安的强有力支撑.实施安全文化工程,坚持"以人为本、用文
会计师事务所是由注册会计师组成的社会中介组织,是在社会主义市场经济中涌现的新兴行业,它通过为市场经济提供服务,维护市场经济秩序,促进社会生产力发展.它通过审计、咨询
我市性病门诊自1998~2001年,对收治的62例生殖器溃疡或糜烂患者同时进行三种方法的血清学检测,即甲苯胺红不加热血清试验(TRUST)、梅毒螺旋体血凝试验(TPHA)和梅毒螺旋体颗粒
随着煤炭资源的日益减少直至枯竭,煤炭企业转产发展非煤产业、多业并举成为生存和发展的当务之急.淄博矿业集团作为一个有着上百年开采历史的老矿区,在老区转产、发展非煤产
我院地处交通要道,繁忙的交通使得车祸事故频发。2007年我院加入绍兴市急救中心,全年收治车祸伤员1490例,对院前急救护理积累了一些经验。现介绍如下:
随着卫星定位技术的日益普及,卫星导航定位系统已经成为当今定位的主要方式。美国GPS、俄罗斯GLONASS和正在建设中的欧盟的GALILEO系统及我国的第二代北斗卫星导航系统(Compa
不动点理论及其应用是非线性泛函分析中一个非常重要的研究课题.本文在一致凸Banach空间中,讨论了具有平均误差项的混合型迭代序列的强弱收敛定理以及具有误差项的两有限族渐
一、总体发展思路立足开滦集团物流产业基础,以改革为动力,以发展为目标,促进开滦集团现代物流产业的快速成长.在集团公司导入供应链理念,实施供应链管理.在对企业物流资源进