基于框架语义的汉语篇章连贯性研究

来源 :山西大学 | 被引量 : 3次 | 上传用户:lee6688
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关于汉语篇章连贯性的理论和技术研究是篇章分析领域的一个重要研究课题。从语言学角度看,篇章连贯性是指篇章按照篇章关系,将篇章中所表达的各种概念关联组织起来形成一个完整的结构,从而来表达篇章的语义。从计算机的计算可操作性角度看,为了获得篇章所表达的语义,我们需要研究一种描述体系来表示篇章的连贯性,并在此基础上进行相关技术研究。针对篇章连贯性的表示问题,本文基于汉语框架语义构建了篇章连贯性描述体系。同时,为了进一步展开篇章连贯性的相关技术研究,本文建设了相应的汉语篇章语料库。依据此描述体系,针对汉语篇章连贯性分析的技术研究主要包括三个子任务:篇章单元切割、篇章结构生成以及篇章关系识别。本文在自建的语料库上,对这三个任务的自动分析技术进行了初步的句子级探索。本文主要研究内容和研究成果如下:(1)针对篇章连贯性的表示问题,本文基于汉语框架语义,建立了方便计算机实现的框架篇章连贯性描述体系。该描述体系将连贯这个篇章语言学中的问题转化为一个可计算的篇章框架语义结构树分析问题,为篇章连贯提供了合适的表示机制和计算基础。(2)针对汉语篇章语料库不足,无法进行篇章连贯性技术研究的问题,本文依据描述体系建设了一个包含496篇篇章的汉语篇章框架语料库,并进行了人工一致性检验。该语料库的建设不仅弥补了汉语篇章语料库不足的问题,也为汉语篇章连贯性分析研究任务提供了资源支撑。(3)针对篇章单元切割问题,本文结合汉语标点符号与汉语框架语义的特点制定了一系列规则,实现了篇章单元的三层级切割。实验证明,框架语义可以有效切割篇章单元。(4)针对篇章结构生成问题,本文通过抽取依存句法、短语结构、目标词、框架等特征,首先训练篇章关系存在性最大熵分类模型,然后采用贪婪算法自下向上生成篇章结构树。实验结果证明,对于篇章结构生成任务,框架特征可以有效提升该任务的准确率。(5)针对篇章关系识别问题,本文通过抽取句首、依存句法、短语结构、目标词、框架等特征,训练了基于最大熵的篇章关系分类器。实验结果证明,对于篇章关系识别任务,框架特征可以有效提升该任务的准确率。本文针对汉语篇章连贯性研究,提出了基于框架语义的汉语篇章连贯性描述体系,并且在自建的汉语篇章框架语料库上对篇章的连贯性分析研究任务进行了实验,实验结果证明了框架语义在解决篇章连贯性问题上具有较好的作用,不仅可以从形式上表示篇章的连贯性,并且可以有效提高篇章连贯性三个任务的正确率。本文关于篇章连贯性研究的展开为篇章分析领域提供了一种新的篇章连贯性描述体系以及研究方法,同时也为自然语言处理其它研究领域提供了强有力的支持。
其他文献
厌氧氨氧化菌(Anammox)生长缓慢,生长率低,倍增时间长,导致其富集慢、反应器启动耗时长,成为厌氧氨氧化工程化应用的限制性因素。因此,明确厌氧氨氧化反应器的启动过程与特性
随着新课程改革的日益深入,翻转课堂教学模式逐渐被认可并在教学中大规模实施。如何评价一节好的翻转课堂显得尤为重要。本研究主要围绕中学数学翻转课堂而展开,试图建构完整
以水培大豆为试材,研究了模拟增强紫外辐射UV-B(280-320nm)对大豆幼苗叶片GS、GOGAT、GDH酶活性以及谷氨酸、谷氨酰胺和总游离氨基酸含量的影响,并研究了La(Ⅲ)对UV-B辐射伤害大豆
关注高职学生学习主动性是近年来高职院校为促进学生综合能力发展的一个共同趋势,对于打破高职院校不受重视的传统观念、提升学生整体素质具有积极意义。高职学生学习主动性
采用水生生物斑马鱼(Danio rerio)、鲤鱼(Cyprinus carpio)和土壤生物赤子爱胜蚓(Eisenia foetida)作为生物材料,通过斑马鱼急性毒性试验、斑马鱼胚胎发育试验、鲤鱼。肾细胞单细胞
采用氧乙炔火焰喷焊技术,在正火态45钢基体表面用镍包WC粉制备WC颗粒增强镍基喷焊涂层,采用SEM、XRD分析了涂层的显微组织和物相组成,讨论了WC含量对镍基喷焊涂层硬度、耐磨