论文部分内容阅读
课堂话语是课堂师生信息交互的主要媒介,对课堂话语的分析是总结教学规律和评估教学质量的重要手段。课堂话语作为一种篇章粒度的中文文体,可利用课堂话语中的微观篇章语义来结构化课堂话语,以呈现课堂话语的逻辑,从微观的角度分析课堂教学结构。在当前人工智能与教育深度融合的背景下,面对传统课堂话语分析方法中对时空依赖较高且效率低下的问题,如何利用人工智能技术改进传统课堂话语分析方法,为教学研究提供良好的辅助分析手段成了亟需解决的问题。本文从篇章关系识别的角度出发,通过研究句子间的微观逻辑语义关系,构建课堂话语的篇章结构,实现课堂话语的智能分析。中文篇章关系识别作为自然语言处理领域的一项重要研究,旨在研究句子间的逻辑语义关系。篇章关系根据有无篇章连接词可分为显式篇章关系和隐式篇章关系。隐式篇章关系由于缺乏显式连接词等线索,所以需要抽取论元对之间的深层语义特征来构建篇章逻辑关系,这一过程较为复杂。因此,隐式篇章关系识别成为了当前篇章关系识别中的主要任务。本文针对隐式篇章关系,提出了增强序列与语义表示的隐式篇章关系识别方法,基于篇章关系来构建课堂话语的篇章结构,并应用在课堂话语的分析任务中,取得了良好效果。论文的主要工作和创新点包括以下三个方面。首先,针对现有中文隐式篇章方法中容易忽略字、词粒度上局部序列信息的问题,提出了一种增强序列表示的中文隐式篇章关系识别方法。该方法首先引入Bi-LSTM建模句子序列表示,其次用局部卷积操作来过滤细粒度序列特征,最后将注意力网络的语义编码作为外部记忆反复阅读重要的序列特征,进而生成最终论元表示。在公开数据集上实验表明,该方法优于多个基准模型。其次,由于隐式篇章没有连接词线索,需要挖掘更深层次的语义信息。因此,本文提出了一种增强语义表示的中文隐式篇章关系识别方法。该方法首先引入浅层卷积网络生成一阶张量表示的潜在主题信息,然后基于注意力机制为潜在主题和注意力网络的论元编码分配权重,最后经过特征融合生成语义信息更丰富的论元表示。实验结果表明,本文提出的方法与其他基准模型相比均取得了更好的效果。最后,本文构建了一个课堂话语领域内的篇章关系语料集,并构建了一个课堂话语篇章分析系统。在该系统中,基于课堂话语的篇章语料训练了基于增强序列和语义表示的方法模型,并根据篇章关系结构化课堂话语,更为直观地呈现了教学内容,为教学分析和评价提供了新的方法和视角。本文针对中文隐式篇章关系识别问题,提出了有效的解决办法,取得了良好效果,并将其应用在课堂话语分析领域,为教学评价提供了智能的辅助分析手段。