基于深度学习的对话行为分类研究与实现

来源 :东南大学 | 被引量 : 0次 | 上传用户:tangbao1006
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对话行为是一种浅层范畴的用户意图,表达出的是用户最直接的行为。对话行为分类作为自然语言理解的基本任务,在对话系统中发挥着重要的作用,其目的是识别出对话内容的对话行为,并辅助做出对话决策。随着人工智能的发展,对话系统慢慢地融入人们的生活,提供智能、便捷的服务。为了改善用户的体验感受、贴合用户的意愿,系统需要提供更加精准的语义理解,因此对话行为分类的研究具有重要的意义和实用价值。据调研发现,基于规则的方法构建成本高、可移植性差,同时基于机器学习的方法依赖复杂的特征工程,而深度学习方法不仅可以避免特征工程,而且能够学习更加复杂的数据分布,因此被广泛应用于对话行为分类的任务。现有工作大多是面向单个对话行为的分类,而对于存在多个对话行为文本的挖掘工作并不多,并且对于由多个子句组成的文本,鲜少考虑子句之间的关联以及句法信息的影响。另外,大多数工作将对话行为分类看做独立的任务,没有考虑其他关联任务的作用。本文在调研对话行为分类相关工作的基础上,同时结合对话行为和任务导向型对话系统的特点,对课题展开研究。本文主要的研究内容分为三个方面:首先,本文提出基于句法和子句信息的分类模型。通过双向长短时记忆网络学习每个单词上下文信息以及图卷积神经网络学习单词句法信息的特征,得到基于单词的语义表示;对于由多个子句组成的文本,每个子句表示一个对话行为,因此利用双向长短时记忆网络学习子句之间的依赖关系,并通过自注意力机制,区分重要的子句信息,得到基于子句的语义表示;将基于单词和子句融合后的向量,作为整句话的语义表示,并由此得到对应的对话行为。最后通过多组对比实验,验证了模型的有效性。其次,本文考虑利用相关任务联合学习的方法,旨在通过关联任务提升对话行为分类任务的泛化能力。本文在借鉴第一个分类模型中对话行为分类部分的思想,提出基于联合学习的分类模型。对话行为表示语义意图,槽位表示语义的限制条件,因此本文认为两者是相互关联任务。模型利用双向长短时记忆网络学习单词的上下文信息和图卷积神经网络学习单词的句法信息,然后经过自注意力机制,得到句子的语义表达。由单词和句子的语义表示,分别输出句子的槽位信息和对话行为。实验部分,通过与多个神经网络分类模型对比,验证了方法的有效性,同时通过分析实验结果,证明了联合学习对于提升模型泛化能力具有积极作用。最后,由于对话行为过程相对抽象化,因此本文基于Python开源的Web框架Django,实现了从输入对话内容到输出对话行为的过程,即后端通过加载本文提出的两个神经网络的预训练模型,对结果进行预测,从而将对话行为分类的流程可视化。
其他文献
在强子物理学中,夸克势模型在描述强子谱方面取得了相当大的成功。然而,2003年Belle实验组在B介子强衰变中发现了奇特强子态X(3872),随之更多的新的高激发态强子被研究者发现,但它们的质量及性质违背了夸克势模型的预言。其中对于X(3872)的内部组分结构究竟是传统的粲偶素,还是分子态,或是两种成分的混合,存在着争议。相关研究认为,X(3872)→χcJπ0的衰变分支比对区分其内部结构有重要意
USB接口因其稳定的传输性能和方便的即插即用模式,被广泛应用于计算机系统中。但是其传输距离较短,使其在工控、安防、医疗等场合的应用受到一定的限制。本文设计了一种应用于USB延长控制芯片中的接口电路方案,应用常见的普通五类双绞线作为传输介质,可以将USB信号传输距离延长至100米以上,突破了USB传输距离小于5米的局限性。本文首先分析了高速信号的远距离传输涉及到的技术难点,分析了高速信号传输过程中失
背景:冠心病属于中医“胸痹”范畴,是由痰浊,瘀血,气滞,寒凝等多种因素引起的心脉闭阻,心之阴阳气血失调的病证,以膻中或左胸部发作性憋闷,疼痛为主要临床表现的一种病证。冠心病的发生危险因素有:性别与年龄(男性45岁以上的,女性55岁以上或者绝经后的),家族史(父母,兄弟,姐妹在55-65岁前死于心脏病),血脂异常,高血压,糖尿病,肥胖,不爱锻炼,吸烟,痛风等。当今社会随着改革开放的进行,人民的生活方
背景:鼻咽癌(nasopharyngeal carcinoma,NPC)是东南亚地区常见的头颈部肿瘤,目前诊断NPC的标准技术是白光显像内镜(white light endoscopy,WLE)引导下活检的组织学分析。近年来,光学增强内镜用来对鼻咽癌进行分析逐渐增多。本研究旨在探讨光学增强内镜(Optical Enhanced endoscopy,0E)1模式(窄带成像)和0E2模式(强光成像)对
大量研究表明适当进行身体锻炼有助于保持身体健康、预防多种慢性疾病、促进身体代谢和生长发育。然而高强度的工作学习压力使得人们往往无暇顾及自己的运动量,看不到明确量化的运动又一定程度上导致人们对运动的积极性不高。因此全天候实时记录识别人体动作具有重要的研究价值和意义。能够利用随时随地产生的无标注数据的无监督学习算法与能够随时随地记录人体运动数据的可穿戴式传感器系统之间的相互结合,在这一领域有着广阔的应
强子的电磁形状因子是强子物理中非常重要的非微扰物理量,它反映了强子的内部结构,所以精确测量强子电磁形状因子几十年来一直是非常热门的课题。实验上,可以通过测量ep散射,e+e→pp,eπ弹性散射和e+e→π+π-等过程的截面来抽取质子和π介子的电磁形状因子。2000年JLab的实验表明采用Rosenbluth方法和极化转移法给出的质子电磁形状因子比值有不可忽略的差异,2003年Blunden等人的研
目的综合评价合并角膜散光的长眼轴患者在白内障超声乳化联合Toric人工晶体(intraocular lens,IOL)植入术后中远期旋转稳定性和主客观视觉质量。为临床上长眼轴合并角膜散光的白内障患者IOL的选择提供理论依据。方法采用回顾性队列研究。选择2016年4月至2018年12月至东部战区总医院接受白内障超声乳化联合Toric IOL植入术的患者,术前规则角膜散光≥0.75D,共55例69眼,
随着移动通信产业的迅速发展和第五代移动通信系统(5G)的逐步应用,移动用户和移动设备的需求不断增长,大规模分布式移动网络作为5G中的关键网络架构,具有更高的宏分集增益和更小的传输距离。其中大规模分布式天线系统(DAS)通过部署更多的远端天线单元(RRU),增加系统容量和频谱效率(SE)。大规模分布式天线系统在带来系统性能提升的同时,还会产生很大的回程消耗和干扰管理问题。本文为了让系统性能便于分析,
图形用户界面随着计算机、通信等技术的发展在各个产业界以及人们的生活中已经被广泛应用,并且帮助人们提升工作效率和改善生活质量,图形用户界面的设计和评价也随之不断被重视。图形用户界面的设计评价要素包括颜色、内容、结构以及布局等,其中元素的布局在设计评价中作用尤为重要。同时,信息技术、人工智能技术的迅猛发展,对界面设计评价提出了更高的要求,也提供了更多潜在的应用方法。因此在本研究中,以界面布局评价为研究
儿童肾病综合征(Nephrotic syndrome,NS)是一种临床常见的儿童肾脏疾病,主要表现为以大量蛋白尿、低白蛋白血症、高脂血症和水肿为主的一组临床症候群,其年发病率为1.15~16.9/100,000,目前有关该病流行病学调查方面的资料国内报道十分有限。NS尚无特异血清学诊断标志物,组织活检是NS诊断和病理分型的“金标准”,但组织活检具有创伤性,且不适用于肾脏状况连续监测。微小核糖核酸(