【摘 要】
:
口语理解是对话系统中的重要组成部分,负责将用户输入的文字信息转换成计算机所能理解的结构化语义信息。在本研究中,主要围绕对话行为识别、意图理解和槽填充三个子任务展开,以双注意力机制为基础解决目前子任务中存在的问题。双注意力机制主要包括两个注意力编码分支结构,通过对双分支进行联合训练获取额外的句子特征,能够有效利用和交换双分支结构中特征信息,提高模型鲁棒性。首先,对话行为识别任务中数据不平衡问题比较突
论文部分内容阅读
口语理解是对话系统中的重要组成部分,负责将用户输入的文字信息转换成计算机所能理解的结构化语义信息。在本研究中,主要围绕对话行为识别、意图理解和槽填充三个子任务展开,以双注意力机制为基础解决目前子任务中存在的问题。双注意力机制主要包括两个注意力编码分支结构,通过对双分支进行联合训练获取额外的句子特征,能够有效利用和交换双分支结构中特征信息,提高模型鲁棒性。首先,对话行为识别任务中数据不平衡问题比较突出,容易造成模型整体效果较好但单类准确率较差的现象。本文针对类不平衡问题,提出了一种基于双注意力机制的分支结构。首先通过语言学的先验知识对行为类别进行二次分类,将原有标签分为一级和最终标签,以一级标签为区分的数据集分布更加地均匀。同时,模型是由两个分支子模型构成,左分支和右分支分别用于预测一级标签与最终标签。双注意力机制可以促使模型产生全局正则化作用,有助于LSTM编码器模型抓取少数对话类型的通用特征,使句子特征表达更加全面,提升少数类的预测准确率。其次,在意图理解和槽填充领域,基于单数据库所建立的模型无法处理跨领域对话中说话者的意图,模型的鲁棒性也较差。因此,本文以双注意力机制为基础结合了多个数据库,并采用对抗训练的方式对跨领域模型进行训练。在本文所提的模型中,不同的注意力分支分别对应着其私有特征空间,该空间内包含其数据库独有的特征,而双分支之间的共享注意力层对应着共享特征空间,包含着所有数据库的通用特征。通过对共享注意力层进行对抗训练,减少共享特征的冗余,避免私有特征对共享空间的干扰,使得该空间中的特征都是通用且共享的。本研究分别在中文语料库CASIA-CASSIL以及ATIS、Snips、MIT等英文数据库上进行实验。实验结果表明,采用双注意力机制的模型可以分别提升不同任务的模型在数据不平衡情况下以及在跨领域对话中的准确率和鲁棒性。同时,实验证明自注意力层能有效捕捉句子中单词之间的依赖关系,并从不同模型分支中分别学到位置权重,对模型效果起着促进作用。
其他文献
由于新冠疫情的爆发,医疗垃圾无害化处理引发高度关注,废塑料是其主要成分,包括25%的聚氯乙烯(PVC)和11%的聚乙烯(PE)等。等离子体气化作为新型危废处理手段,近几年逐渐走进人们视野。处理废塑料时添加生物质成分,有望提高燃气品质,且降低环境风险。但由于原料含有氯,难以避免氯腐蚀问题,对设备运行造成威胁。本文以废塑料PVC和PE模拟医疗垃圾、木屑为原料开展等离子体气化试验研究,结合单因素影响评价
目的观察腹腔镜辅助胃癌根治术在胃癌手术治疗中的应用效果。方法选择2019年7月-2020年2月我院收治的80例胃癌患者随机分成参照组和观察组,每组各40例,对参照组患者进行传统开腹手术,对观察组患者进行腹腔镜辅助胃癌根治术,观察两组患者的手术时长、术中出血量和住院时间。结果观察组患者的手术时长、术中出血量和住院时间均明显优于参照组;观察组患者术后并发症发生率明显低于参照组,差异具有统计学意义(P<
工业过程如皮革鞣制、电镀、印染等工艺排放的废水中含有大量六价铬Cr(VI),不达标排放将对周围生态环境及人体健康造成潜在威胁。而铬具有重要的工业价值,我国铬铁矿储备有限,绝大部分的铬来源依靠进口。因此,开发一种高效去除废水中Cr(VI)的方法并探讨铬资源的回收潜力具有重要意义。本研究以反硝化生物膜系统为对象,采用批式试验考察了不同初始浓度Cr(Ⅵ)、NO3--N、NO2--N对反硝化生物膜系统去除
水是生命之源、生产之要、生态之基,是关系国家安全与发展的重要基础资源,习近平总书记在十九大报告中进一步明确要“实施国家节水行动”,迫切需要将水资源的可持续利用和管理上升为国家战略。虽然我国陆续出台了一系列管控水资源的政策措施,但由于传统水资源理念的认知局限,导致相关管理措施大多集中在行政和财税政策上,而以认证、评价等国际通行的技术手段和市场化机制供给严重不足。因此,国家科技部设置了重点研发项目“重
蓝铁石结晶法作为污水污泥中回收磷资源的有效途径,近年来得到广泛关注。然而回收产物蓝铁石与污泥分离困难,极大地限制了这一方法的实际应用。针对这一问题,本论文探究了四方纤铁矿(Akaganeite,A)、针铁矿(Geothite,G)、赤铁矿(Hematite,H)三种不同铁氧化物铁还原性能的差异。基于铁球表面氧化还原过程,以铁芯小球为基体在其表面原位包覆铁还原效果较优的铁氧化物并生成蓝铁石,最后通过
我国是铬盐的主要生产国家,铬(Cr)污染已成为我国常见的一种土壤污染形式。为解决高浓度Cr(Ⅳ)污染土壤化学修复后的再氧化问题,本研究将多硫化钙还原与生物刺激联用,对高浓度Cr(Ⅳ)污染土壤进行修复,考察了修复过程中土壤p H、Cr(Ⅳ)浓度、Cr的不同形态浓度以及微生物群落多样性的变化,并对修复后土壤的浸出毒性及高锰酸钾氧化后的浸出毒性等进行检测。主要结果如下:(1)多硫化钙与生物刺激联合修复C
木质素储量丰富、来源广泛且廉价易得,在生产、生活中拥有重要的应用价值。通过一定的催化反应,打破木质素原有长链结构,将其高效转化为苯、苯酚等高附加值小分子化学品,一直是生物质能源领域的研讨热点。本论文聚焦于MoS2催化剂,通过添加铌酸助剂改变其物理化学性质以提升其催化性能,考察铌酸修饰二硫化钼催化剂在木质素模型化合物制芳香化合物反应上的加氢脱氧性能。论文工作首先采用一步水热法合成了一系列H4Nb2O
生物酶催化是指以酶为催化剂进行物质合成与转化的绿色催化过程。自然界存在多种涉及二氧化碳(CO2)转化的生物酶,可在温和条件下实现碳氧双键的精准活化,为碳资源高效利用提供了一条理想途径。应用过程中,固定化酶常常作为一种提升酶稳定性的策略,但固定化酶载体往往会导致催化过程内、外扩散阻力增加,酶表观活力下降。本论文通过耦合MOFs固定化酶策略与Pickering乳化技术,构建了基于CA@ZIFs的Pic
三氯生(Triclosan,TCS)广泛存在于水体和土壤环境中难以去除,并对人类健康和生态环境造成了长期的危害。植物作为环境中的重要生物介质,影响着TCS的环境行为与归趋模式,TCS对植物的生态毒理效应也越来越成为抗逆研究的热门领域。植物内源信号分子水杨酸(Salicylic acid,SA)广泛参与植物对各种生物和非生物胁迫的抗逆反应,能通过水杨酸羧基甲基转移酶(Salicylic acid c