基于匹配与变换的序列到文本的推理与生成技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:angella_dj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
不同序列间语义关系建模是自然语言处理领域的核心问题,在不同的应用场景下,该问题可以被当作文本推理或文本生成。其中文本推理是指给定输入序列和目标序列的情况下,研究如何判断他们之间的语义关系,文本生成则是研究只给定输入序列而目标序列未知的情况下,如何根据输入序列产生目标序列。本文分别以自然语言推理和机器翻译这两个文本推理与生成各自的典型任务作为目标任务,探索推理与生成技术,然后将它们扩展到多模态场景下,研究视频弹幕的匹配与生成。本文进行了如下的具体研究:1.基于深层匹配机制的文本到文本的推理技术研究。本文首先研究文本序列到文本序列的推理任务,现有方法主要使用由循环神经网络作为编码器和浅层注意力机制作为匹配层构成的匹配模型来处理这类任务。循环神经网络编码序列时,可以逐词传递信息,理论上不会受到距离的影响,但是在实践中发现,随着目标序列长度增加,该模型的编码效果会逐渐变差,因而给匹配模型造成了长距离依赖问题,同时浅层注意力机制不足以编码序列之间的复杂语义关系,因而产生了序列间语义交互力度不足的问题。本文以自然语言推理这一典型的文本推理任务为目标,来研究如何缓解上述问题。自然语言推理的目的是判断前提句能否推断出假设句。针对这两个问题,本文提出了基于深层匹配机制的文本到文本的推理模型,该模型通过引入自注意力机制来缓解长距离依赖问题,通过叠加多个匹配单元来实现句对间的多轮信息交互。结果显示本文提出的模型能够稳定的超过基准方法,特别是在较长句对上取得了显著的提升。2.基于多特征融合的多模态到文本的推理技术研究。现实世界很多场景中,信息是以多种模态的形式传递的,因此本文从文本序列间的推理任务扩展到了多模态到文本的推理任务。多模态到文本推理任务的输入涉及多个序列,并且这些序列分属不同的模态,因此如何有效地融合多个不同模态的序列特征是该任务的主要难点。本文以视频弹幕匹配任务为目标,研究多模态特征融合技术,该任务主要研究如何根据目标视频片段从候选弹幕评论集合中挑选出相关的评论。针对该任务,本文提出了一个基于多模态特征的深度匹配模型,该模型采用与Transformer模型类似的结构,利用自注意力机制来编码输入信息。该模型能够同时编码图像、语音和文本特征;为了增强模态间的信息交互,本文设计了多头交叉注意力机制,同时,使用一个由多个匹配单元堆叠而成的匹配层以迭代的方式对不同模态间的交互进行建模。实验结果证明本章提出的多模态匹配网络显著地超过了现有的基准方法。3.基于未来代价机制增强的文本到文本的生成技术研究。序列间语义关系建模的另一类子任务是文本生成任务。现有的研究通常使用序列到序列的模型来处理这类任务,在训练该模型时,首先利用目标序列每个位置上的预测分布计算交叉熵,然后将所有位置上计算得到的交叉熵进行组合得到最终的目标函数。这种机制只能保证在当前步生成的目标词的准确性,而没有考虑到该预测结果的未来代价,即该词对后续目标翻译(比如下一个目标词)预测的影响。本文以机器翻译这一典型的文本到文本生成任务为研究对象,尝试解决上述问题。具体来说,首先使用当前生成的目标词及其上下文信息来学习对应的未来代价表示,然后使用该表示计算一个额外损失项,以此来指导神经翻译模型的训练。此外,本文还提出了一种机制,将当前步学习到的未来代价表示与下一步的上下文表示融合,以帮助下一个目标词的预测。实验结果表明该方法能够显著的提升Transformer模型的翻译性能。4.基于联合学习的多模态到文本的生成与推理技术研究。本文进一步从文本到文本的生成任务扩展到多模态到文本的生成任务,利用视频弹幕生成来研究多模态到文本的生成技术。视频弹幕生成的目的是自动为视频观众提供感兴趣的评论,由于该任务的生成结果具有很强的灵活性,现有工作基于一个好的生成模型能够正确区分有效评论和错误评论的假设,提出使用排序指标来评价该任务。尽管现有的生成模型在该指标上取得了不错的效果,但是与匹配模型相比,还存在很大的差距。为了提升生成模型区分有效和无效评论的能力,本文基于Transformer模型提出了一个联合模型,该模型通过共享生成模型和匹配模型的编码器,能够同时对视频弹幕生成和匹配进行建模。实验结果表明,通过联合学习,生成模型和匹配模型在自动弹幕评论任务上的性能同时得到了显著提升。
其他文献
随着机器人技术的发展,移动机器人正逐步被部署到开放的人类社会环境中,如机场、酒店和医院。传统的机器人运动规划方法主要考虑移动机器人在静态或者稀疏行人场景中工作,没有考虑到行人行为对机器人运动造成的影响。但是,在稠密行人场景中,可行驶空间的减少以及稠密行人的动态行为对移动机器人运动的安全和任务执行的效率造成巨大挑战。移动机器人的运动规划系统的执行过程首先需要检测周围行人位置,然后基于检测的行人位置信
学位
铁路是东北地区近代化的重要载体,而南满铁路作为东北重要的近代建筑遗产群落,在建筑技术方面有着独特性。在中、日、俄三国对东北铁路路权争夺的过程中,满铁逐步控制了整个东北铁路网。在纵向的时间发展顺序中,满铁建筑技术经历了3次更迭。在横向时间发展顺序中,满铁接续了大量其他铁路建筑,出现了建筑技术的转移和交融,不同时期、不同国家修建的建筑毗邻共存,建筑增改建频繁,更迭过程极为复杂,仅从建筑样式上难以区分。
学位
大学生的精神健康问题已不容忽视,主要表现为脑疲劳、注意不集中、反应时间变长、头昏等,甚至会影响情绪和身体健康。大学生往往被理所当然地视为健康群体,从而少有针对大学生群体的专类恢复性环境。大学校园作为大学生日常生活和学习的必要性空间,也应承担健康环境的恢复效用。然而,寒地城市的大学校园在营造恢复性环境时面临着诸多挑战。寒地城市具有独特的气候属性,冬季严寒、可长达半年时间,且缺乏绿色植物景观,严重影响
学位
时态图模式匹配研究可以帮助人们更好地了解数据对象之间的关系变化情况,例如,对象之间关系建立的先后顺序、多个对象之间关系的演化过程、多个对象之间关系的持续状态等等,其在网络异常检测、社交网络分析、蛋白质功能挖掘等方面都有重要的应用。然而,相较于静态图模式匹配研究,时态图模式匹配面临着诸多挑战:(1)计算难度更高,其至少和静态图模式匹配难度相当;(2)处理大规模数据图或者稠密查询模式时需要更多的计算资
学位
高温燃气会对涡轮叶片尤其是直面主流燃气的叶片前缘造成烧蚀损坏,从而影响航空发动机的可靠性以及安全性,因此发展高效的叶片冷却技术,进一步提升叶片前缘的换热能力对航空发动机的发展具有重大的意义。冲击冷却以及气膜冷却技术是叶片前缘中较为主流的冷却方式,而关于冲击冷却的研究主要集中于平板冲击或曲率冲击平均换热方面的变化,针对曲率冲击中流动细节以及换热特性等研究较少。基于以上因素,本文围绕前缘双层壁冲击冷却
学位
<正>【教学目标】1.借助文字,想象场景,从细节中感受慈母情深。体会文中反复出现的词语的表达效果。2.通过朗读和感悟,体会对比、反复手法对塑造人物、表达情感的作用。能联系生活实际,写出自己“鼻子一酸”的经历。3.通过对课文的学习,体会平凡母亲的伟大,激发学生对母亲的理解和热爱。
期刊
中小企业通过创造商业机会、创造就业机会和减轻贫困,在一个国家的社会经济发展中发挥着重要作用。中小企业也是未来各种类公司的基础,尽管开始的时候很规模很小,但它们有成长和扩张的潜力,越来越多的大公司在发展壮大之前都是以中小型企业的形式起步的。具有经济实力的女性是发展的主要催化剂,因为她们通常会将资金再投资于子女的健康、营养、教育、家庭和社区。基于性别歧视的社会在更高的贫困、更低的生活质量、更慢的经济增
学位
成人隐匿性自身免疫性糖尿病(latent autoimmune diabetes in adults,LADA)为成年后起病的自身免疫性糖尿病。2020年8月国际专家小组发布《2020国际专家组共识:成人隐匿性自身免疫性糖尿病的管理》,2021年10月中国专家小组发布《成人隐匿性自身免疫糖尿病诊疗中国专家共识(2021版)》,对LADA的识别、特征、治疗以及个体化管理等内容进行了详细介绍。文章对L
期刊
心电信号(ECG)在心血管疾病(CVD)和反映所有与心跳有关的心脏疾病诊断中起着至关重要的作用。因此,临床医生使用它来表征心脏的性能和健康。根据世界卫生组织的资料,心血管疾病是全球非正常死亡的主要原因之一。在2016年,有1790万人死于心血管疾病(CVD),占全球非正常死亡人数的31%。此外,这些死亡大多数发生在低收入国家,心脏性猝死(SCD)几乎占所有上述CVD死亡人数的一半,其中心律不齐是造
学位
海上风电具有资源丰富、布局集中的特点,当离岸距离很远时,基于模块化多电平换流器的柔性直流输电技术是海上风电并网的理想方案。然而,柔直的解耦特性导致海上风电场不能对电网故障实现主动响应,故障后的不平衡功率将导致严重的直流线路过电压,危及设备安全。因此,风电-柔直的交流故障穿越问题成为主要挑战。在现有的故障穿越技术中,降压控制方法可有效折中技术和经济性,但还存在一些关键问题亟待解决:在设备层面,风电场
学位