基于Transformer及语义监督方法的NLP生成式任务研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:lpcumt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然语言处理(NLP)作为人工智能领域的重要分支,其研究的方向十分多。其中生成式任务更是当下的研究热点,因为生成式任务更具挑战性,它主要包括自动文本摘要和机器翻译两个子任务。自动文本摘要即机器从给定的文本中提取整个文本的关键内容。自动文本摘要可以极大地提升人们从海量数据中获取关键信息的效率,除此自动文本摘要还具备为短新闻文本生成标题的用途。当下基于神经网络设计的文本摘要模型都用到了多层编码器,而源文内容经过多层编码器后虽然可以挖掘到深层语义信息,但容易产生语义偏差。机器翻译任务即让机器代替人类完成源语言到目标语言的翻译工作。当下机器翻译研究使用神经机器翻译模型居多。当下多数神经机器翻译模型都是基于Transformer模型进行改进,但是这些模型都没有利用到源语言文本中的关键信息,而对关键信息的翻译是否准确直接决定了最终的翻译质量。本文为解决上述问题,主要完成了以下工作:1.首先,我们针对BERT无法适应文本摘要任务的问题,根据UNILM模型中的思路修改了掩码矩阵,从而让BERT可以完成文本摘要任务。其次,我们为了解决输入经过多层编码后出现的语义偏差问题,提出了一种基于胶囊网络的语义监督方法改善该问题。通过胶囊网络对第一层及最后一层的编码结果进行语义特征聚类,之后再对聚类后的语义特征进行距离监督,从而起到语义监督作用。最后,我们在LCSTS及CNN/Daily Mail数据集上进行了实验。2.我们提出了一种基于Transformer模型融合关键信息的神经机器翻译模型,以改善机器翻译模型对于关键词翻译存在的漏译、错译等问题。我们对当前主流的关键词提取算法进行了对比研究及筛选,最后选择了实际效果最好的Text Rank算法。关键信息的融合我们使用Multi-head attention的方式,并通过阈值控制关键信息对深层编码信息的干扰。为了验证了我们提出的方法的有效性,我们在WMT数据集的中-英和英-德两个数据集上进行了实验。3.为了验证我们所设计的模型的实际应用效果,我们设计实现了一个线上文本摘要系统。该系统基于B/S架构设计,并采用前后分离的方式进行部署实现。该系统包括用户登录注册及文本摘要等主要功能。我们还对整个系统进行了功能性测试及压力测试等。最终实际效果表明我们设计的系统简单易用,且能够提供相对准确的文本摘要服务。
其他文献
随着人们对海洋资源与开发的日益重视,成像声纳不断发展,包含的数据量急剧增加,同时由于水下环境的错综复杂导致声纳图像受到多种不同类型复杂严重的噪声影响,优秀的声纳图像去噪算法计算复杂、耗时长,难以满足应用场合的实时性要求。而GPU具有大量计算单元,在大规模数据计算、处理速度等方面的性能大大超过CPU,表现出巨大的优势和潜力,利用GPU来进行声纳图像去噪并行加速研究,具备良好的可行性和工程应用价值,可
有机硅改性聚氨酯胶粘剂能够结合二者的性能优势,利用有机硅提高聚氨酯的耐水、耐热和耐候等性能。本文综述了聚氨酯胶粘剂的各种类型、有机硅改性聚氨酯胶粘剂的方法和研究进展,包括硅烷偶联剂和硅氧烷低聚物两种改性方法,并对比了不同有机硅改性的优缺点。
近年来,随着信息化时代的飞速推进,各行业涉及到的数据越来越复杂,数据规模也越来越大,比如超清彩图,视频,交通信息,遥感数据等。对于这些高维数据,我们将其称为张量。然而,在张量的采集传输过程中,受到各方面因素的影响,数据丢失问题不可避免。如何从已知数据推测出未知部分的信息对于后续应用至关重要。这个任务我们称之为张量补全。由于现实世界中,大部分数据都是低秩的,这个问题也被称为低秩张量补全。本文主要研究
近年来,围绕飞行器的应用方式越来越丰富,其应用领域更多,任务也更繁杂,单一飞行器已不足以供应所有需求。飞行器集群化可以满足扩张后的作业需求,提供更加复杂的功能服务,集群作业依赖精确及时的导航定位,因此迫切需要研究与设计高性能的集群协同导航系统。目前该技术研究仍在萌芽期,研究大多仅考虑到集群化数量、导航精度、定位成本以及自主性等方面中的一两个,没有给出一个较全面的统一通用的集群协同导航方法和仿真环境
假设一量子系统可能是N个状态之一,如何通过量子力学允许的方法来确定这一系统即为所谓的量子态分辨问题。在许多量子计算和量子信息处理过程中,都需要用到量子态分辨。因此,近年来,量子态分辨得到了广泛的研究。另一方面,量子纠缠在量子计算和量子信息中扮演着重要的角色,可以实现经典计算和经典信息论中不能实现的任务。最近的研究认为量子关联是比量子纠缠更广泛的一种量子非局域性,并且能够作为解释某些量子算法加速的原
粒子物理学标准模型(SM)自20世纪60年代末期建立以来在长达40年的实验检验之下,已被证实是一个极其精确的理论。标准模型描述所有已知基本粒子的相互作用,包括物质粒子(三代夸克和轻子)、传递电弱强三种相互作用的规范玻色子、以及产生所有基本粒子质量的Higgs玻色子。然而标准模型仍然遭受一系列基本的理论疑难(例如,无法描述引力作用、精细调节问题、平庸性问题、真空稳定性问题、太多任意参数问题等等),使
近年来,随着人工智能的高速发展,各种智能应用和设备广泛出现,一些传统的生产生活方式被替代,但随之带来的是人工智能安全问题。造假图像和音频的出现、对抗性样本攻击的出现,都对人工智能系统产生巨大的威胁。可信AI,作为目前被广泛关注的研究热点,通过各种防御和容错技术,使得人工智能系统不再轻易被攻击。本论文针对语音方面的攻击手段提出相应的容错方法,提高语音识别系统的鲁棒性。目前语音攻击方法主要有三种,语音
社会对于智能视觉技术的需求越来越强,也推动了计算机视觉技术的高速发展,高速发展的视觉技术也在反哺社会,新时代的社会发展离不开计算机视觉技术。目标检测是计算机视觉技术的一个分支,其已经应用在工业、医学、交通、安全、军事等各个领域,取得了良好的效果。其能够使社会生活更加便利,能够帮助各行各业处理各种视觉任务,节约成本。当前目标检测领域的研究重点集中在提高目标检测技术的检测精度,检测速度以及更简易的部署
随着无线通信技术和人工智能的发展,基于WiFi的室内人员感知已经成为了炙手可热的研究对象。其中活动识别和手势识别应用广泛。由于WiFi信号具有覆盖范围广、普及性高等优点,且其物理层信道状态信息(CSI)对人们的活动和手势感知较为敏感,适合用于室内的人员感知任务。但是WiFi信号存在不稳定、受环境变化影响大的缺陷,从而制约了无线感知的进一步发展和实际应用。因此本文针对环境对无线信号的影响,从应对环境
互联网技术的发展导致网络视频数量激增,也带来了对更可靠、高效的视频处理技术的巨大需求。其中,行为识别作为视频处理的核心任务,受到了越来越大的关注。行为识别算法的性能关键在于对视频空间信息和运动信息的建模能力,然而,目前的行为识别模型往往难以对具有显著变化的复杂时序结构进行建模,从而导致模型的运动信息建模能力不足。因此,研究行为识别模型中的运动信息建模方案具有重要意义。基于上述原因,本文提出了一个基