基于深度学习的生成式文本摘要关键技术研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:tgw2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据海量化导致关键信息的获取难度与日俱增,因此,如何有效解决数据过载问题、从而让用户高效获取海量文本数据中包含的重要信息成为当今工业和学术界亟需解决的关键难点之一。目前,文本摘要技术是主流文本信息抽取技术之一,其包含抽取和生成式两种方式。深度学习技术快速发展,其在自然语言处理技术的不同研究领域都取得了长足进步,因此也被广大研究学者引入到文本生成研究领域。本文重点研究基于深度学习的生成式文本摘要技术,主要关注基于预训练语言模型的生成式文本摘要,并针对目前方法存在的事实不准确问题进行改进。主要的贡献如下:首先,提出了一种基于多层Transformer的序列到序列生成式文本摘要模型。该模型基于采用注意力机制的Transformer网络,首先将输入文本序列转换为符号嵌入、位置嵌入和段嵌入三种嵌入表示,然后将其输入到预训练BERT模型中进行微调,通过序列到序列的掩码机制控制文本生成过程中可见的信息。该模型利用预训练语言模型在语义理解和语义表示方面的良好表现,有效的将现实知识融入摘要生成过程,与此同时,减少了训练数据的规模。此外,研究了不同解码算法(Top-p、Top-K和集束搜索)对本模型生成结果的影响。其次,提出了一种结合问题生成和问答技术的生成式文本摘要事实准确度评估方法。该方法首先利用问题生成模型从生成式文本摘要结果中生成相应的问题,然后通过问答技术分别对摘要和原文生成答案,最后对比两个答案的相似性,从而获得文本摘要结果的事实准确度。实验结果表明,本文提出的基于预训练语言模型的生成式文本摘要模型生成的文摘效果优于基准模型,本文提出的事实准确度评估方法相对于传统的自动评估方法能够更好的评估文本摘要的事实准确度。
其他文献
近些年来深度学习在不断地发展,它在人脸检测、语音识别等领域都发挥出了重要作用。在现在的大数据时代,越来越多的数据可以被建模成图关系,例如化合物分子、社交网络等。图结构数据中的每个节点都包含其特征与其他节点的联系关系,图神经网络则可以利用这些信息来完成例如节点分类、图分类、链路预测等任务。但现有的应用于图分类任务的图池化模型大多是通过复杂的度量方法来计算节点重要性,但这相应的会导致计算复杂度的提升。
学位
交通事故无时无刻不威胁着人们的生命以及财产安全,特别是近年来,由交通事故造成的损失已经不容忽视。为尽量避免由于行车环境复杂与驾驶员处于非正常行车状态而导致交通事故的产生,基于计算机视觉技术来实现辅助驾驶已经成为一个热点的研究问题,开发安全可靠的车载辅助变道系统和驾驶员状态实时监测系统就有着重要的实用价值。本文主要研究了实时场景车辆变道安全提醒算法设计和驾驶员状态监测算法设计以及它们在嵌入式AI芯片
学位
【目的】本实验拟通过静电纺丝技术制备一种负载碱性成纤维细胞生长因子(b FGF)的胶原-氧化石墨烯纳米纤维电纺膜,给创面提供一个良好的愈合微环境,并观察其促进创面愈合的效果,拟为临床创面愈合提供新思路。【方法】首先通过傅里叶红外光谱、拉曼光谱、扫描电镜(SEM)和拉力测试等材料学检测,来对比不同浓度的胶原(COL)及氧化石墨烯(GO)所制备的纳米纤维电纺膜的理化性能,选择最适合创面愈合的配比;然后
学位
工业互联网当中多节点传感器数据融合是重要发展趋势,但随之而来的问题是数据量的增大与通信带宽的限制之间的矛盾,同时工业检测的实时性要求也难以保障。在数据产生的上游端口对数据进行压缩从而降低通信系统的压力是解决该问题一种行之有效方法。本论文基于实际工程项目中的该问题进行了相关研究,搭建了一个基于嵌入式平台的图像压缩系统,其压缩性能达到预期设计目标。具体工作如下:(1)在对经典无损压缩算法两种主要类型进
学位
医学影像分割是计算机辅助诊疗应用中的关键任务。随着深度学习技术的飞速发展,基于深度学习的医学影像分割方法已经取得了显著的成效。然而,医学影像分割任务中由于数据的获取设备、标准等差异性,来自不同中心、不同设备的影像之间往往存在严重的领域漂移问题,从而导致分割模型在不同域数据上的性能下降。为了解决这一问题,医学影像中无监督域自适应研究逐渐兴起。尽管近期的无监督域自适应工作在医学影像分析领域已经取得了一
学位
随着科技发展,无线通信设备的使用范围越来越广,在为人们生活带来便捷的同时,给无线电监管工作带来了严峻的挑战。信号接收机作为无线电监管设备中的接收前端,其性能对于监测效果至关重要。本文根据实际需求,分析和实现了宽带超外差阵列接收机,主要工作内容包含以下几点:(1)基于接收机的常见结构,针对接收机性能指标要求,选择了一种超外差式结构,作为本文设计和研究的基础。在此基础上,分析了如何实现抗干扰能力较强、
学位
随着遥感卫星技术的不断发展,社会进入了遥感大数据时代。高维数据的存储和检索成为海量遥感数据应用的瓶颈,如何实现对大规模遥感图像的准确、快速搜索,在灾难预警、农业检测、城市规划等遥感应用领域具有重要意义。哈希方法作为一种高效的索引方式,为每幅图像生成较短的二进制序列表示,大幅度地提高了检索效率,同时减少了内存消耗。然而传统的哈希方法依赖人工设计的特征描述符作为哈希编码的输入,人工提取的低层视觉特征难
学位
在天文学研究中,光谱最主要的研究领域之一,多目标光纤光谱仪作为天文光谱测量仪器,是大视场光谱巡天望远镜最重要的科学仪器。多目标光纤光谱仪的光学性能直接决定了大视场光谱巡天能够实现的科学目的。但对于此类用途单一的光学仪器,目前可供参考的光学设计报告很少,且均没有提供初始结构计算,优化约束条件等对于光学系统设计过程十分重要的信息。因此,建立一套包含系统性能指标制定,初始结构搭建,系统优化过程,性能评价
学位
随着移动互联网时代的到来,手机、电子邮件和社交网络应用程序的普及,网络社交已经成为人们日常生活工作中重要得沟通方式之一,尤其是在新冠在全球蔓延的大环境下,人们更加依赖网络在线交流,越来越多地以对话的形式来交换思想、制定计划和共享信息。然而,对于复杂的对话内容,复述和掌握所有核心内容是很费时间的,如何让移动互联网时代保留下来的海量对话数据,更高效的辅佐人们解决日常工作生活中的需求正是本文研究的出发点
学位
近年来,互联网平台累积了海量的文本数据,对其进行分析与挖掘能够有效地帮助人们理解数据中蕴含的语义情感信息,尤其对于金融领域,业内从业者以及投资人通常通过分析和研读企业财报、新闻公告等信息来研判公司的发展状况和行业走向,从而辅助商业决策以及帮助相关部门进行企业监管。因此,本文针对金融领域文本数据特点,重点关注文档级和实体级的情感分析任务,提出了两种不同的模型方法用于解决现有预训练语言模型(BERT)
学位