基于深度学习的文本摘要相关技术研究与应用

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:wytlxj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据时代的到来伴随着信息爆炸的风险,如何快速、准确地从互联网上海量信息中获取所需信息已成为亟待解决的问题。自动文本摘要技术将文本中的核心内容提取出来并生成简洁的描述,是解决信息过载的有效方法。近几年,深度学习的快速发展给自动文本摘要带来新的思路,生成式文本摘要方法应运而生,这种方法生成的文本可读性更强且容易理解。目前,基于深度神经网络的文本摘要方法多采用编码器-解码器结构,编码器生成源文本的语义表示,解码器用于生成连续可读的摘要序列,但这种方法存在生成未登录词、生成序列重复、原始语义表示不充分等问题。
  针对这些问题,本文在基于深度神经网络上的文本摘要方法进行探究,提出一种基于随机集束搜索的序列到序列的摘要生成方法和基于语言模型的摘要生成方法,并将提出的方法在数据集上进行实验,实验结果证实了模型的有效性。
  本文主要工作分成两部分,具体如下:
  (1)设计并实现一种基于增强语义和改进集束搜索的序列到序列摘要生成方法。主要内容包括:一种混合编码结构,通过门限卷积网络来捕获原始文本的近距离上下文信息,得到上下文的语义表示,随后利用双向循环神经网络学习文本的长距离依赖信息和时序信息;一种随机集束搜索算法,该方法在传统集束搜索上引入随机性,使得解码序列的多样性,在每个解码时间步随机集束搜索不再使用top-k采样来选择k个候选项,而是在一个动态置信空间内随机采样k个候选项;一种源文本关键词重排序算法,使用t f-id f加权对源文本序列中的每个单词进行评分,然后结合注意力分布列表来评估候选句的质量,而不是像标准波束搜索那样只选择概率最大的候选序列。
  (2)设计并实现一种基于语言模型的生成式文本摘要方法。该方法抛弃了传统的序列到序列框架,直接将文本摘要任务建模为语言模型问题并探究了这种方式的可行性。主要内容包括:利用Transformer解码器对任务进行建模,并在预训练语言模型GPT上进行微调,之后对Transformer的掩码方式进行改进,并对实验结果进行分析和对比。
其他文献
摘要:桥梁建设项目工程量随着经济的发展而不断增加,保证桥梁建设质量、满足目前社会发展需求是桥梁建设行业的发展目标。传统连续桥梁施工技术在某些方面已经无法满足桥梁建设需求,影响整体建设质量。先简支后结构连续桥梁施工技术的开发和应用,有效提高了施工效率,其在应用过程中优势比较明显,可以提高桥梁结构的整体施质量,也可以缩短施工工期,有效节约了施工成本,提升了整体的经济效益。  关键词:先简支后结构;连续
期刊
摘要:建筑行業快速发展的基础上,路桥工程的建设质量也得到了全面的提升。尤其是对于路桥工程中的路基路面施工技术水平来说,在不断发展的过程中取得了较大的进展,为我国的路桥工程整体质量提供了保障。另外,路桥工程的建设质量还关系到我国区域经济的发展状况。从当前的发展形势来看,路桥工程施工作业中还存在很多问题,对路桥工程的安全运行带来制约影响。文中,在针对路桥工程的路基路面施工作业常见问题进行分析之后,又探
期刊
摘要:工业锅炉是工业生产过程中的重要组成部分,锅炉的安全性能与工业生产效率有着密切的联系,必须要高度重视工业锅炉的运行。水处理作为工业锅炉重要工作环节,一旦发生问题,就会影响到工业锅炉的安全性,从而影响整个工业生产效率。基于此,文章以工业锅炉水处理为研究对象,介绍了我国工业锅炉水处理的工艺流程与运行模式,分析了其中存在的问题,从而提出有效的整改措施,来提高工业锅炉的节能水处理工艺,进而提高工业锅炉
期刊
摘要:在水利工程建设规模不断扩大的基础上,水利工程的施工技术水平也取得了很大的进展。其中表现最为突出的就是围堰技术,在很多工程中,围堰技术的运用均与工程整体质量具有直接联系。为了提升水利工程的整体质量,我们需要对围堰技术的运用进行探讨。同时,对水利施工中围堰技术的施工技术要点进行分析。希望可以有效提升围堰技术的应用效果,为水利工程施工作业提供良好的作业环境,进而保证水利工程的整体建设质量。  关键
期刊
摘要:路桥是当前重要的交通系统,在分担长距离运输任务时发挥了重要的作用。为了使路桥系统可以被更加长久地使用,在初期设计阶段,就应当做好各处关键部位的设计工作。如果想要建设出更高质量的路桥系统,应当选择标准化且合适的设计指导理念。在设计路桥系统时,抗震理念就是比较合适的设计指导理念。本文以路桥设计工作为核心,探讨如何在设计过程中有效应用抗震设计理念。  关键词:抗震理念;路桥设计;设计方法;震害问题
期刊
摘要:低频振动是物体的一种运动形式,低频振动传感器是将被测振动物体的机械速度信号转化成线性的电压信号的一种装置,低频振动传感器一般由检波器、补偿网络和壳体组成,本文主要分析检波器的工作原理,串联校正电路及补偿网络的优化以达到检波器输出信号线性更好的目的。  关键词:传感器;低频;振动;校正电路  Study on Geophone and Compensation Network of Low F
期刊
摘要:道橋工程的安全性与耐久性,分别映射了其自身的质量性能以及经济效益,当道桥工程存在质量性能问题,那么其安全性自然会下降,可能会出现局部坍塌,如果耐久性不足,会在预期期限之内出现质量性能下降的问题,同样影响工程安全性,同时说明该工程的经济转化并没有达到预期,影响了经济效益。本文主要主要对道桥的安全性及耐久性设计进行研究。  关键词:道桥工程;安全性;耐久性  引言  道桥工程是我国交通建设当中重
期刊
摘要:在公路桥梁工程施工中对预应力技术进行使用主要是发挥其受力性能。这对工程安全性、稳定性以及耐久性的提升都有相当重要的作用,同时还可帮助工件实现对自身重量的有效减轻,在节省材料的同时方便安装。我国预应力技术研究处于起步阶段,但是已经形成较为完整的系统。会有不同程度的裂缝现象存在于预应力技术当中,需要我们进行不断的深化与研究,这也是现阶段公路桥梁事业在发展过程中所面对的主要问题。  关键词:公路工
期刊
摘要:本文对电力监控系统的具体特征进行了深入的分析,同时对于通信接口技术的分类进行了相对详尽的分析总结,以便于在电力监控系统当中,选择出更加科学合理的工业设备网通信接口技术。  关键词:具体特征;分析;电力监控系统;工业设备;通信接口  引言:  现场总线技术是目前我国电力监控系统中最为广泛的工业设备通信接口应用,其是中低层设备之间的数据通信技术。现场总线因为拓展性、可靠性都比较高,并且,其运营费
期刊
摘要:在实际分析混凝土路面施工基础的过程当中,我们可从应用方面着手。为实现对公路整体施工质量的提升,我们可对多种方法进行使用,现阶段最为普遍的一种就是科学使用混凝土路面施工技术。这不仅可从根本上实现对整体施工质量的保障,同时也可促使施工效率在原有基础上得到真正意义上的提升,将更为良好的经济效益与社会效益带给施工企业,为人们的出行创造便利条件。  关键词:公路施工;混凝土路面;施工技术  混凝土路面
期刊