【摘 要】
:
将同一个场景下的不同模态传感器得到的图像进行融合,得到一张包含多源信息的融合图像,此类任务称为图像融合任务。其中红外图像与可见光图像融合是一个重要的课题。红外图像可以根据热辐射的差异将目标与背景区分开来,在白天或者黑夜的所有时间和各种天气条件下,红外图像都能很好地发挥作用。相反,可见光图像可以以与人类视觉系统一致的方式提供具有高空间分辨率和清晰度的纹理细节。图像融合领域如今已经有了大量成熟的方法,
论文部分内容阅读
将同一个场景下的不同模态传感器得到的图像进行融合,得到一张包含多源信息的融合图像,此类任务称为图像融合任务。其中红外图像与可见光图像融合是一个重要的课题。红外图像可以根据热辐射的差异将目标与背景区分开来,在白天或者黑夜的所有时间和各种天气条件下,红外图像都能很好地发挥作用。相反,可见光图像可以以与人类视觉系统一致的方式提供具有高空间分辨率和清晰度的纹理细节。图像融合领域如今已经有了大量成熟的方法,大体分为两类。其中一种是利用深度学习一步生成融合图像的方法,算法输入红外图像和可见光图像,让网络自行学习拟合所需的融合图像。还有一种是利用传统方法或者深度网络对图像进行特征分解,转换到特定的特征空间并进行融合,最后将其转换为原始图像空间得到融合图像。利用传统方法进行图像融合通常需要严谨地设计算法,且一般来说融合过程会比较耗时。而利用深度学习的图像融合方法出现的较晚,大多数方法没有考虑图像的特征以及缺少合理的网络结构设计。基于此,受深度学习的一步图像融合的启发,提出了基于感知的生成对抗图像融合网络。同时对于图像特征提取方式的分析和思考,提出了增强特征的自编码器结构。最后基于图像融合的通用分解步骤,提出了两种基于深度学习的图像分解通用网络框架。本文的主要贡献如下:(1)提出了一种基于密集块和生成对抗网络的新方法,并将输入图像之一的可见光图像直接插入到生成器网络的每一层中。使用与感知更一致的结构相似性和梯度损失函数,而不是均方误差损失。经过生成器和判别器之间的对抗训练后,最终获得了训练有素的端到端融合网络即生成器网络。实验表明,所提出的方法获得的融合图像在多个评估指标的基础上取得了不错的成绩。此外,所提出的融合图像在多组对比中具有更好的视觉效果,这更符合人类的视觉感知。(2)提出了一种新的融合红外图像和可见光图像的图像融合方法。骨干网络是一个自编码器。与一般的自编码器不同,所提出的方法增强了编码器的信息提取能力,并优化了其在解码器中选择最有效通道的能力。具体融合算法首先在编码过程中提取源图像的特征。然后,设计了一种新的有效融合策略来融合这些特征。最后,融合图像由解码器重建。与现有的融合方法相比,该算法在客观评估和视觉质量上均达到了最新水平。(3)通过为深度学习模型设计新的结构和新的损失函数,提出了一种新的图像融合方法。骨干网络是自编码器,其中编码器具有双重分支结构。将红外图像和可见光图像输入到编码器,以分别提取细节信息和语义信息。融合层将两组特征融合在一起以得到融合特征。解码器重建融合特征以获得融合图像。同时设计了一个新的损失函数来有效地重建图像。实验表明,提出的方法达到了最先进的性能。(4)图像分解是图像处理领域中的主要课题,它可以从源图像中提取显着特征。立足于图像分解提出了一种基于卷积神经网络的图像分解新方法。该方法可以应用于许多图像处理任务。所提出的方法将图像分解网络应用于图像融合任务。算法的输入为红外图像和可见光图像,将它们各自分解为三个高频特征图像和一个低频特征图像。使用特定的融合策略融合两组特征图像,以获得融合特征图像。最后,重建特征图像以获得融合图像。与最新的融合方法相比,该方法在主观和客观评估方面均具有更好的性能。(5)现有的视觉转换器模型旨在为诸如分类和检测之类的高级视觉任务提取语义信息,从而使输入图像的空间分辨率降低,无法重构输入或生成高分辨率图像的能力。为解决上述问题,提出了金字塔分块转换器模型Patch Pyramid Transformer(PPT)。具体而言,首先设计了一个Patch Transformer分块转换器,将图像转换为一系列块,然后对每个块执行Transformer转换器编码以提取局部特征表示。此外,所提出的方法构造了一个Pyramid Transformer金字塔转换器,以有效地从整个图像中提取全局特征信息。在获得原始图像的一组多尺度、多维和多角度特征之后,设计了图像重建网络,以确保可以将特征重建映射为输入图像。为了验证有效性,将提出的PPT应用于图像融合任务。实验结果证明了其相对于最新融合方法,在多个评估指标上均获得了最佳结果。
其他文献
控制器的性能优劣不仅决定控制系统能否达到期望目标,而且也直接影响整个工业过程的稳定与安全。当前,各类工业企业的计算机控制系统逐步完善,这给存储大量控制系统运行数据提供了条件。这些数据中包含着与设备特征、过程动态、系统工况以及控制器性能等相关的各类信息。如何充分利用这些数据,实现对在运行控制器的性能优化一直是过程控制领域的研究热点之一。课题针对实际中应用最广泛的PID控制器,研究基于数据驱动的不同结
高通量技术的发展使得生物数据呈指数级增长,生物数据的分析需求也随之日益增长。生物数据通过构建网络,根据网络结构对网络进行搜索、比对和聚类能够发掘网络中的隐藏信息,这对于生命科学的研究具有重要意义。蛋白质作为一切生命的物质基础,参与了生命过程的各个环节,分析不同物种的蛋白质相互作用网络,对于理解蛋白质功能、物种进化关系和疾病机理等具有重要意义。虽然目前蛋白质相互作用网络可用于许多物种,但许多物种中的
面对日益严峻的生态危机和环境挑战,生态环境损害民事法律责任作为环境法律责任体系的重要组成部分,其建立和完善对于我国加快生态文明体制改革、解决生态环境难题具有重要意义。经相关概念辨析,生态环境损害民事法律责任是针对行为人造成的生态环境自身损害所应当承担的以民事法律责任形式呈现的不利负担,其理论基础包括公共信托理论、污染者付费原则等。基于环境侵权制度难以适用、行政执法救济效果不佳、刑事责任难以实现生态
随着世界贸易自由化程度的加深,各国为了在贸易市场中占据一席之地,往往为了经济的发展而牺牲环境利益。目前,面对贸易中的环境纠纷,WTO协议和多边环境协定显得软弱无力,自贸协定因其设立的实质性环保条款以及环境争端解决程序取得处理贸易与环境纠纷的优势。通过对我国自贸协定中的环保条款的梳理以及对我国和域外自贸协定中环保条款的比较研究发现,我国自贸协定中实体性的环保条款存在着内容措辞模糊,条款分布零散以及具
随着人工智能技术不断发展,传统的医疗卫生体系与人工智能技术的融合,形成现在深入人心的智慧医疗。智慧医疗具有快速准确的诊断病情特点,在诊疗类似癫痫病这种常见的脑病疾病的中发挥着重要的作用。癫痫病是由于患者大脑的异常放电所引起的,在患者的脑电信号图中表现为出现尖波、慢波、棘波、等多种癫痫病的特征波形。智慧医疗利用信号识别以及机器学习等先进技术对受试者脑电信号中所反馈的生物信息进行识别分析,并给出诊断结
非婚同居现象在我国已经显露出不断攀升的发展趋势,非婚同居人数的增长,同居关系持续时间的增加,使得非婚同居者渐渐成为了一个新兴的群体。我国传统道德观念认为,家庭法中唯一合法存在的两性结合形式是婚姻,其他结合形式都是不符合家庭本质的,但随着两性关系的多元化,家庭结合形式的多样化,不管从法理的角度还是社会实践的角度,非婚同居关系都被证实是符合时代发展趋势,具有构建制度的正当性基础。我国家庭伦理道德的转变
随着数字化技术的飞速发展,生活方式和教育理念正在发生转变。许多国家、地区和国际组织迫切的需要21世纪人才,纷纷致力于人才的培养,并提出了不同的21世纪能力框架,其中,协作能力是所有框架中都提到的21世纪人才所必备的能力之一。协作学习作为以学为主的学习形式的典型代表,被认为是一种有利于培养学生高级认知目标和协作能力的新型教学模式,受到了越来越多研究者和学者的持续关注。如今,有关协作学习的研究已经日臻
随着深度学习的高速发展,越来越多的跨领域学科正在相互结合以便更有效的解决存在的问题,利用深度学习方法的医学影像技术在医学诊断中有着不可或缺的作用。其中医学图像分割作为医学影像技术的一个重要研究方向,对病理分析、临床诊断和后期手术方案的制订起着重要意义。其中人体腹部CT影像是腹部器官疾病的诊断依据,而肝脏作为腹部最大的器官,对人类的生命健康起了至关重要的作用,肝脏功能的异常与很多疾病有着密切的联系,
近年来,“平面设计”的命名变更为“视觉传达设计”,意味着学科的发展不局限于视觉的形式和承载的媒介,转向更注重传达本身。这是由于在信息爆炸时代下信息传播的渠道和方式发生了变化,传统视觉识别已经逐渐难以满足大众的生理和心理需求。这需要设计师积极探索新的视觉识别形式,而科学技术的进步也为视觉识别设计的革新制造了机会,将其推向了创新驱动、技术助力的新局面。生成艺术是通过计算机代码生成艺术作品的创作形式,它
特定目标情感分类是自然语言处理的重要研究方向之一,其旨在准确判别句子中目标实体的情感极性,由于目标实体的情感极性依赖于句子上下文语境中某些表达目标情感的情感特征词,通过挖掘目标实体与句子上下文的语义情感联系,从而找到与目标实体相关的情感特征词;虽然特定目标情感分类模型在过去的几十年研究中已经有了极大的发展,但仍存在无法充分挖掘目标实体与情感特征词的关联,以及准确判别包含多个目标的句子中的目标情感极