【摘 要】
:
图像融合是将多个传感器在同一场景下捕获的包含不同信息的图像整合成一幅新的高质量融合图像。相比于原始图像,融合图像具有更丰富的信息,可以在军事,环境监测,数码摄影和医学诊断等领域发挥更大的作用。图像融合算法根据不同的融合策略可以分为基于空间域的图像融合算法,基于变换域的图像融合算法和基于深度学习的图像融合算法。基于空间域的图像融合算法首先将输入图像分解为小块或根据某种标准划分的区域,然后计算对应区域
论文部分内容阅读
图像融合是将多个传感器在同一场景下捕获的包含不同信息的图像整合成一幅新的高质量融合图像。相比于原始图像,融合图像具有更丰富的信息,可以在军事,环境监测,数码摄影和医学诊断等领域发挥更大的作用。图像融合算法根据不同的融合策略可以分为基于空间域的图像融合算法,基于变换域的图像融合算法和基于深度学习的图像融合算法。基于空间域的图像融合算法首先将输入图像分解为小块或根据某种标准划分的区域,然后计算对应区域的显著度,最后将匹配程度最大的区域合并形成融合图像。基于变换域的图像融合算法通过多尺度几何分解将源图像变换到一些特征域,然后对多个输入图像的特征进行融合并逆变换生成融合图像。相比于传统方法,卷积神经网络具有更好的特征提取能力和更好的鲁棒性。因此,基于图像对中存在着共享的公有特征和特定的私有特征认知,研究网络对图像特征的分离表示学习并设计相应的融合规则可以提升融合效果,得到信息丰富,细节清晰的融合图像。本文的主要研究内容如下:(1)自编码网络作为无监督学习的模型,减少了手工制作和标注数据集的烦恼,同时自编码网络对信息特征的编码解码能力使得在图像融合领域,越来越多的人使用卷积自编码网络框架对图像进行特征提取,手工设计相应的融合规则并重构这些特征以得到最后的融合图像。但是这些算法往往只是提取出一对源图像上的全局特征,然后设计复杂的融合规则来融合这些特征,这容易导致信息的丢失,进而影响最后的融合结果。在同一场景下被捕获的一对红外与可见光图像虽然具有不同的模态,但是同样具有共享的公有信息和互补的私有信息,受益于残差网络的启发,在训练学习阶段,通过网络分支间特征层面的互换和相加,强制每一个分支映射到一幅具有全局特征的标签图上来鼓励各个分支学习对应模态图像的的私有特征。在融合预测阶段,采用最大值融合策略融合私有特征,并在解码层与学习得到的公有特征相叠加,最后解码出集成了红外和可见光图像信息的融合图像。使用在NYU-D2上合成的多聚焦图像数据集训练该模型,在TNO真实的红外和可见光数据集上测试,实验结果表明,与当前主流的红外与可见光融合算法相比,所提出的算法在主观效果和客观评价指标上都取得了较好的成绩。(2)在多模态图像的基础上,利用深度自编码网络对多模态图像进行进一步的研究。基于对图像私有信息与公有信息的认知,提出了并行结构的联合自编码网络以同步提取图像的上述信息。在网络结构上,将编码器分为两个私有分支和两个公有分支,私有分支用于互补特征的学习,而公有分支用于冗余特征的学习。在特征融合阶段,分别设计了对应的融合策略将冗余和互补特征集成到融合特征中,通过特征的可视化,可以看到设计的融合策略都较好地融合了图像信息并解码出了好的融合结果。通过与主流的GFF,LPSR,GTF,CSR,MFCNN,Deepfuse,GAN,Densefuse,IFCNN算法进行比较,所提出的方法在主观效果上细节信息丰富,图像结构良好,更适合人类视觉的感知,并在多个客观指标上表现优异。(3)对联合自编码网络进一步研究,结合对比学习,在图像的特征子空间内采用余弦函数作为约束,以最大程度的区分私有特征和公有特征。同时,为了使得公有特征具有唯一性,将公有分支合二为一,以一幅同时包含源图像对信息的公共图像作为输入,而将一对源图像分别输入两个私有分支,公有分支与私有分支的输出相结合并映射到两幅源图像上以学习图像的特征。将图像的分离表示学习推广至多聚焦图像,红外与可见光图像以及医学图像领域。针对提取到的特征,设计了新的融合规则以适应多领域的图像融合。提出的算法在上述领域的公开数据集上与当下的前沿算法相比较,实验结果表明,所提算法在主观效果和客观评价指标上都取得了良好的成绩。(4)为了解决自编码网络无法端到端生成融合图像的问题并减少相应融合规则的设计,提出了一种基于自适应特征融合的端到端训练无监督模型。网络利用自编码模块提取出图像的特征,对特征级联后直接解码出图像,由于生成的图像受到联合损失函数的约束,得以保留源图像的细节并具有良好的结构信息和梯度信息,图像整体结构分明。实验结果证明,该模型在主观效果和客观指标上不输于主流算法与本文之前提出的算法。
其他文献
图像相较于文字而言,传递信息的方式更为简单直接,因此运用更为广泛,但图像在采集、传输和使用过程中,往往会引起不同程度的失真,这就需要质量评价算法对其进行评估。现阶段图像质量评价的主流算法大多基于机器学习(特别是深度学习),现有研究表明机器学习算法对数据的对抗性扰动极其不稳定,存在鲁棒性和安全性问题。基于此本文研究了一系列的对抗性扰动样本来攻击现有图像质量评价算法,找出其漏洞,希望本文的攻击方式能让
随着物联网应用与规模的持续增长,同时带来了空前的网络安全威胁和安全风险。对此学术界提出利用威胁情报来对日趋复杂的安全问题进行预警和预测,威胁情报作为一种网络安全大数据,可以有效帮助防御者更好地提升网络安全防护能力[1]。在此,如何高效构建威胁情报就成了一个核心问题。然而,当前在信息安全领域,威胁情报普遍存在着冗余度较高、内容单一、标准不统一的缺陷,难以共享。对此本文通过对恶意代码和非结构化网络威胁
随着网络通信技术和集成电路制造工艺水平的不断提高,系统间的信息交换变大。传统的并行传输接口技术传输数据时,具有抗干扰能力弱、时钟偏斜大和传输距离短等缺点,导致传输接口成为限制数据传输速率的瓶颈。为了满足日益增长带宽的需求,高速串行接口SerDes逐渐取代传统的并行接口,成为了高速接口的主流技术。SerDes通常采用差分的传输方式,差分传输方式具有抗干扰能力强和传输距离远的优点。SerDes作为主流
目标跟踪一直是计算机视觉研究领域的一个重要分支,其通过对视频帧中感兴趣的部分进行数字化处理与定位,从而实现有效跟踪。近几十年来,由于研究人员的不断努力,涌现出许多优异的跟踪算法。与此同时,该项技术也在多个生活场景中得到广泛的应用,比如收集交通数据进行交通指挥监视、自动驾驶中用于估算障碍物运动轨迹的视觉导航、医学诊断中超声波图像的自动跟踪分析等等。随着研究与应用的深入,现实场景中诸如光照、遮挡、平面
演化进化算法作为经典的启发式搜索算法,有着优异的性能表现,是解决各类实际问题的重要工具。随着演化进化算法在科学与工业领域的研究与应用越来越广泛,对于其求解效率的要求也在不断地提高。演化进化算法在求解大规模优化问题时的性能表现难以满足高效率的需求。通过在高性能集群上进行并行化研究来解决这个问题具有重要的现实意义。神威·太湖之光拥有超过125PFlops的峰值运算性能,可以为提升演化进化算法求解大规模
随着万物互联的智能时代到来,精简指令集(Reduced Instruction Set Computing,RISC)的优势愈发突显,而作为开源的精简指令集,RISC-V指令集更适合于当下生态开放的环境。为提高指令级并行度,现通用高性能处理器都采用了乱序超标量架构,由于指令乱序调度、分支预测等设计的复杂性,乱序超标量架构一直是处理器领域的研究热点。本文进行了基于RISC-V指令集的乱序超标量处理器
在数据挖掘领域中,聚类分析作为一种数据分析技术,已经发展较为成熟,在机器学习、模式识别等许多领域有着广泛的研究。在大量成熟的聚类算法中,谱聚类因其广泛应用性与扩展性,逐渐受到研究关注。但是现存的大多数谱聚类算法在处理海量数据时计算复杂度和空间开销比较大,并随着数据集维度的增加,算法处理能力的下降,一定程度上影响了聚类结果。为满足当前高维海量数据的分析需求,本文着眼于降低时空复杂度以改进算法效率,同
随着物联网的不断创新,物与人的数字化进程正在迅速加快,工业系统的自动化、智能化水平不断提高,数据处理不再需要人为干预,应用系统通过复杂的通信网络控制着物理空间。这些集成了传感、驱动、控制、通信和计算的系统,被广泛应用于工业领域,形成工业信息物理系统(Industrial Cyber-Physical system,ICPS)。在ICPS中,由于网络层和物理层的紧密耦合以及所处工业环境的复杂多变,使
随着互联网技术的飞速发展与应用,一方面各种新型网络技术(诸如卫星互联网、天地一体化信息网络、命名数据网络等)层出不穷,另一方面网络安全事件频发,网络安全形势日趋严峻。面向日益增长的网络新型技术评测与安全防御技术评估的需求,网络靶场主要利用虚拟化技术,对真实网络空间中的各种要素进行模拟和复现,为网络与安全技术的研究提供测试床,因此具有重要研究意义。网络靶场可包括网络仿真、用户行为复制、安全自动化测试
基于多光谱信息融合的行人检测是无人驾驶、智能视频监控等全天候应用中的核心技术,其具体指针对同一场景,同时采用红外和可见光两种视觉传感器获取多光谱(红外和可见光)图像作为输入源,并利用两者的互补性,区分行人目标和背景,完成场景中行人目标的定位,弥补只使用可见光作为输入源的传统行人检测难以应对光照变化、恶劣天气的缺陷。由于多光谱行人检测性能的优劣极大程度上依赖红外与可见光融合机制的优劣,且红外与可见光