领域知识驱动的深度学习单幅图像去雨研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:liongliong541
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
雨线对光具有折射和反射作用,导致有雨的自然光学图像中的内容会存在一定程度上的退化现象,如模糊、形变等。这些退化现象会极大地影响人眼视觉质量和后续相应视觉分析系统的性能。因此,对图像去雨的图像清晰化研究在图像处理及计算机视觉任务中均具有极其重要的理论价值和实用价值。当前,图像去雨方法大致可分为模型驱动和数据驱动两类。模型驱动的方法主要通过相关领域知识,采用人工方式设计算法,如基于滤波或基于稀疏表示等浅层视觉表示模型的方法。由于雨线具有较为明显的几何结构特征,较易与物体的边缘和纹理混淆,极大地增加了基于模型驱动方法的处理难度,而有限的模型容量也导致了其去雨效果一般不理想。数据驱动的方法由模型自行从数据中学习有雨与无雨图像间的映射关系,这类方法以深度学习技术为代表,其性能依赖于网络训练时所使用的训练数据。由于真实场景下的有雨与无雨样本对极难获取,所以一般采用仿真方法产生训练数据。而雨天环境下的成像模型较为复杂,仿真方法无法较好地模拟复杂多变的真实场景,也即仿真数据与真实场景数据之间具有一定的差异性。因此,相关数据驱动方法的泛化性能会受到一定程度的限制,甚至出现在仿真数据集上表现良好,而对于真实数据集无效的情况。针对现有去雨方法的不足,本文另辟蹊径,将图像处理中的领域知识用以驱动和引导深度学习技术,集模型驱动与数据驱动两种方法之所长,开辟一个新的研究方向,并以单幅图像去雨为具体的验证对象,在国际上首次提出基于深度学习的单幅雨天图像清晰化算法。论文主要研究内容和创新点如下:1.提出一种仅处理图像高频分量的去雨模型:DerainNet。本文通过实验发现,当对有雨图像和相应的无雨图像进行合适的高低频分解后,雨线主要集中在二者的高频部分,而低频分量中则基本不包含雨线。同目前深度学习方法直接学习图像间映射关系的常规做法不同,利用上述领域知识,本文将训练过程中直接学习有雨无雨图像间的映射关系转化为学习两者图像高频之间的映射关系,再将去雨后图像的高频分量与原始有雨图像的低频分量相加,得到最终的去雨后图像。一方面,由于高频图像具有稀疏性,从而简化了需要深度模型进行逼近的映射函数,进而提高了模型的去雨性能;另一方面,虽然仿真有雨图像与真实有雨图像具有一定的差异性,但它们的高频分量间仍具有相似性,因而所提方法在提高模型区域性能的同时,也提高了模型在实际应用中的泛化性能。另外,低频分量中包含有图像的对比度信息,通过对其进行增强操作,可以进一步地提高去雨后图像的对比度。相关文献调研表明,本文所提的DerainNet是国际上第一个在单幅图像去雨效果上取得较大突破的方法,同时也是第一个将深度卷积神经网络用于雨线去除的方法。实验结果表明,DerainNet在去雨后图像的主观效果和客观指标上,均有质的提高。相比于同时期的基于模型驱动的算法,DerainNet在公开的小雨数据集上的SSIM均值比其提高了8%,在更加复杂的大雨数据集上则提高了近83%。2.提出一种将领域知识与深度网络有机融合的去雨模型:Deep Detail Network。在DerainNet的基础上,本文进一步地提出了一种端到端的深度细节网络(Deep Detail Network,DDNet)去雨模型。该模型所利用的图像领域知识与DerainNet相似,所不同的是DDNet将图像领域知识直接融合到深度网络中,有效克服了DerainNet没有利用图像低频分量信息的不足。DDNet的网络特点具体为:1)DDNet网络的卷积层实际的输入与DerainNet相同,为稀疏的有雨高频分量,起到简化学习过程的作用;2)通过全局跨层连接结构将有雨图像与卷积层的最终输出跨层相加,作为最终去雨图像的逼近,这一跨层连接结构使得卷积层实际需要逼近的输出为负残差结构,且与DerainNet的输出类似,均为高频稀疏信号。另外,DDNet的基本网络模块采用了经典的残差网络(ResNet)模型,这一模型的局部跨层结构可以带来两点优势:1)这一结构可以消除网络变深所带来的梯度弥散问题,因此可以搭建更深的模型,获得更大的感受野和更强的非线性函数逼近能力,从而提高去雨性能;2)这一结构能够将浅层的特征图的信息无失真地传递到深层网络中,有效克服信息在传输过程中的损失问题,从而使得深度模型可以用于解决图像复原等底层视觉任务,突破底层视觉任务仅能利用较浅的深度模型的认知偏差(DerainNet仅包含3层卷积层,而DDNet包含26层卷积层)。相关实验结果表明,所提的DDNet在不增加参数数量的前提下,能够进一步地提升去雨的主客观处理效果。相比DerainNet模型,DDNet在复杂的大雨数据集上则提高了近14%。3.提出一种轻量级的金字塔去雨模型:Lightweight Pyramid Network。本文将DerainNet和DDNet对图像进行分解以简化学习过程的思想进一步扩展,提出了轻量级的金字塔去雨网络模型(Lightweight Pyramid Network,LPNet)。LPNet通过领域知识引入图像多尺度金字塔分解算法,将单一尺度下求解较为困难的去雨问题转化为多个不同尺度下的简单子问题。相比于DerainNet和DDNet在单尺度问题下的学习过程,LPNet的各尺度下子问题的学习过程会被极大地简化,对应的子网络仅需少量参数即可学习出映射关系。通过这种“分而治之”策略,可以极大地简化模型,使得设计轻量级的去雨模型成为可能。相关实验结果表明,与同时期的深度学习方法相比,LPNet在保证相近的去雨效果的前提下,网络参数的数量减少了近98%,降低两个数量级。4.相关模型的应用拓展。本文主要的验证对象是在单幅图像去雨,但其所采用的领域知识为自然图像的共性特征,例如图像高频稀疏性和多尺度分解等,因而相关模型应用也并不仅局限于图像去雨领域。为此,本文将所提出的三种模型进一步拓展到图像去噪、超分辨率重建、JPEG压缩伪影去除和遥感领域Pan-sharpening融合等问题中,相关实验结果均表明所提方法具有一定的比较优势。特别是对于Pan-sharpening问题,本文所提模型获得了当前最佳性能,主客观性能上均有质的飞跃,且实际应用中本文所提模型也具有较强的泛化能力。
其他文献
大菱鲆(Scophthalmus maximus)隶属蝶形目(Pleuronectiformes),鲆科(Bothidae),又名多宝鱼,是低温经济鱼类中的名贵品种,其养殖最早源于欧洲。鱼类无水保活是通过采用缓慢降温法使其进入休眠状态后,捞出水环境中进行无水充氧密封包装,并在冰温环境中贮藏,达到时间后,移至适宜的低温水环境中进行梯度升温使其缓慢进入正常生存状态。大菱鲆是研究无水保活技术的理想材料,
Business continuity management is a series of actions that helps institutions face potential risks and disasters.Setting business continuity management within a strategic framework allows institutions
学位
在经济全球化时代,全世界范围内的投资正在呈现前所未有的增长态势,投资争端的数量也在不断增长。无论是对投资者而言,还是对一国政府而言,充分了解并熟悉投资者-国家仲裁中的具体制度对于从容应对国际投资争端都具有重要的现实意义。第一章是投资者-国家仲裁庭采取临时措施的权力,本章主要研究了投资者-国家仲裁庭采取临时措施权力的法律基础、属性、程序性问题以及分配四个问题。第二章是临时措施的目的,即保护当事方的各
非线性和时变是控制系统中普遍存在而又富有挑战的两个问题。对于非线性时变系统,目前还缺乏容易验证的稳定性判据和便于计算的控制设计方法。针对上述问题,本文提出了全新的非线性变参数(nonlinear parameter-varying,NPV)框架以刻画非线性时变系统的非线性和时变动力学特征,在此基础上采用平方和(sum of squares,SOS)凸规划理论研究了这类系统的稳定性分析和控制设计问题
本文主要从数学理论方面研究非等熵可压Euler方程组、Hunter-Saxton类型方程组和可压磁流体力学方程组解的适定性问题。主要内容分为三个部分。第一部分为第二章,研究一维非等熵可压Euler方程组分别在半空间和有界区域内整体解的存在唯一性。第二部分为第三章,研究一维Hunter-Saxton类型方程组守恒解的Lipschitz度量。第三部分为第四章,研究可压磁流体力学系统周期解的存在性问题。
我们知道,许多特殊函数,例如经典正交多项式(Jacobi,Laguerre,和Hermite多项式),柱函数和超几何函数都是同样类型的二阶常微分方程的解.这种方程称为超几何型微分方程.随着更多特殊函数的不断被引入和研究,超几何型微分方程也衍生出三种离散化形式.本文主要研究Kummer方程的q-模拟和对三种离散化形式的超几何型方程的Rodrigues公式作推广.具体来说:第一章概述了超几何型微分方程
本文分析了当前中国投资者在保加利亚投资的法律框架,并且探讨了中国投资者在保加利亚从事经济活动时应当考虑的情况。本文是从成功实现“一带一路”倡议的视角展开分析的。“谁能投资?一投资什么领域?—如何投资?—如何保护投资的资本?”,本文依上述逻辑专门为中国投资者如何参与保加利亚投资程序创造了一个基于一手资料的投资法律指南。此外,本文揭示了前述法律框架的特点,并且提出了中国投资者可能面临的困难以及克服这些
With losses worth billions of dollars,practitioners and academics mutually assert the need to recognize employee engagement as a major global concern for businesses and economies.Gallup and other surv
学位
带子图可被看作是一个具有图结构的有边界的曲面,是胞腔嵌入图的一种表示形式.部分对偶推广了数学基本概念一胞腔嵌入图的几何对偶,它通过纽结的Jones多项式与图的Tutte型多项式之间建立关系,将纽结理论中各种版本的Thistlethwaite定理统一起来.部分对偶不但是几何对偶的深远扩展,而且在图论,拓扑学和物理学中有重要的应用.本文刻画带子图及其部分对偶的欧拉和偶面图等若干性质.全文共分五章:第一
本文先后讨论了两类自由边界问题:热-扩散燃烧模型和高阶广义Cahn-Hilliard方程,并针对这两类问题进行稳定性分析和数值模拟。(Ⅰ)热-扩散燃烧模型:该模型描述了在二维带型区域R×(-l/2,l/2)中,零阶反应和分段温度动力机制的预混火焰热-扩散燃烧现象,模型表示为:我们针对自由边界的胞状不稳定情况(即Lewis数满足0