论文部分内容阅读
目前,深度学习在计算机视觉领域的巨大成功使其成为最具影响力的研究方向之一,很多研究都对深度网络进行了改进并将其应用到各个领域.然而,对深度网络的改进主要是增加网络的深度或者在网络中嵌入复杂的模型,这种改进思路在一定程度上可以提高网络的性能,但是这也导致网络变得越来越臃肿,大大增加了网络训练的难度和对训练数据集数量的要求.同时,这种网络结构层面的改进不涉及深度网络的内部处理算法,不利于深度学习在理论上或者算法上的突破.因此,我们需要对深度网络的内部处理机制进行分析与研究,从而根据不同的问题对深度网络的内部算法进行改进.首先,借助最大激活可视化算法(Activation maximization,AM)对深度网络进行逐层可视化,以此进一步理解深度网络每一层和每个卷积核的主要作用.基于对深度网络内部处理机制的研究分析,研究基于可视化的深度网络压缩算法、基于反卷积神经网络的图像超分辨率重建算法、基于密集连接网络的遥感图像时空融合算法等.具体内容如下:1.基于可视化的深度网络压缩算法.首先,利用经典的AM算法对深度网络进行逐层可视化.通过对可视化结果进行分析,我们发现不同的卷积核提取不同的特征,而且在同一层中存在很多提取相同特征的卷积核或者提取无效信息的卷积核,这些冗余的卷积核浪费了大量的计算资源和存储资源.针对这一现象,我们基于可视化结果提出了一种卷积核的删减策略.对于单个卷积层,我们提出一个优化模型来对卷积核进行删减,在删减卷积核的同时要求该卷积层获取的信息量越多越好.对于该优化模型我们利用贪婪算法进行求解.然后,我们将单层的删减策略推广到了整个网络并对深度网络进行了整体压缩.与一般的基于卷积核重要性指标的深度网络压缩算法不同的是,我们提出的基于可视化的压缩算法不仅可以删除无效的卷积核,同时还可以删除功能重复即提取相似特征的卷积核.通过对比实验可以发现,提出的算法具有更好的压缩性能.2.基于反卷积神经网络的图像超分辨率重建算法.图像分类问题和图像重建有着本质的区别,卷积运算在图像分类问题上取得的巨大成功不代表其对于图像重建问题是最优的选择.卷积运算可以从一堆特征中提取出对图像分类最有效的特征,是一个信息从多变少的过程.而图像重建问题需要从少量的低分辨率信息恢复出更多的高分辨率细节信息,是一个特征从少变多的过程.反卷积运算可以看做卷积运算的逆运算或者转置运算,可以从少量信息中恢复出更多的信息.因此,反卷积运算的原理与图像重建问题的机理更相符.基于此,我们提出了一种基于反卷积网络的图像超分辨率重建网络(Fully deconvolutional neural network,FDNN).考虑到大部分的用于图像重建的网络与图像分类网络一样选择均方误差(Mean square error,MSE)作为网络的损失函数,而MSE损失函数由于其过于光滑的特性会导致恢复出来的图像过于平滑.因此,为了避免MSE的这一缺陷,我们将图像视为像素的一种分布,将Kullback–Leibler(KL)散度引入到网络的损失函数.通过对比实验,虽然我们提出的FDNN网络只有10个反卷积层,但是重建效果却优于20层甚至30层的深度卷积网络.3.基于多输入密集网络的遥感图像时空融合算法.一般的用于图像超分辨率重建的网络都是单输入单输出,而遥感图像时空融合问题含有序列图像可以利用,为了充分利用相邻时刻影像的信息,我们提出了一种双输入的密集连接网络(Multi-input dense neural network,MDN),将相邻时刻的两张低分辨率MODIS遥感影像作为输入得到一张过渡的高分辨率遥感影像.考虑到遥感图像时空融合问题只是缺失了某些时刻的高分辨率影像,缺失时刻前后的高低分辨率影像都有,而MDN网络只是利用了低分辨率影像的信息.因此,我们又提出了一种差异相似插值算法(Error linear interpolation,ELI),将MDN网络学习到的两张过渡图像与已知的缺失时刻前后的两张高分辨率影像进行融合,得到最终的中间缺失时刻的高分辨率Landsat影像.通过对比实验,本文提出的融合算法在定量对比和视觉对比上都优于传统的基于稀疏表示的融合算法和一般的单输入单输出的图像超分辨率重建网络.