论文部分内容阅读
极化合成孔径雷达(Polarimetric Synthetic Aperture Radar,PolSAR)是一种主动传感器,不受光照等外部条件限制,能够通过机载或者星载系统得到质量很高的遥感图像。通过雷达的回波检测目标的物理散射信息,极化SAR在军用和民用领域得到了十分广泛的应用。因此,极化SAR图像处理技术得到越来越多的关注,其中极化SAR图像分类又是极化SAR图像处理的关键技术。经过几十年的发展,研究学者已经对极化SAR图像分类提出了多种方法。特别是随着稀疏表示和深度学习的迅速发展,其相关方法也被应用于极化SAR图像分类。然而,稀疏表示和深度学习方法在极化SAR图像分类的应用还有很大的提升空间。基于上述背景,为了进一步提升稀疏表示和深度学习在极化SAR图像分类中的性能,本论文提出了一系列相关的方法,总结如下:1.提出了一种多层字典学习架构。近些年提出的投影字典对学习(Projective Dictionary Pair Learning,DPL)模型可以同时学习一个由分析字典与合成字典组成的投影字典对,当模型优化完成后,其判别性能和表示性能将达到平衡,而且其模型架构简单,因此在取得好的分类结果的同时可以兼顾时间消耗。近些年,深度学习在各个领域得到了十分广泛的应用,造成其优异性能的一个关键原因就是其深度架构,受此启发,本文将DPL模型做了适当修改,将其扩展到多层架构,提出多层投影字典对学习(Multilayer Projective Dictionary Pair Learning,MDPL)模型,用于提取极化SAR数据特征。由于MDPL的多层结构以及其基础模型DPL优异的提取特征的性能,MDPL提取的特征具有很高的抽象性,有助于获得好的分类结果。然后,将MDPL提取的特征输入到Softmax分类器,此分类器架构简单,分类性能良好。2.提出了一种新的拟合极化SAR图像不同特征的方法。在当前的极化SAR图像分类方法中,提取的极化SAR图像的特征往往不止一种,例如极化相干矩阵、极化协方差矩阵与极化目标分解等特征。然而,在当前的方法中,常见的处理方式就是直接将所有特征拉成一个特征矢量,这在一定程度上会隔断各个特征之间的联系。近些年提出的半耦合字典学习(Semi-Coupled Dictionary Learning,SCDL)模型可以用来解决此问题,SCDL模型是基于超分辨问题提出的,通过SCDL模型,可以找到高分辨图像和低分辨图像之间的特征联系,但是其求解较为复杂,而DPL模型正好可以用于解决此问题。基于SCDL和DPL模型,提出了半耦合投影字典对学习(Semi-Coupled Projective Dictionary Pair Learning,SDPL)模型,SDPL模型可以揭示不同特征之间的关系,而且求解简单,分类性能良好。此外,还使用稀疏自编码器(Sparse Auto-Encoder,SAE)去提取特征,SAE能够以自适应的方式提取输入数据各个元素之间的非线性关系,进而得到好的极化SAR图像分类结果。3.将非线性变换引入到稀疏表示。近些年,稀疏表示与深度学习都在极化SAR图像分类得到了成功应用,但是稀疏表示取得的结果往往没有深度学习取得的结果好。本文认为,导致深度学习的优异性能的一个主要原因就是其非线性变换。然而,稀疏表示往往是在原始数据空间的线性操作。因此,在DPL模型的基础上,提出了非线性投影字典对学习(Non-linear Projective Dictionary Pair Learning,NDPL)模型。与DPL模型类似,NDPL模型也需要同时学习由分析字典与合成字典组成的字典对,分析字典起编码作用,合成字典起解码作用,但是其编码过程和解码过程都引入了非线性变换,因此其提取特征的能力显著增强。而且,NDPL模型也继承了DPL模型的简易框架,求解较为简单。因此,NDPL模型可以使用少量有标记训练样本得到优异的分类结果,而且其时间消耗也比较少。4.将全卷积网络(Fully Convolutional Network,FCN)成功应用于极化SAR图像分类。深度学习在极化SAR图像分类得到了广泛应用。然而,常见的深度学习模型在极化SAR图像分类中都存在一定的问题。如,深度置信网络(Deep Belief Network,DBN)和稀疏自编码器(SAE)受限于其模型架构,不能有效地利用图像的空间信息,而卷积神经网络(Convolutional Neural Network,CNN)则必须使用像素点的邻域才能得到单个像素点的分类结果,这又导致了重复计算和重复内存占用。最近提出的FCN模型可以用于处理密集预测问题,而极化SAR图像分类恰好就是密集预测问题,因此FCN是最适合处理极化SAR图像分类的方法。然而,由于极化SAR每张图像尺寸不同等问题,FCN模型并不能直接应用于极化SAR图像分类。针对此问题,本文提出了滑窗全卷积网络(Sliding Window Fully Convolutional Network,SFCN),但是,SFCN也会随着图像尺寸的增大而造成计算负担以及内存占用的显著增加,此问题可以用稀疏编码解决。通过稀疏编码可以将图像下采样到较小尺寸,而且还几乎不会带来信息损失,用SFCN对下采样图像进行分类,并将得到的分类结果上采样到原始图像尺寸,得到有竞争力的分类结果。5.将深度重构分类网络和对抗训练引入到极化SAR图像分类。众所周知,图像标记是一件非常消耗人力和物力的事情,因此,如果可以用非常少的有标记训练样本得到好的分类结果是一件非常有意义的事情。最近提出的深度重构分类网络(Deep Reconstruction-Classification Network,DRCN)可以用于解决此问题。DRCN可以处理两个任务,即有监督图像分类和无监督图像重构,两个任务共享特征编码,通过共享的特征编码可以对图像所有像素点进行重构以及对部分有标记像素点进行分类,从数据分布方面分析,共享的特征编码也可以对剩余的像素点进行正确分类,因此无监督图像重构是对有监督图像分类有益的辅助任务。通过对抗训练,可以检测到重构图像与原始图像之间的高阶不一致性,从而辅助DRCN得到好的图像分类结果。在SFCN的基础上,通过引入DRCN和对抗训练,提出对抗重构分类网络(Adversarial Reconstruction-Classification Network,ARCN)。ARCN可以进行像素点到像素点,端到端的训练,使用极少的有标记训练样本得到非常有竞争力的图像分类结果。