论文部分内容阅读
高光谱遥感技术在可见光至红外波段,可采集许多非常窄光谱的影像数据为观测目标提供更丰富的信息,从而使得常规传感器探测技术无法解决的复杂目标检测、识别与理解成为可能,是传统遥感技术的“进化”发展,近年来受到国内外高度重视。随着高光谱传感器技术的发展,光谱波段数目不断增加。在数据所处的高维特征空间中,光谱波段间的强相关性、数据分布的非线性以及训练样本的不足等都给数据分类识别处理提出了崭新的课题。特征提取和特征选择技术在保留高光谱数据主要光谱信息的同时降低特征空间的维度实现数据降维,成为高光谱遥感数据处理涉及的关键问题之一,并已被IEEE信号处理、地球科学与遥感等会刊列为特别专辑的内容。本文结合国家自然科学基金重点项目等,主要研究基于流形学习、矩阵分解的特征提取方法和基于数据结构的特征选择方法。针对这几种情况,本文的创新点主要有:(1)针对传统流形学习方法忽视了高光谱图像中相邻像素之间的强相关性,提出了一种基于空间一致性的局部嵌入特征提取算法:通过一个优化的局部线性嵌入和相邻像素相关特性的引入,在高维空间建立数据的局部线性结构,寻找一个优化的投影矩阵把局部线性结构投影到低维空间实现数据的特征提取。该方法既考虑高光谱数据的流形结构,又考虑其图像域空间信息,实验结果表明在高光谱数据分类方面具有明显的优越性。此外,得到的投影矩阵可以应用于新的样本,改进了局部线性嵌入等算法只适用于训练样本的不足。(2)针对非负矩阵分解算法没有考虑数据几何结构的特点,提出了一种基于正则化非负矩阵分解的特征提取算法:在标准非负矩阵分解算法的基础之上考虑高光谱数据的局部和非局部结构,最大化非局部散度的同时,最小化局部散度,同时给出了一个迭代的乘性更新规则得到优化解,并对该更新规则的收敛性进行了理论分析和推导证明。此外,针对高光谱技术实际应用中无标记样本和有标记样本并存的情况,提出了一种基于概念分解的半监督特征提取算法:充分利用有限的标记样本,将其作为硬性约束加入概念分解中;同时构建局部邻域图,挖掘数据的流形结构并保持局部的不变特性,使得低维表示具有更强的判别性能。这些特性对于高光谱数据分类问题比同类矩阵分解方法具有更好的针对性效果。(3)针对高光谱数据呈现多模态分布的特性,提出了一种分组的基于局部Fisher判别的特征选择系统:在计算类间离散度和类内离散度时加入样本的局部信息,通过最大化局部类间离散度与局部类内离散度之比,选择一组优化的特征子集,使低维子空间的数据能够在分离不同类别样本的同时,保留同类样本的局部邻域结构。该方法较好的去除了光谱波段间的冗余性,使所选波段可以较均匀地分布在光谱范围中。此外,在考虑了有限标记样本的先验信息以及高维数据局部和非局部结构的不变特性基础上,提出了一种基于流形的半监督特征选择算法:通过对标记样本类间方差最大化和类内方差最小化,优化了数据的判别结构;同时构建局部和非局部图,挖掘数据的流形结构。实验结果表明这些特性使得降维后的空间能够更好的描述数据的分布结构从而提高了数据的分类精度。