论文部分内容阅读
高光谱遥感技术在近些年的迅猛发展促使其有可能提取地物的细节信息,且高光谱图像(Hyperspectral Image,简写为HSI)高效的综合了地物的光谱信息、空间信息以及辐射能量。因其地物具备的内在固有特性,不同的地物具备各自独特的电磁波反射特性,对高光谱图像进行聚类的理论基础是根据不同地物所具有的不同反射特性。基于机器学习和统计学习方法对高光谱图像进行聚类的工作是近年来聚类工作的主旋律。高光谱图像聚类技术主要是根据不同地物之间携带的不同电磁波谱反射特征来判定未知地物的聚类情况,进而获取不同地物的位置分布和空间大小信息,为人们对某些未知的感兴趣地域提供信息的判定,因此在军事勘测,大气检测等领域有着强大的指导意义。基于稀疏子空间聚类(Sparse Subspace Clustering,简写为SSC)的算法是近些年比较流行的高光谱图像处理方式,SSC算法是基于谱聚类(Spectral Clustering,简写为SC)基础之上的,进一步地通过拉普拉斯特征映射得到高维样本下的的真实低维结构,最后执行SC算法得到结果。在一定意义上,SSC算法能够对高维特性的高光谱图像样本降维,从而有利于聚类。直接将SSC算法应用在高光谱图像聚类中,存在聚类精度不高,无法全面提取高光谱图像中的几何结构信息包括空间信息问题,而且,传统的无监督处理使得HSI样本聚类的精度受到限制。基于以上的分析,针对SSC算法在HSI聚类中的问题,本文主要在它的应用基础上进行了以下改进:1)考虑到HSI样本存在富饶的光谱和空间信息,以及具备高维特性的特点,传统的SSC算法只能利用求解得到的单个高光谱图像样本稀疏表示系数构造相似度矩阵,从而应用SC,获得最终的聚类结果。单个的稀疏表示系数缺乏整体信息的利用,无法捕捉高光谱数据的结构信息以及丰富的光谱信息和空间信息,造成聚类不精确。所以本论文采用求解的高光谱图像样本的整体稀疏表示向量构造余弦相似度矩阵,在余弦相似度矩阵的基础上融入高光谱独特的空间信息,形成新颖的余弦欧式相似矩阵。进一步考虑到高光谱影像在生成过程中会受到地物类型、大气影响和太阳高度角等不同因素的影响,本论文在基于稀疏表示向量的基础上引入动态加权的余弦欧式相似矩阵。两种相似度矩阵的构造方法都结合了高光谱图像中丰富的光谱信息和独特的空间信息构成的,较好地提高了高光谱图像聚类的精度。2)考虑到传统SSC聚类精度的受限性,无法大幅度提高聚类精度,论文采用少量高光谱样本的监督信息,通过稀疏表示分类传递已知的标签信息到大量的未知样本,构成样本间的类概率模型,类概率模型使得大量未知样本也获得了类别标签信息,明确了未知样本对应类别的隶属度,使得相似样本之间的块对角化结构更加紧凑,扩大了相似样本的一致性,通过稀疏表示系数和类概率的融合较好地提高了聚类精度。基于以上的理论分析,提出了基于SSC的类概率模型算法。本论文分别在公开的高光谱图像数据集,Pavia University,Indian Pines,Pavia Centre上进行实验,理论下的实验显示,本文基于SSC算法的改进有利于HSI的聚类,使得稀疏系数块对角化较为明显,提高了聚类精度,证实了所改进方案的有效性。