论文部分内容阅读
本文针对遥感和傅立叶红外透射两种不同形式的光谱进行了基于核密度估计的高光谱遥感数据分类和傅立叶红外透射光谱回归分析研究。高光谱遥感数据分类面临的难点就是如何有效处理谱线波段强相关问题,而傅里叶红外透射光谱回归分析的难点在于如何准确识别谱线中的隐含峰。已有的基于谱线匹配和统计特征(例如支持向量机)的高光谱分类方法往往忽略了谱线波段间的相关性,从而限制了这些分类方法的表现。同时,由于传统的基于最小二乘法的拟合方法存在正规方程组病态化的缺陷,使其往往无法识别谱线中的隐含峰,从而导致不精确的光谱数据分析结果。为了有效地解决上述光谱数据分类和回归分析中面临的难点和问题,本文从分析光谱数据的概率密度函数分布入手,主要开展了以下三部分的研究工作,提出了基于等效概率的灵活朴素贝叶斯分类器FNBEPNSK、基于联合概率密度函数估计的非朴素贝叶斯分类器NNBC以及基于模糊积分的核回归集成算法KREFI。1)研究了Gaussian,Uniform,Triangular,Epanechnikov,Biweight,Triweight和Cosine七种不同的核函数对基于边缘概率密度函数估计的朴素贝叶斯分类器表现的影响,其中Gaussian核为光滑核函数,后六种为非光滑核函数。通过分析这七种不同核函数在概率密度函数估计中的效能,给出了非光滑核函数的作用条件,并针对非光滑核函数在概率密度函数估计中的缺点,提出了基于等效概率的灵活朴素贝叶斯分类器FNBEPNSK。在标准的UCI数据集和真实高光谱数据集上的验证结果表明,等效概率的应用显著改善了朴素贝叶斯分类器的分类表现。2)为了有效处理样本条件属性之间的相关性,我们将联合概率密度估计的思想引入到了高光谱遥感数据分类器的设计中,提出了基于联合概率密度估计的非朴素贝叶斯分类器NNBC。为了确定联合概率密度估计中的带宽参数,本文设计了基于积分均方误差最小化的参数选择标准,保证了最佳带宽参数的选取,并通过与基于积分方差最小化的参数选择标准比较证实其有效性。同时,理论证明了当属性之间存在强相关时联合概率密度函数估计的最优性。最后,在UCI数据集以及真实高光谱数据集上的实验结果表明非朴素贝叶斯分类器在获得较高概率密度函数估计质量的同时,显著地提升了朴素贝叶斯分类器的分类精度。3)针对硅基薄膜傅里叶红外透射光谱曲线波动频率大、隐含峰难识别的特点设计了一款能够充分考虑光谱数据概率分布信息、具有高稳定性和高准确度的核回归集成方法。通过在6个标准的测试函数上的实验比较,证实了基于交叉验证带宽选择策略Priestley-Chao核回归器PCKE1和PCKE2的高方差的特性。之后,设计了基于模糊积分的核回归集成模型KREFI对四种不同的Priestley-Chao核回归器进行了融合以提高核回归算法的稳定性,其中模糊积分中的模糊测度使用了三种不同的粒子群优化算法进行确定。最后,在标准的测试函数以及28条不同形式的硅基薄膜傅里叶红外透射光谱上对核回归集成算法KREFI的表现进行了验证,结果表明KREFI获得了良好的回归表现,在一定程度上解决了谱线隐含峰无法识别的问题。