论文部分内容阅读
从模式样本的原始信息中提炼出最有利于模式分类的有效信息这一过程通常称为模式特征抽取,特征抽取是模式识别中的经典问题。因此,特征抽取的过程本质上可以看成在一定准则下的优化问题。同时,在特征抽取的过程中,也极大地降低了模式的维数。因此,特征抽取不但从原始模式信息中得出了最有利于模式分类的特征,而且这些特征与原始样本信息相比,极大地降低了模式样本的维数,因此特征抽取也是一种维数缩减的有效方法,这一点对高维模式样本(例如人脸图像)识别而言十分重要。特征抽取中常用的准则大致包括两类:基于重构和基于鉴别(分类)。前者是面向模式表示的,这类方法的典型代表分别是PCA和KPCA;后者是面向分类的,代表性的方法是Fisher线性鉴别分析方法。尽管基于鉴别准则的特征抽取能够提取更有利于分类的有效信息,但对噪声较敏感;而基于重构准则的特征抽取方法在可扩展和抗噪声等方面优于基于鉴别的特征抽取方法。因此本文通过对上述两类方法的比较分析的基础上,较为深入研究了基于重构准则的鉴别特征抽取理论与算法,并在多个通用的人脸数据库上验证了所提算法的有效性。全文主要工作概述如下:1.设计了局部特征重构误差鉴别投影方法。不同于最小局部特征误差算法,对于近邻选择,首先选取每个样本的k个近邻,通过最小化局部类内重构误差,同时最大化由最相关类间样本重构产生的局部类间重构误差来获得最优投影轴。该方法不仅考虑了样本的局部线性关系而且提取的信息鉴别力强,通过在ORL库和YALE库的实验也证明了该方法的有效性、快速性和鲁棒性。2.提出了基于局部相关性尺度的特征重构误差鉴别分析方法。传统的样本的k-近邻计算中所使用的距离采用欧氏距离,但是欧氏距离对样本的噪声尤其是离群样本(outliers)较为敏感,不具有鲁棒性。本方法利用样本间的相关性尺度来定义样本间的相似度,并用来计算每个样本的k1个相似性最小的同类样本和k2个相似性最大的不同类样本,然后通过最小化局部类内重构误差,同时最大化局部类间重构误差来获得最优投影轴。在ORL人脸库和YALE人脸库中的实验验证了本章方法的有效性。3.设计了基于l2范数的最小二乘回归模型的鉴别特征投影算法。基于l1-范数约束的稀疏表示方法成功地应用于人脸识别,但它也存在一个固有缺陷就是计算复杂度太高。与此同时,最近的研究表明基于l2范数的最小二乘回归模型在人脸识别应用中具有同等甚至更高的识别性能,同时具有更高的计算效率。因此,本文利用基于l2范数的最小二乘回归模型来获得每个样本的k-近邻表示,然后通过最小化局部类内重构误差,同时最大化局部类间重构误差来获得最优投影轴。该方法不仅能够抽取更具鉴别力的特征,而且拥有更高的计算效率。4.提出了基于二维稀疏表示的图像重构鉴别特征抽取。传统的稀疏表示分类器是基于一维向量,即需要将原始二维图像变换成一维向量,这样做有两个缺点:一是破坏了样本内像素间的内在几何结构,二是加大地增加计算复杂度,例如,100*100的图像变换后的向量维数是10000,后续的计算都必须在如此高维空间中进行。本文提出直接利用原始的二维图像来构造二维稀疏表示鉴别特征抽取算法。实验结果表示该方法不仅能够提高计算效率,而且分类性能也有较大的提高。