论文部分内容阅读
距离度量学习的主要任务是学习数据间的距离和相似度,而对于分类、聚类、识别等机器学习与模式识别的基本任务都是基于数据上的距离度量展开的,因此距离度量学习对于解决机器学习与计算机视觉领域中的实际问题有重要的研究与应用价值。距离度量学习根据学习样本是线性还是非线性,主要分为线性距离度量学习与非线性距离度量学习两类。线性距离度量学习适用于低维线性空间,非线性距离度量学习则适用于高维的非线性空间,其保持了高维非线性数据的低维嵌入流形,因此又称为流形学习。由于现实世界和实际应用中绝大多数的数据是高维非线性的,因此本文的研究重点主要集中在流形学习方面。本文围绕经典的流形学习算法,针对黎曼流形、全局特征信息与局部特征信息和权重距离度量等方面进行研究,提出改进算法并应用于人脸图像识别和高维数据可视化。主要贡献如下:1.从理论知识出发,具体介绍了度量学习经典算法的基本思想和具体步骤,并给出了各自算法的优缺点。然后后通过高维数据模型的可视化实验,对四种经典算法进行了分析与对比。2.针对黎曼流形学习(RML)不能消除图像矩阵的高阶相关冗余信息影响识别效果的问题,引入Log-Gabor滤波器提出了Log-Gabor+RML算法。该算法融合了Log-Gabor滤波良好的表征能力与黎曼流形学习较好的人脸流形保持能力。进一步深入研究发现,Log-Gabor滤波符合人眼的非线性对数特性,适合对自然图像进行处理,同时黎曼流形学习与神经生物学人类的视觉感知是基于流形的这一理论相符合。因此两者在步骤上的融合与人类视觉感知过程顺序相一致,在多个光照人脸库上也获得较好的识别效果。3.基于流形学习核的视角,提出融合流形全局特征信息与局部特征信息的多信息流形学习算法。该算法融合了等距离投影算法(ISOMAP)与局部切空间对齐算法(LTSA)的核矩阵,可以同时保持流形结构的全局特征与局部特征,在人脸图像识别与数据可视化等应用方面获得了比基于单一特征信息的流形学习算法更好的实验结果。4.针对大多数流形学习算法不能处理样本点分布不符合正态分布、密度不均匀的问题,引入CAM权重距离度量替代传统的欧氏距离度量,改进LLE算法原有的近邻点选择方法,提出CAM-LLE算法。CAM权重距离可以使得样本点密度较密集的部分权重较小,从而减少特征信息的冗余;对于样本点较稀疏的部分,可以赋予较大的权重,将这部分特征信息充分的利用。高维数据的可视化实验验证了CAM权重距离度量更适用高维非线性的空间。