论文部分内容阅读
近年来,生物特征识别技术受到了广泛的关注和应用,可用于有效识别的生物特征主要有指纹、虹膜、人脸、掌纹等。其中,人脸识别具有稳定、唯一、操作简便、成本低等优越的特性,已被广泛应用于公共安全、监控、个人信息管理、娱乐生活等诸多领域,并且成为了计算机视觉以及模式识别领域的研究热点。过去四十年中,人脸识别技术取得了显著的进展。可控条件下的人脸识别技术已基本趋于成熟,然而在非可控条件下,由于受表情、姿态、光照、年龄、遮挡等因素的影响,人脸识别依然是一个很有挑战性的问题。此外,非可控条件下很难得获取到大量包含丰富变化并且标注完整的训练数据,如在对犯罪分子的抓捕中通常只能得到一幅犯罪分子的图像或根据目击者描述得到的素描图像,不完整的标注进一步加剧了非可控条件下人脸识别的难度。本文针对非可控条件下出现的数据标注不完整的问题进行了深入的分析,并提出了使用不同完整程度的标注数据进行模型学习的方法。本文主要研究工作包括: (1)针对单一样本下的人脸识别问题,提出了自适应判别分析方法,在单一样本人脸识别上取得了良好的性能。该方法利用一个每人多个样本的世界集来对单一样本的类内散度矩阵进行估计,解决了单一样本场景下没有类内变化的问题。该方法基于长相相似的人具有相似的类内变化的思想,通过组合单一样本的若干近邻的类内散度矩阵来实现估计该单一样本的类内散度矩阵。 (2)针对边信息情况下的人脸识别问题,提出了基于边信息的判别分析方法。边信息只提供了一对样本是否属于同一个人的信息,没有提供每个样本的类别信息。该方法在边信息的场景下重新定义了类内散度矩阵和类间散度矩阵,从而将Fisher线性判别分析扩展到了边信息的场景下。此外,还从理论上证明了类别信息已知时,基于边信息的判别分析与Fisher线性判别分析的等价性。 (3)针对半监督的人脸识别问题,提出了原型超平面学习方法,该方法旨在结合无标注数据和弱标注数据学习一组判别性的中层特征表示,取得显著优于底层特征的性能。该中层特征的每一维对应一个建立在无标注数据上的支持向量机(称为原型超平面)的输出,同时为了得到一组判别式的中层特征表示,通过最大化弱标注数据集上基于中层特征表示的类Fisher(Fisher-like)准则得到原型超平面的最优参数。 (4)针对无监督的领域适应人脸识别问题,提出了目标域化源域样本的方法将源域的知识迁移到目标域上,从而有效地提升了目标域上的识别性能。在无监督领域适应场景下,标注的源域与无标注的目标域的分布是不同的,无法直接用于目标域上的模型学习。本文通过在原始样本空间将源域样本表示为目标域少数近邻样本的线性组合以将源域的样本变换到目标域上,从而得到一组有标注的目标域样本,实现监督知识从源域到目标域的迁移。为了保证目标域化的可靠性和稳定性,本文提出在源域与目标域的公共子空间中对用于目标域化的稀疏线性组合系数进行求解,从而解决了原始样本空间中标注数据与无标注数据分布不同,不能直接用于学习识别模型的问题。 (5)针对多视图人脸识别问题,提出了多视判别分析的方法,显著提升了跨视图人脸识别的性能。在多视图识别的场景下,来自于多个视图的数据位于不同的空间,通常无法直接进行比对或识别。该方法通过学习多个视图特定的投影矩阵以将多个视图的数据投影到一个公共的子空间,从而去除视图间的差异。该公共子空间是通过最大化所有视图下的类间散度、最小化所有视图下的类内散度得到的判别式公共子空间,进一步提升了跨视图识别的性能。 综上所述,本文针对人脸识别中出现的训练数据标注不完整的问题开展了广泛和深入的研究,提出了基于非完整标注数据进行模型学习的方法。大量实验结果表明,本文提出的方法可以有效利用非完整标注的数据学习判别式的模型,显著提升了非完整标注下人脸识别的性能。