论文部分内容阅读
自动人脸检测与识别属于模式识别和计算机视觉的交叉学科,具有重要的科学意义。随着低价位摄像装置的出现与计算机技术的快速发展,以及商业和军事应用领域需求的不断提高,人脸检测与识别技术的研究得到了愈加广泛的关注和参与。自然人脸图像受多种因素的影响具有很强的模式多样性,这使得人脸检测与识别问题极富挑战性。复杂背景和多姿态是人脸检测与识别技术走向实用化需解决的关键问题。本文系统地分析了现有人脸检测与识别方法的优缺点。针对如下问题进行了深入的研究:基于可能近似正确学习模型的人脸检测方法中的样本选择和多姿态问题;识别任务中的人脸对齐问题;多因素影响下人脸图像线性子空间识别方法中的视角非线性变化问题。主要的创新性研究成果概括如下:(1)针对主动机器学习中训练示例的选择问题,提出了嵌入式Bootstrap主动样本选择算法。通过将Bootstrap和嵌入式Bootstrap的思想进行形式化描述,从理论和实验中均证明了新算法在保持和原Bootstrap算法训练时间相当的前提下,可得到更典型的训练示例集,从而解决了计算条件对训练集规模的限制,使训练所得的预测器具有更高的性能。并将Bootstrap和嵌入式Bootstrap应用于基于AdaBoost的正面人脸检测任务的负样本选择中,实验结果表明了理论分析的正确性。该算法适用于一大类主动学习中训练示例的选择问题。(2)当人脸姿态变化较大时,人脸图像可利用的共同特征明显减少,为解决多姿态人脸的类内差异,提出基于聚类有效性分析和FloatBoost的多姿态人脸检测算法。对多种姿态采取“分而治之”的策略,通过模糊c-均值聚类和基于修正的划分模糊度的聚类有效性分析对多姿态人脸图像进行分类,然后用FloatBoost学习得到树型的多姿态人脸检测器。与原树形检测器算法相比,新算法在训练阶段速度更快,在检测阶段更有效。(3)面部特征精确配准是实现鲁棒人脸识别的前提,为了更精确的描述人脸特征和提高分类的精度,提出一种新的人脸序列图像的对齐方法。文中借鉴人脸图像中的灰度分布平滑性,提出快速鲁棒的模糊连通度分割方法实现序列图像中的人脸分割,并根据人脸主要器官进行正面人脸对齐,实验结果表明该方法有助于识别性能的提高。此外,所提出的分割算法在多噪声和序列医学图像的分割上也取得较原基于尺度的分割方法更快的速度。(4)基于张量分解的线性子空间识别方法主要用于解决多因素影响下的复杂人脸识别,本文针对其中的视角非线性变化问题进行深入的研究,提出基于视角流形建模的多姿态人脸识别算法。首先采用张量分解将影响人脸图像的多种因素分离;再结合视角流形建模来解决人脸视角空间的非线性问题,最后给出身份和视角参数的自动求解方法。对测试视角与训练视角进行交叉验证的结果表明,与原基于张量脸的识别算法相比,新算法的识别率提高了12%左右。(5)针对人脸姿态低维流形与高维人脸数据之间的非线性映射关系,提出一种基于非线性张量分解的人脸生成模型。文中深入地研究了多视角人脸表达中的三种视角流形生成方法的有效性,并提出一种基于EM-like的模型参数求解方法。对测试视角与训练视角进行交叉验证的结果表明,与基于张量脸的识别算法相比,识别率提高了19%左右。此外,基于非线性张量分解的方法为混合线性-非线性因素影响下的精细目标建模提供了有效途径。上述研究成果分别从复杂背景条件下的多姿态人脸检测、对齐与识别等方面给出了具体的研究方案和实验结果,为人脸检测与识别的理论研究和应用推广提供了新思路。此外,文中提出的主动样本选择方法、图像分割方法、多姿态人脸检测和识别模型具有一定的通用性,为相关的模式识别问题提供了有效的理论依据和有效途径。