论文部分内容阅读
主动表观模型(Active Appearance Model,AAM)是由Tim Cootes等人提出的一种参数化的统计模型。它是计算机视觉领域中的一种重要的算法,被广泛的应用于二维非刚体目标的建模和分析。主动表观模型通过在训练集中对非刚体目标的形状信息和纹理信息进行统一的建模,使用相应的目标函数优化策略对新的目标进行搜索和匹配。本文以主动表观模型作为研究对象,对其进行了全面深入地探讨,并且结合局部特征算子和级联回归模型对人脸图像理解中的人脸特征点定位问题开展研究。人脸图像理解技术是通过计算机技术、自动化技术对数字化的人脸图像进行解读,提取出其中的高层语义信息的技术。因为人脸图像信息量大、识别时的非侵扰性、采集设备简单等等特点,人脸图像理解技术被广泛得应用于人脸识别、视频监控、国防安全等诸多领域,成为当前的研究热点。一个完整的人脸图像理解过程有五大主要的组成部分,即人脸检测、人脸特征点定位、人脸对齐、人脸特征抽取、以及相应的识别、验证和分类算法。其中,人脸特征点定位是要对人脸的五官位置甚至是面部轮廓进行精准定位,它为整个自动化识别程序提供了大量精确的几何信息,是整个程序的数据基础。作为本文主要的研究对象,主动表观模型正是人脸特征点定位研究中一个经典的算法。它通过对人脸图像中目标人脸的特征点的定位,能够准确的获得人脸的形状信息和纹理信息,进而可以提取出更高层的人脸特征信息。在经典的主动表观模型的基础上,为了进一步提高主动表观模型的匹配精度以及模型在不可控环境下的鲁棒性,本文在对主动表观模型全面系统的分析和研究基础上,提出了一种新的模型匹配策略,该方法的主要创新点有:第一,提出了基于级联回归结构的主动表观模型。通过级联回归模型(Cascaded Regression,CR)将若干个弱回归器串联起来,组成一个强回归器,提高模型的匹配精度;第二,提出了一种结构化特征融合的主动表观模型。利用局部特征算子(Local Descriptor)的结构特征,将全局纹理模型和人脸局部特征相融合,提高模型在不可控环境下的鲁棒性;第三,提出了一种基于级联回归模型的优化算法。在使用主动表观模型对目标人脸进行特征点定位之前,首先使用非参数化级联回归模型的人脸特征点定位算法对初始化的人脸形状进行优化。然后,再使用主动表观模型对目标人脸的特征点进行准确定位。通过在XM2VTS和BioID人脸数据库上进行的测试表明,与传统的主动表观模型的匹配算法相比,本文提出的改进算法进一步提高了主动表观模型的匹配精度和鲁棒性。