论文部分内容阅读
视频监控图像的智能分析对于维持公共秩序、防控犯罪、刑侦破案等应用领域具有至关重要的作用。但是,尽管经过30年高强度的研究,人们提出了各种各样的人脸识别方法,但是识别实际应用的成功受限于很多环境条件,例如不同的图像分辨率、局部非均匀光照、遮挡、旋转、噪声、面部表情、岁数等。换句话说,当前机器识别系统的有效性和人类认知系统的有效性还有一段很远的距离。近年来提出的新的稀疏表示在人脸识别中已表现出优越的分类性能以及对噪声和遮挡的鲁棒性,因此受到了研究者的广泛关注,基于稀疏表示的分类方法(Sparse Representation-based Classification,SRC)将分类问题构造成在最小化稀疏系数L0或者L1范数约束下字典原子的最优线性组合问题,该方法将稀疏表示引入模式分类,使得模式识别领域出现新的开创性的方向,本论文在此框架下探讨各种最优线性组合方法,其中包括基于整体稀疏和分组稀疏相结合的人脸识别分类方法;基于级联顺序Gabor特征的权重稀疏表示分类方法;基于非级联的多方向Gabor特征的权重稀疏表示分类方法等。这些方法在常用标准人脸库的测试中表现出了优良的分类性能,对特征维数少的情况优势更加明显。本论文的主要内容和创新点如下:1)首先简单介绍了当前相关技术的现状,着重通过介绍本人所在项目组于2013年在第八届UTMVP人脸信息识别竞赛中实现的实时识别视频的系统概述了人脸识别的算法框架,以及各个算法组成部分的计算,特别详细地介绍本人主要承担的年龄识别任务,提供了本论文研究的技术背景。2)提出了基于整体稀疏和分组稀疏相结合的人脸识别分类方法。考虑到字典中每一个人的所有图片构成这个字典不同的分组,本论文对SRC算法的L1模整体稀疏求解精度的问题进行讨论,将最小化非零重构向量个数的分组稀疏模型引入SRC框架,通过整体稀疏和分组稀疏相结合从而提高了求解精度,并在常用标准人脸库Extended Yale B上证明了该方法优良的分类性能,对特征维数少的情况优势更加明显。3)提出基于级联顺序Gabor特征的权重稀疏表示分类方法WGSRC,并进一步引入了非级联顺序的多方向Gabor特征,提出基于非级联的多方向Gabor特征的权重稀疏表示分类方法multidirection_WGSRC。最近研究表明基于权重的稀疏表示分类方法WSRC在稀疏表示的基础上充分利用了数据的局部性,提高了分类性能,但是该方法使用的是全局特征,为进一步提高识别率,本文将在参与第八届UTMVP人脸信息识别竞赛时测试效果优良的Gabor局部特征引入到该方法中,并且又进一步将非级联顺序的多方向Gabor局部特征引入到该方法中,并在常用标准人脸库AR库上证明了非级联的多方向Gabor特征优秀的分类性能,对特征维数少的情况优势非常明显。