论文部分内容阅读
人脸属性识别在人机交互、安防系统等众多领域有着广阔的应用前景,受到了研究者们的广泛关注,已成为计算机视觉和模式识别领域的热点研究课题。目前,由于样本多样性、数据收集困难等问题都对人脸属性的识别算法提出了重重挑战,从而限制了其在实际场合中的应用与推广。本文对人脸属性中的活体检测、年龄估计和表情识别课题的关键问题进行了探索和研究。主要工作和贡献有: 1、基于判别高斯过程隐变量模型的年龄估计。受到基因、生活习惯等多种内外因素的影响,不同个体的年龄发展模式截然不同。本文提出了一种基于流形学习的年龄估计方法,旨在从不同用户的大量数据中挖掘出可能潜在的年龄模式。主要贡献为:在判别高斯过程隐变量模型的基础框架上加入隐变量的基于广义判别分析的先验信息,从而将其从解决线性可分问题推广到线性不可分问题—年龄估计。 2、基于多形状对齐的表情识别。针对表情识别中的几何多样性问题,即不同个体对同一种表情的表达程度不同,甚至同一个体在不同时间不同场景下也不同,本文提出了一种基于多形状对齐的表情识别方法,旨在减少几何多样性的同时尽可能地保持不同表情类别下个体的差异性。该方法首先通过不同表情类别的样本获取相应的平均形状,进而基于多个平均形状进行加权投票获取最后的表情类别预测。和传统基于单一人脸形状模板相比,基于多形状模板的方法充分利用了不同表情的特点,有效提高了表情识别的准确率。 3、基于视线估计的活体检测。首先从单一人脸线索出发,基于合法用户的视线具有不可预测的特点,提出了基于视线估计的活体检测方法。该方法预先建立屏幕中多个视点的视线估计统计模型,进而通过估计用户的视线行为进行活体判断。提出的方法包括两种框架,分别用于处理照片与视频播放的识别和抵御。首先提出了基于信息熵的方法用于抵御照片攻击,该方法采用信息熵指标来衡量用户在短时间内视线行为的不确定程度。其次,进一步提出基于挑战-响应机制的方法用于抵御视频播放。受随机验证码的启发,系统发出的随机点序列是挑战,用户的视线行为是对应的响应。综合使用以上两种基于视线估计的活体检测方法可以有效识别和抵御人脸活体检测中的照片和视频播放攻击,为活体检测提供了一种新的思路。 4、基于镜面反射和关键点区域变化的活体检测。针对单一人脸线索不能同时应对多种攻击的问题,本文提出了一种基于混合线索的活体检测方法,该方法在得分层面上对两种线索进行融合。首先,实现了一种基于镜面反射的人脸描述子,并基于支持向量机获取模型得分。其次,提出一种描述人脸非刚体运动的特征描述子,用于表征人脸图像序列的运动状态。并且基于贝叶斯理论定义了和该描述子有关的模型得分。最后,提出了基于得分对齐的融合策略。该融合方法有效增加了能够同时应对的攻击人脸形式,提高了活体检测的识别率。 5、基于指令选择的活体检测。鉴于仅依靠分析人脸线索并不能完全区分合法用户与攻击者,本文关注了基于系统指令和用户配合的活体检测方法。针对该类方法中无法确定系统指令个数这一问题,提出了基于指令选择的活体检测方法,旨在综合考虑系统识别准确率和用户体验。该方法通过在损失函数的基础上加入基于群组的指令稀疏项构造指令选择学习模型实现指令的选择。提出的方法首次在人脸活体检测方法中加入用户体验的因素,在实际应用中具有一定的指导意义。