人脸属性识别中的关键问题研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:ggtand007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸属性识别在人机交互、安防系统等众多领域有着广阔的应用前景,受到了研究者们的广泛关注,已成为计算机视觉和模式识别领域的热点研究课题。目前,由于样本多样性、数据收集困难等问题都对人脸属性的识别算法提出了重重挑战,从而限制了其在实际场合中的应用与推广。本文对人脸属性中的活体检测、年龄估计和表情识别课题的关键问题进行了探索和研究。主要工作和贡献有:  1、基于判别高斯过程隐变量模型的年龄估计。受到基因、生活习惯等多种内外因素的影响,不同个体的年龄发展模式截然不同。本文提出了一种基于流形学习的年龄估计方法,旨在从不同用户的大量数据中挖掘出可能潜在的年龄模式。主要贡献为:在判别高斯过程隐变量模型的基础框架上加入隐变量的基于广义判别分析的先验信息,从而将其从解决线性可分问题推广到线性不可分问题—年龄估计。  2、基于多形状对齐的表情识别。针对表情识别中的几何多样性问题,即不同个体对同一种表情的表达程度不同,甚至同一个体在不同时间不同场景下也不同,本文提出了一种基于多形状对齐的表情识别方法,旨在减少几何多样性的同时尽可能地保持不同表情类别下个体的差异性。该方法首先通过不同表情类别的样本获取相应的平均形状,进而基于多个平均形状进行加权投票获取最后的表情类别预测。和传统基于单一人脸形状模板相比,基于多形状模板的方法充分利用了不同表情的特点,有效提高了表情识别的准确率。  3、基于视线估计的活体检测。首先从单一人脸线索出发,基于合法用户的视线具有不可预测的特点,提出了基于视线估计的活体检测方法。该方法预先建立屏幕中多个视点的视线估计统计模型,进而通过估计用户的视线行为进行活体判断。提出的方法包括两种框架,分别用于处理照片与视频播放的识别和抵御。首先提出了基于信息熵的方法用于抵御照片攻击,该方法采用信息熵指标来衡量用户在短时间内视线行为的不确定程度。其次,进一步提出基于挑战-响应机制的方法用于抵御视频播放。受随机验证码的启发,系统发出的随机点序列是挑战,用户的视线行为是对应的响应。综合使用以上两种基于视线估计的活体检测方法可以有效识别和抵御人脸活体检测中的照片和视频播放攻击,为活体检测提供了一种新的思路。  4、基于镜面反射和关键点区域变化的活体检测。针对单一人脸线索不能同时应对多种攻击的问题,本文提出了一种基于混合线索的活体检测方法,该方法在得分层面上对两种线索进行融合。首先,实现了一种基于镜面反射的人脸描述子,并基于支持向量机获取模型得分。其次,提出一种描述人脸非刚体运动的特征描述子,用于表征人脸图像序列的运动状态。并且基于贝叶斯理论定义了和该描述子有关的模型得分。最后,提出了基于得分对齐的融合策略。该融合方法有效增加了能够同时应对的攻击人脸形式,提高了活体检测的识别率。  5、基于指令选择的活体检测。鉴于仅依靠分析人脸线索并不能完全区分合法用户与攻击者,本文关注了基于系统指令和用户配合的活体检测方法。针对该类方法中无法确定系统指令个数这一问题,提出了基于指令选择的活体检测方法,旨在综合考虑系统识别准确率和用户体验。该方法通过在损失函数的基础上加入基于群组的指令稀疏项构造指令选择学习模型实现指令的选择。提出的方法首次在人脸活体检测方法中加入用户体验的因素,在实际应用中具有一定的指导意义。
其他文献
随着互联网、智能手机和通信技术的迅速发展,互联网(包括移动互联网)上多媒体数据快速增长。文字作为一种普遍使用的交流工具,经常被人工添加到图像中以传递信息,并在网络(例如:微
针对BTT导弹控制系统的特性,本论文基于线性系统理论中的特征结构配置和模型跟踪方法,提出了鲁棒控制方法和可抑制抖动的多模型切换控制方法。 本文针对某型号BTT导
视频压缩编码是多媒体应用的关键技术。视频编码预处理,是指对视频原始数据进行处理,使之满足实际的视频编码的输入要求。视频编码预处理技术,是视频压缩编码的重要技术之一
锌钡白干燥煅烧过程是锌钡白生产最为关键一道工序,原锌钡白干燥煅烧转窑的控制由经验丰富的操作工人手动调节,这种调节方式取决于工人的经验和责任心,且调节存在比较大的滞后,造
从单张二维人脸照片中重建精确的三维人脸是计算机视觉领域里的一个重要并且具有挑战性的目标,其在人脸识别、年龄估计、人脸表情识别以及情感估计等领域具有重要的作用。三维
如何让机器人实现高精度、高柔顺性的操作,是机器人研究领域长期关注的问题。在机器人学与控制科学、机构学、材料学和计算机科学等交叉领域,已从不同角度对这一问题进行了研究
行人再辨识是多摄像机视频监控中的一个重要任务,其目标在于将多路摄像机在不同时间和地点捕捉到的行人进行自动关联,为行人目标的行为和活动推理分析提供基础。在视频监控中,不
随着机器视觉和图像处理技术的不断发展,视觉目标检测、跟踪及测量技术得到了广泛应用。在航空航天领域中空中目标的视觉检测、跟踪及测量日益受到重视,特别是在空中复杂条件下
本文旨在用智能控制的理论和方法设计特性良好的混沌同步控制方案,并基于DSP进行混沌同步语音保密通信的研究。首先简要分析了现有混沌同步的主要智能控制方案和混沌同步用于
在最近的几年中,计算机技术得到飞速的发展,嵌入式设备使用的芯片主频已经达到400MHz以上,使移动设备具备了进行一定程度的音视频的编解码的能力。无线通信技术也从普通的提