基于深度学习的自动人脸年龄估计研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:clys1986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
年龄作为一种重要的人脸属性,在人机交互、智能商务、安全监控和娱乐等领域都有着广阔的应用前景。自动人脸年龄估计作为一种重要的生物特征识别技术,目前已经成为模式识别和计算机视觉领域内一个热门的研究课题。人脸年龄估计问题的定义是指采用计算机视觉等技术根据输入的人脸图像自动估计出其真实年龄。虽然大量的研究者为解决年龄估计问题付出了艰辛的努力,但该问题远远没有得到解决且仍然面临着许多严峻的困难和挑战。  首先,人的成长是一个连续且缓慢变化的过程,因此,年龄相近的人脸之间的表观差异较小,这导致人工设计有判别力的年龄特征来刻画这些细微的差异是非常困难的;其次,收集大量带有年龄标签的人脸数据是非常昂贵且耗时的,因此,大多数公开的年龄估计数据集都存在样本数量少和年龄分布不均衡的问题,这大大增加了年龄估计算法的训练难度;除此之外,不同种群,也就是说,不同性别、种族的人的年龄成长模式是不同的,这也给年龄估计带来了很大的困难。  本文基于深度学习技术并围绕年龄估计问题中的上述难点开展了一系列原创性研究,提出了多种有效的深度年龄估计算法。本文的主要工作和贡献概括如下:  提出了一种混合式多任务深度年龄估计模型。传统的年龄估计算法一般包含两个步骤:第一步是提取人工设计的年龄特征,第二步是利用提取到的特征进行年龄估计模型的训练。这两个步骤是相互独立的,因此模型的性能非常依赖于提取到的年龄特征的好坏。近年来,深度学习在各大主流的计算机视觉任务中都取得了突破性的进展,这得益于其端到端学习特征和分类器的能力。为了克服人工设计年龄特征的困难,我们首次且系统地分析了如何更好地将深度学习应用于年龄估计问题。具体来说,我们从一个简单的基准网络架构开始,逐步地分析了三种不同的年龄估计问题的形式化方式、五种不同的损失函数和三种不同的多任务网络架构。实验结果表明,我们提出的混合式多任务深度年龄估计模型的性能最好,并且在两个较大的年龄估计公开数据集上都取得了当时最好的性能。  提出了一种基于累积与对比监督信号的深度年龄估计模型。该模型可以用来缓解年龄估计数据集的年龄分布不均衡和样本数量少的问题。首先,我们设计了一种累积隐含层和累积监督信号,即使某年龄所对应的样本数量较少,通过该累积信号网络可以从该年龄的邻域样本中隐式地进行学习,因此可以大大缓解年龄分布不均衡的问题。接下来,我们又设计了一种对比排序层和对比监督信号来辅助网络学习更有判别力的年龄特征,从而进一步提高年龄估计的准确性。对比监督信号是基于样本对的信息定义的,由于同一个样本可以出现在不同的样本对中,这使得网络可以更加充分地利用数据,因此可以在一定程度上缓解年龄估计数据集的样本数量少的问题。我们在两个较大的年龄估计公开数据集上验证了该模型的有效性。  提出了一种基于代价敏感和序列保持特征学习的深度跨种群年龄估计模型。为了消除性别和种族因素对年龄估计的影响,通常的做法是为每一个种群分别训练一个单独的年龄估计模型,但是为每个种群都收集足量的训练数据是非常困难的。在实际场景中,最可能的情况是:有些种群的样本比较充足,有些种群的样本较少。如果能利用某种群(源种群)已有的大量数据来提高模型在只拥有少量数据的目标种群上的年龄估计性能,这样就可以免去为目标种群收集更多样本的麻烦,我们设计了一种深度跨种群年龄估计模型来达到该目的。具体来说,我们的模型分为两个训练阶段:首先,在源种群的训练集上通过代价敏感的多任务损失来学习可迁移的底层年龄特征;接下来,通过序列保持的特征对齐将源种群和目标种群的高层年龄特征映射到一个统一的年龄特征空间中去。经过这两个阶段的训练,网络可以成功地将从源种群中学到的知识迁移到目标种群中去,进而得到一个在源种群和目标种群上效果均优的深度年龄估计模型。我们在两个较大的年龄估计公开数据集上验证了该深度跨种群年龄估计模型的有效性。  总的来说,本文从不同的角度较好地解决了人脸年龄估计任务中的一些主要难题,提出的算法大幅提升了人脸年龄估计的性能,并在多个人脸年龄估计公开数据集上都取得了当时最好的结果。与此同时,本文提出的人脸年龄估计算法已经在华为技术有限公司得到了实际应用,取得了一定的经济效益。
其他文献
我国的中小型离散企业管理基础薄弱,在市场竞争上处于弱势,业务形态灵活多变,从业人员的整体素质不高,给企业管理带来不小的挑战。为此中小型离散企业必须进一步整合企业自身
炼钢生产是钢铁生产过程的关键环节,也是现代钢铁企业的核心工序,直接影响着钢铁生产成本和经济效益。如何实现炼钢调度计划的优化编制,达到降低生产成本、减少损失、平衡物流、
近年来,智能仿生腿是机器人学、生物医学工程学和康复工程学领域一个备受关注的研究课题。由于战争、疾病、工伤、交通事故及自然灾害等原因,致使数以百万的人失去下肢,人们
双足机器人是一种可模拟人类双腿行走的高级智能机器人,具有代替人类在危险环境下进行重复工作的潜力。但对于非正常行走,如残障人士的步行运动,则不能完全模拟。智能假肢研
我国赤铁矿品位普遍较低,选别难度大,无法直接采用常规的磁选方法获得合格的精铁矿。赤铁矿选矿工业中,需首先将其在竖炉中进行高温还原磁化焙烧,将弱磁性矿物变成强磁性矿物
遥感图像变化检测技术在国土资源规划管理、自然灾害监测、军事目标打击效果评估等军民领域都具有重要的应用价值。通过高分辨率遥感图像可以检测到更加详细的变化信息,因此高
学位
我国蕴藏着大量的低品位有色金属资源,随着国民经济的快速增长,我国工业化进程的不断推进,如何经济有效地利用这类矿产资源,对我国的可持续发展战略具有极其重要的意义。作为
压电式微力传感器的低能耗、高灵敏度、易于与压电微执行器集成等优点使其具有良好的应用前景。压电式微力传感器的研究尚处于起步阶段,本文以基于PVDF薄膜的微力传感器为研
通用模型控制(CMC)是在一般模型控制(GMC)基础上,直接利用非线性过程,将非线性模型直接嵌入控制器中,在控制量不受约束的情况下,将非线性系统变为一个标准二阶线性系统。为了克服
智能车作为移动机器人的一种,是一个集环境感知、规划决策、自动驾驶等多种功能于一体的综合系统。为了提高智能车跟踪和运动性能,本文在分析智能车系统原理的基础上,从硬件