论文部分内容阅读
年龄作为一种重要的人脸属性,在人机交互、智能商务、安全监控和娱乐等领域都有着广阔的应用前景。自动人脸年龄估计作为一种重要的生物特征识别技术,目前已经成为模式识别和计算机视觉领域内一个热门的研究课题。人脸年龄估计问题的定义是指采用计算机视觉等技术根据输入的人脸图像自动估计出其真实年龄。虽然大量的研究者为解决年龄估计问题付出了艰辛的努力,但该问题远远没有得到解决且仍然面临着许多严峻的困难和挑战。 首先,人的成长是一个连续且缓慢变化的过程,因此,年龄相近的人脸之间的表观差异较小,这导致人工设计有判别力的年龄特征来刻画这些细微的差异是非常困难的;其次,收集大量带有年龄标签的人脸数据是非常昂贵且耗时的,因此,大多数公开的年龄估计数据集都存在样本数量少和年龄分布不均衡的问题,这大大增加了年龄估计算法的训练难度;除此之外,不同种群,也就是说,不同性别、种族的人的年龄成长模式是不同的,这也给年龄估计带来了很大的困难。 本文基于深度学习技术并围绕年龄估计问题中的上述难点开展了一系列原创性研究,提出了多种有效的深度年龄估计算法。本文的主要工作和贡献概括如下: 提出了一种混合式多任务深度年龄估计模型。传统的年龄估计算法一般包含两个步骤:第一步是提取人工设计的年龄特征,第二步是利用提取到的特征进行年龄估计模型的训练。这两个步骤是相互独立的,因此模型的性能非常依赖于提取到的年龄特征的好坏。近年来,深度学习在各大主流的计算机视觉任务中都取得了突破性的进展,这得益于其端到端学习特征和分类器的能力。为了克服人工设计年龄特征的困难,我们首次且系统地分析了如何更好地将深度学习应用于年龄估计问题。具体来说,我们从一个简单的基准网络架构开始,逐步地分析了三种不同的年龄估计问题的形式化方式、五种不同的损失函数和三种不同的多任务网络架构。实验结果表明,我们提出的混合式多任务深度年龄估计模型的性能最好,并且在两个较大的年龄估计公开数据集上都取得了当时最好的性能。 提出了一种基于累积与对比监督信号的深度年龄估计模型。该模型可以用来缓解年龄估计数据集的年龄分布不均衡和样本数量少的问题。首先,我们设计了一种累积隐含层和累积监督信号,即使某年龄所对应的样本数量较少,通过该累积信号网络可以从该年龄的邻域样本中隐式地进行学习,因此可以大大缓解年龄分布不均衡的问题。接下来,我们又设计了一种对比排序层和对比监督信号来辅助网络学习更有判别力的年龄特征,从而进一步提高年龄估计的准确性。对比监督信号是基于样本对的信息定义的,由于同一个样本可以出现在不同的样本对中,这使得网络可以更加充分地利用数据,因此可以在一定程度上缓解年龄估计数据集的样本数量少的问题。我们在两个较大的年龄估计公开数据集上验证了该模型的有效性。 提出了一种基于代价敏感和序列保持特征学习的深度跨种群年龄估计模型。为了消除性别和种族因素对年龄估计的影响,通常的做法是为每一个种群分别训练一个单独的年龄估计模型,但是为每个种群都收集足量的训练数据是非常困难的。在实际场景中,最可能的情况是:有些种群的样本比较充足,有些种群的样本较少。如果能利用某种群(源种群)已有的大量数据来提高模型在只拥有少量数据的目标种群上的年龄估计性能,这样就可以免去为目标种群收集更多样本的麻烦,我们设计了一种深度跨种群年龄估计模型来达到该目的。具体来说,我们的模型分为两个训练阶段:首先,在源种群的训练集上通过代价敏感的多任务损失来学习可迁移的底层年龄特征;接下来,通过序列保持的特征对齐将源种群和目标种群的高层年龄特征映射到一个统一的年龄特征空间中去。经过这两个阶段的训练,网络可以成功地将从源种群中学到的知识迁移到目标种群中去,进而得到一个在源种群和目标种群上效果均优的深度年龄估计模型。我们在两个较大的年龄估计公开数据集上验证了该深度跨种群年龄估计模型的有效性。 总的来说,本文从不同的角度较好地解决了人脸年龄估计任务中的一些主要难题,提出的算法大幅提升了人脸年龄估计的性能,并在多个人脸年龄估计公开数据集上都取得了当时最好的结果。与此同时,本文提出的人脸年龄估计算法已经在华为技术有限公司得到了实际应用,取得了一定的经济效益。