论文部分内容阅读
随着计算机视觉的迅速发展,人脸检测和人脸识别技术已经成为计算机视觉领域中的热门研究问题。人脸特征是人的重要生物学特征之一,通常可以传递非常多的信息,比如性别,年龄,情绪,种族等。年龄信息作为一种重要的人体生物特征,在人机交互、安全监控、视频检索等领域都有着巨大的应用潜力。基于人脸图像的年龄估计技术已成为计算机视觉、模式识别领域的重要问题。近几年,卷积神经网络在图像分类、语义分割、物体检测等多种场景下取得了巨大的进展,大量的有标记的训练集数据是卷积神经网络成功的因素之一。但是在人脸年龄估计问题上收集到充足且精确的有标记训练集数据是有困难的。因此有必要研究如何充分利用有限的有标记训练数据进行视觉识别任务的训练。图像增强是扩充训练数据集的一种办法。现有图像增强方法较少,有简单的图像水平翻转,图像随机裁剪,对图像添加随机噪声等。本论文基于显著图提出一种新的无监督的数据增强方式,进行图像的增强。另外现在已有很多应用广泛的网络结构,比如ZF网络,VGG网络等,应用在图像识别任务。考虑到人脸年龄图像的标记分布不均衡,所以在现有网络结构基础上,针对老年群体进行卷积神经网络的迁移学习,进一步提高人脸年龄估计能力。本论文的贡献有:(1)基于显著图提出一种新的无监督的图像增强方法,进而扩充图像数量。通过分割出图像的前景和背景,将背景置为随机噪声、图像均值、全黑、全白,得到增强的图像数据,增强卷积神经网络对图像背景的去冗余功能。另外,该无监督的图像增强方法不仅适用于人脸年龄估计任务,还可以应用到其他视觉任务中。(2)使用网络迁移学习方法,解决人脸年龄估计数据集中存在的类别不均衡问题,提高了人脸年龄估计能力。通过实验图像增强和网络微调的有效性,在两个人脸年龄估计数据集上都达到了最优的效果。