论文部分内容阅读
卷积神经网络(Convolutional Neural Network,CNN),是一种比较独特的深层神经网络模型,是由人工神经网络和深度学习网络合并产生的一种新型的人工神经网络。目前,其在计算机视觉领域获得了较优的成绩。而人脸识别问题,在实际应用中由于无约束环境下背景、照明、姿态和面部表情等因素的影响,存在一定的难度。因此,近几年以CNN为手段,进行特征提取的人脸检测算法不断被提出,可以很好的解决野生数据集中准确率不高的问题,并取得了不错的效果。本文基于CNN的构建模式,设计了一种多尺度融合卷积神经网络(MSF-CNN)结构,用来训练人脸检测器。CNN作为一种特征提取方式,具有主动学习能力。所以本文在设计网络结构时,充分发挥了其自主学习特征的能力,将中间层输出分为三个通道进行卷积操作,并且每个通道设置数量、尺寸各不相同的卷积核,得到样本三个尺度的卷积特征;然后将不同尺度的特征通过归一化后按比例融合;最后与分类层相连训练分类器。该方法的主要贡献为:(1)模型提取的多尺度特征包含更多有用的信息,使分类精度要高于单尺度。(2)与级联的CNN模型相比,规模变小,复杂度降低。(3)实现端到端的训练,无需像级联结构一样,分别训练多个CNN模型。实验表明,本文设计的MSF-CNN模型在公开数据集上的性能比现有的一些检测算法好。人脸检测与性别识别都是二分类任务,但却有一定的差异,前者的分类任务,人脸和背景存在较大差别,但对于后者来说,男女之间的相对差别没有前者大。因此在解决性别识别问题时,需要将局部特征和整体特征相结合,才能训练一个性能好的分类器。本文通过在性别数据集上微调MSF-CNN模型,使该模型用于提取深层整体特征;然后选择一个简单的浅层S-CNN模型,用于提取性别样本的浅层局部特征。通过SVM算法将合并的局部特征和整体特征进行分类学习。实验表明,基于MSF-CNN模型改进后的方法在性别分类任务上取得了不错的效果,优于部分性别识别的方法。