论文部分内容阅读
随着现代社会信息化发展的加速,信息安全和准确高效的身份认证问题被推到了很重要的位置,传统的依靠口令或物理介质的身份识别技术已经满足不了当前需求。人脸识别作为生物识别的一种,因其唯一性及难以复制等特性被广泛应用于视频监控、金融产品、安防、军事等领域。现实生活中,许多因素会给人脸识别造成影响,例如背景复杂、光照、人脸表情多变、遮挡、年龄变化等问题。这要求算法对外界因素具有一定的鲁棒性,除了上述问题,人脸识别应用中常存在无法获取单个类别的足够多训练样本的情况,在人脸样本量不足的情况下很难学习到有效特征。稀疏表示在图像处理和模式识别中有广泛的应用,协同表示具有代数解,大大减少了计算量而识别性能相当,因此本文研究了基于协同表示的人脸识别算法,将多尺度协作表示与局部结构相结合,在训练样本数目较少时具有优异的识别性能。与传统方法相比,深度学习无需人工提取特征,某种程度上减少了特征的丢失,其中卷积神经网络在图像识别方面的能力尤为突出,因此本文研究了卷积神经网络的理论知识,在现有卷积神经网络上加以改进并提出了适用于人脸识别的网络结构。本文主要工作如下:(1)协作表示在小样本情况下的算法性能会受到严重影响。多尺度块协作表示算法能有效集成不同尺度下的分类结果,但其分类框架中子块的计算是相互独立的,忽视了块与块之间的结构关系。而局部结构法将图像划分成多个局部区域,每个局部区域的重叠块分布在相同的线性子空间中,该子空间可以反映块之间的相互结构关系,能有效提高多尺度块协作表示在小样本下的识别精度。实验表明基于局部结构的多尺度块协同表示在训练样本数目较少时能够有效提高识别精度。(2)当无法获取单个类别足够多训练样本时,利用深度学习的方法很难学习到有效的特征,导致网络模型的识别性能不尽理想。因此,本文提出了基于孪生卷积神经网络的小样本人脸识别算法。①设计并搭建了一个全新的孪生网络模型SiameseFace1。以人脸图像对作为孪生网络的输入,将输入图像对映射到目标空间,使得其在目标空间的L2范数距离能够表征输入空间的语义距离。该映射是通过监督学习得到的神经网络来表达。实验结果表明在不使用外部数据集情况下,SiameseFace1在AR数据集和LFW数据集都达到了很高的准确率。设计并搭建了另外一个全新而且更加轻量级的孪生网络模型SiameseFace2。该模型的网络结构更加优化,使用了 1*1的卷积核,降低了计算的复杂度;并把底层的特征引出,与高层的特征进行级联,使得该模型的准确率较高。SiameseFace2不仅大幅减少了网络模型参数,而且没有损失人脸识别精度。②目前公开的人脸数据集中,每个类别的人脸样本数目相对较少,对于深度学习而言,没有充足的数据难以训练出一个优秀的网络模型。面对以上的限制,本文提出了新的训练数据生成算法,间接极大的扩展了 AR和LFW的单个类别的训练样本数量,一定程度上缓解了单个类别人脸图像较少的缺陷。利用该数据生成方法,显著提高了模型的识别精度。③本文尝试了多个不同的损失函数,包括三元组(Triplet)损失函数、平方损失函数、余弦损失函数以及本文所使用的对比损失函数。通过对比试验,最终挑选出与本文框架搭配性能最好的损失函数。