论文部分内容阅读
自深度学习、大数据、云计算等技术不断成熟以来,人工智能就成为当前最热门研究课题之一。面部表情识别作为人工智能重要分支之一,通过智能计算让机器识别用户的情感状态,在增强人机交互的智能化和友好化方面具有巨大而深远的意义。本文着重从多维度的角度分析面部表情识别,这里的多维度指的是平面维度和时序维度。主要工作如下:(1)平面维度的面部表情的研究对象是静态单张的面部表情图像,其内容一般是某一种表情情感表达最丰富的时刻。利用深度学习网络处理平面维度的面部表情,是目前最有效的解决方法。然而,深度学习确有一个致命问题,就是模型的训练需要有大规模数据的支持,否则极易出现过拟合问题。通过认真观察,我们发现不同人脸的相同区域在同一种表情下具有相似的情感特征,因此如果替换同种表情的不同人脸的相同区域,那么新生成的人脸则也具有该表情的情感特征。因此,针对现有的公开数据集,本文设计和构建了一种面部局部替换的生成对抗网络模型,用于增强训练数集。该生成模型通过替换不同人脸的兴趣特征区域,融合成新的具有情感特征的人脸图像,消除面部身份特征,扩充训练数据集的规模,从而达到提高深度模型的鲁棒性的目的。同时,该生成网络的最大优势是可以处理Wild面部数据集。(2)时序维度的面部表情的研究对象是的连续变化的面部表情图像序列,需要注意的是这里研究的表情序列只包含一种表情的变化。动态序列表情识别因为其不仅要提取图像的空间域特征,还要考虑空间域在时间维度的上的变化特征,想较于静态单张表情识别在数据维度与特征维度上要复杂得多。本文设计和构建了一种动态序列的面部表情识别模型,该模型将浅层特征和深层特征与注意机制相结合。为了提取浅层特征,提出了一种利用面部标志的相对位置和面部局部区域的纹理特征来描述面部动作编码系统的动作单元的浅层注意力模型。同时,利用深度卷积神经网络在表达高层语义特征方面的优势,用来提取序列人脸图像上的深层特征。最后,将浅层模型和深度模型集成到多注意浅层和深层模型中,以完成动态序列面部表情识别。我们在CK+,MMI和Oulu-CASIA这三个可公开获得的数据库上验证了我们的动态表情识别系统,并获得了比其他最新结果更好的性能。