论文部分内容阅读
面部表情识别可以广泛应用于各种研究领域,例如精神疾病诊断和人类社会生理互动检测。借助硬件和传感器方面新兴的先进技术,已经开发了面部表情识别系统来支持实际应用场景。虽然在实验室中的面部表情识别系统实现了高达97%以上的精度,但在实际应用中的识别技术准确率仅有50%左右,从实验室到实际应用的技术转移仍然存在巨大障碍。卷积神经网络的兴起为高精度的面部表情识别研究提供了新的方向,但卷积神经模型精度的提升需要构建深度和宽度的框架以及复杂的网络设计,这意味着需要非常长训练周期,并且由于深度和宽度过大会出现计算复杂度大、梯度弥散等问题。针对以上问题,本文对卷积神经网络的轻量化技术进行研究,旨在提高表情分类准确率,改善模型非线性表征能力的同时,减少参数量,满足实际应用的需要,主要做了以下工作:1)首先,系统地介绍了深度学习的表情识别理论,在着重解释卷积神经网络的网络结构和训练过程的同时,分析卷积神经网络目前存在的缺陷,引出轻量级卷积神经网络概念,开展卷积网络轻量化研究。2)针对自然采集的人脸图像具有不同光照、背景、姿势等特点,提出了以主成分分析特征图代替原始图像作为卷积模型的输入的方法;针对目前卷积神经模型结构复杂参数量大、层数过深收敛速度慢的问题,提出了一种PRe LU激活函数、逐点卷积以及全局平均池化结合的改进轻量级卷积神经网络方案。所提方法在JAFFE、FER2013公开数据集上进行实验验证,取得了较理想的效果。3)设计并实现了实时表情动画系统,通过普通摄像头获取每帧的原始人脸图像,进行图像预处理之后对表情图像进行分类识别,最后在Unity3D客户端中根据分类结果驱动3D模型实现3D模型的表情动画。本文的主要创新在于:1)提出了以主成分分析图作为卷积模型的输入。使用主成分分析法对原始采集图像进行处理,获取与表情识别至关重要的面部区域,去除无关的冗余信息。实验结果表明,该方法的分类准确率在JAFFE数据集和FER2013数据集上分别提高了1.83%和1.69%。2)提出了结合PRe LU激活函数、逐点卷积层以及全局平均池化层的改进轻量卷积模型。在输入层加入逐点卷积层提高模型非线性表征能力,每层加入PRe LU函数提高模型泛化能力,最后引入全局平均池化将特征图强制转化为特征向量,减少模型参数量并优化模型结构。实验结果表明,改进轻量卷积模型的识别精度比原始CNN在JAFFE和FER2013数据集上分别提高了1.6%和1.53%。将本文算法与其他主流识别算法比较识别精度亦有比较理想的结果。3)以本文在表情数据集上训练得到的轻量模型为基础,以Unity3D引擎作为平台,设计了一个简单的实时表情动画系统。共有人脸检测、表情识别、3D虚拟角色三大模块,将轻量模型嵌入表情动画系统中,通过控制台输出识别时间,识别时间稳定在16ms,表明模型达到了实时的效果。