基于轻量级卷积神经网络的实时表情识别系统研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:doboho
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
面部表情识别可以广泛应用于各种研究领域,例如精神疾病诊断和人类社会生理互动检测。借助硬件和传感器方面新兴的先进技术,已经开发了面部表情识别系统来支持实际应用场景。虽然在实验室中的面部表情识别系统实现了高达97%以上的精度,但在实际应用中的识别技术准确率仅有50%左右,从实验室到实际应用的技术转移仍然存在巨大障碍。卷积神经网络的兴起为高精度的面部表情识别研究提供了新的方向,但卷积神经模型精度的提升需要构建深度和宽度的框架以及复杂的网络设计,这意味着需要非常长训练周期,并且由于深度和宽度过大会出现计算复杂度大、梯度弥散等问题。针对以上问题,本文对卷积神经网络的轻量化技术进行研究,旨在提高表情分类准确率,改善模型非线性表征能力的同时,减少参数量,满足实际应用的需要,主要做了以下工作:1)首先,系统地介绍了深度学习的表情识别理论,在着重解释卷积神经网络的网络结构和训练过程的同时,分析卷积神经网络目前存在的缺陷,引出轻量级卷积神经网络概念,开展卷积网络轻量化研究。2)针对自然采集的人脸图像具有不同光照、背景、姿势等特点,提出了以主成分分析特征图代替原始图像作为卷积模型的输入的方法;针对目前卷积神经模型结构复杂参数量大、层数过深收敛速度慢的问题,提出了一种PRe LU激活函数、逐点卷积以及全局平均池化结合的改进轻量级卷积神经网络方案。所提方法在JAFFE、FER2013公开数据集上进行实验验证,取得了较理想的效果。3)设计并实现了实时表情动画系统,通过普通摄像头获取每帧的原始人脸图像,进行图像预处理之后对表情图像进行分类识别,最后在Unity3D客户端中根据分类结果驱动3D模型实现3D模型的表情动画。本文的主要创新在于:1)提出了以主成分分析图作为卷积模型的输入。使用主成分分析法对原始采集图像进行处理,获取与表情识别至关重要的面部区域,去除无关的冗余信息。实验结果表明,该方法的分类准确率在JAFFE数据集和FER2013数据集上分别提高了1.83%和1.69%。2)提出了结合PRe LU激活函数、逐点卷积层以及全局平均池化层的改进轻量卷积模型。在输入层加入逐点卷积层提高模型非线性表征能力,每层加入PRe LU函数提高模型泛化能力,最后引入全局平均池化将特征图强制转化为特征向量,减少模型参数量并优化模型结构。实验结果表明,改进轻量卷积模型的识别精度比原始CNN在JAFFE和FER2013数据集上分别提高了1.6%和1.53%。将本文算法与其他主流识别算法比较识别精度亦有比较理想的结果。3)以本文在表情数据集上训练得到的轻量模型为基础,以Unity3D引擎作为平台,设计了一个简单的实时表情动画系统。共有人脸检测、表情识别、3D虚拟角色三大模块,将轻量模型嵌入表情动画系统中,通过控制台输出识别时间,识别时间稳定在16ms,表明模型达到了实时的效果。
其他文献
设G是一个无向连通图,V(G)和E(G)分别是图G的顶点集和边集.第一类Zagreb离心率指标定义为ξ1(G)=∑u∈V(G)eG2(u),第二类Zagreb离心率指标定义为ξ2(G)=∑uv∈E(G)eG(u)eG(v),其中eG(u)表示u点的离心率,即u到G中所有顶点的距离的最大值.Zagreb离心率指标是Zagreb指标的推广,在数学化学中有广泛应用.设C(n,k)表示顶点数为n,圈数为k
学位
任意微波波形信号被广泛应用于雷达通信、全光网通信、医学成像和现代仪器系统等领域,且波形质量很大程度上决定系统的性能。与在电子领域生成的波形信号相比,微波光子波形信号突破了20GHz的带宽限制,具有带宽高、频率可调范围大、抗电磁干扰等优点。利用外调制技术将低频信号以倍频方式产生高频毫米波信号,可避免使用价格昂贵的高频信号源以降低生产成本。为解决现阶段在电子领域生成波形信号重复频率范围小、带宽低且稳定
学位
学位
学位
学位
学位
Cu2ZnSnS4(CZTS)薄膜具有组成元素储量丰富、绿色环保、生产成本低廉、吸收系数高等优点,但CZTS薄膜太阳能电池的最高光电转换效率仅有12.62%。掺杂是一种改善CZTS薄膜光电特性的有效途径,采用两种元素对CZTS进行共掺杂可获得比单掺杂更有效的改善光学特性和电学特性的优势。目前,共掺杂对CZTS的作用机理仍未厘清,因此本文对开展共掺杂CZTS薄膜的制备、特性、掺杂作用机理研究。本文分
学位