基于迁移学习和特征融合的的人脸表情识别算法研究

来源 :武汉大学 | 被引量 : 0次 | 上传用户:whlibb2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸表情识别是人脸属性研究的重要领域之一,人脸表情识别的成果已经广泛应用于商业分析、安全驾驶、在线教育、智慧医疗等领域。因此,人脸表情识别的研究具有重大的意义。但是,传统的人脸表情识别算法需要手工设计特征提取方法,这导致特征的代表性不够、模型泛化能力差。其次,基于深度学习的人脸表情识别算法则主要提取图像的深层特征而忽略了图像的浅层特征和中层特征。而且,目前的表情识别数据集大部分是小型数据集,不足以支持训练大型卷积神经网络。为解决传统人脸表情识别算法的特征代表性不够,以及数据集小的问题,论文提出了基于迁移学习的人脸表情识别算法。根据迁移学习的理论以及相关的经验,论文将在Image Net数据集上预训练的Inception V3和Res Net50模型迁移到新的数据集KDEF和Ra FD,并搭建分类层构成新的网络模型。确定初次的学习率、优化器、数据预处理方式、模型训练方式后,根据实验结果修改参数得到不同的模型。通过实验结果分析找到当前数据集中准确率最高的模型。KDEF数据集中准确率最高的模型是KI21A121,准确率是93.77%,Ra FD数据集中准确率最高的模型是RI21A121,准确率是98.98%。为解决论文提出的基于迁移学习的人脸表情识别算法不具备提取图像浅层特征和中层特征的能力的问题,论文提出了基于迁移学习和特征融合的人脸表情识别算法。论文取在Image Net数据集上预训练的Inception V3或Res Net50模型的不同的层进行融合后,得到最终的特征提取层,与两层的全连接分类层组成融合后的新模型。融合后的Inception V3模型和Res Net50模型,在KDEF、Ra FD数据集的实验结果表明:融合后的模型的准确率高于融合前的模型准确率。融合后的模型KI20AFFF2在KDEF数据集上的准确率为94.48%,RI21AFF3在Ra FD数据集上的准确率为99.09%。最后,使用模型KI20AFFF2和RI21AFF3对KDEF、Ra FD数据集中随机抽取的图像进行识别,多次识别结果均正确,模型RI21AFF3的泛化能力优于KI20AFFF2。所以,使用RI21AFF3对真实人脸进行识别,多次识别结果均正确。
其他文献
近年来,微型动力装置具有体积小、输出能量密度大等优点,其利用碳氢燃料燃烧做功的方式引起了广大学者的关注。本课题组前期探讨了火焰淬熄问题、HCCI着火控制问题和如何实现低温燃烧等问题。基于此开展了相应的数值模拟与试验研究,如燃料掺混H2/CO2以降低装置内温度;采用催化压燃方式,分析未催化与催化的燃烧特性;搭建可视化试验台架,开展进气预热和催化燃烧试验。然而,在装置运行过程中由于换气不充分容易造成燃
研究背景:奥氮平是治疗精神分裂症的一线用药,其临床疗效和不良反应与血浆药物浓度相关。欧洲神经精神药理学会与药物精神病协会(ArbeitsgemeinschaftfurNeuropsychopharmakologie und Pharmakopsychiatrie,AGNP)最新指南强烈推荐对奥氮平进行治疗药物监测,然而目前国内临床医生对奥氮平用药仍以经验为主导,缺乏科学依据。研究目的:1建立一种高
传统进料辊与原木接触面积较小,导致进料辊对原木造成木质损伤。针对此问题,提出一种基于双V附翼型负泊松比蜂窝结构进料辊,建立了力学分析模型,并分析了原木接触面积耦合关系机理,确定蜂窝胞元结构参数与原木接触面积的关系。本文的主要工作为:(1)通过林木采育机进料辊在伐木生产作业中的受承载分析,介绍了双V附翼型负泊松比蜂窝结构胞元在受Y方向载荷时其胞元壁的变形机理,建立了在Y方向上胞元关于等效应力的理论模
学位
学位
学位
学位
文章基于2015—2019年沪深A股上市公司数据,实证分析了真实盈余管理对投资效率影响,以及高管薪酬激励和高管股权激励在真实盈余管理对投资效率影响中的调节效果。结果表明:真实盈余管理降低了企业的投资效率,而高管薪酬激励和高管股权激励均能抑制真实盈余管理导致的非效率投资。进一步分析发现:相比真实盈余管理水平较低的企业,在真实盈余管理水平较高的企业中,高管薪酬激励和高管股权激励均能显著抑制真实盈余管理
近年来,机器学习技术的发展促进其在众多的现实任务中得以应用,学习系统对环境中未知因素的鲁棒性已成为其核心需求之一。本文关注机器学习中的“未知类”问题,即环境中可能存在学习者未知的类别。学习者不仅无法观测到这些类别的样例,甚至没有意识到它们可能存在。本文对此进行研究,主要取得了以下创新成果:1.提出了一种基于分布判别的未知类学习方法Eulac。该方法通过比较训练数据与环境数据特征分布的差异来判别环境
调频连续波激光雷达通过处理接收信号和发射信号之间的差拍频信号来得到目标的距离信息,且用于测量目标的距离和速度的性能与环境光条件无关,不需要额外的辅助光源提供照明。常用的调频连续波有正弦型、锯齿波、三角波等调制方式,其中三角波调制连续波可以在上升沿和下降沿阶段进行距离测量,并利用正负调频斜率来消除距离和速度信息的耦合,从而进行目标速度的测量。调频连续波激光雷达具有容易实现、结构相对简单、尺寸小、重量