基于关键表情区的面部表情识别方法研究

来源 :辽宁大学 | 被引量 : 0次 | 上传用户:aaa6862876
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着人工智能的兴起,人们越来越希望机器可以更加智能地提供更加方便快捷的定制式服务,智能机器的一个重要的功能就是智能人机交互,因此,智能人机交互的需求在不断增大,面部表情识别是实现智能人机交互的重要途径,而卷积神经网络在图像处理方面有着极强的性能,近几年基于CNN进行面部表情识别(Facial Expression Recognition,简称FER)的研究一直从未间断,并且取得很多的成果,极大的推动了面部表情识别研究的发展。目前,基于神经网络的面部表情识别方法存在一些局限性,从而导致以往研究的实际应用受到限制,例如:已有的面部表情识别方法基本上是基于实验控制环境下的正面面部表情识别,而在开放环境下,或者说是变化比较大的原生环境中,其泛化性能较差,甚至会出现不能使用的情况。具体来说,当前基于神经网络的面部表情识别方法的局限性主要表现在三个方面:(1)没有考虑到表情特征信息强度和面部不同区域的关系,直接使用面部识别的方法,笼统地对整张人脸提取表情特征,用于面部表情识别,而面部表情特征集中在眼睛和眉毛、嘴巴和鼻子下部这些区域,本文称这些区域为关键表情区,其对表情识别更具有价值。(2)部分相关工作考虑了关键表情区,但将关键表情区的提取和使用分成两个独立的阶段,这让整体模型的性能不可控。(3)当前采用关键表情区进行表情识别的方法,对于面部图片有着一定的特定要求,如[8][22]等,当要求不满足时,模型不能使用。为了突破以往面部表情识别研究的局限,本文基于关键表情区进行面部表情识别,提出了解决办法,并进行实验验证。本文主要研究内容如下:本文针对前两个局限,分析面部表情分类精度和关键表情区边界之间的相互关系,提出了表情识别和关键区域边界框回归混合预训练方法;分析了同类面部表情图片,面部表情识别模型预测的表情概率分布状况和模型性能的关系,提出了基于缩小类内输出差异的模型微调方法;最后将两者整合,形成了针对表情识别模型训练的两阶段训练方法。在两阶段训练方法研究的基础上,本文同时针对以往表情识别研究的三个局限,对本文提出的面部表情识别模型两阶段训练方法和以往的融合表情识别方法的进行分析,在基于关键区域进行面部表情识别的前提下,进一步提出一个关键表情区判别模型,以产生关键表情区掩膜图像,降低对面部表情图片质量的要求,提出了一个双通道特征融合模型,以提高表情特征提取能力,引入一个关键表情区重合度的概念,将这两个模型的训练过程整合,形成了端到端的基于特征融合的双通道面部表情识别模型。对本文提出的针对表情识别模型训练的两阶段训练方法、基于特征融合的双通道面部表情识别模型分别进行实验,使用两阶段训练算法训练出来的模型在CK+上的识别精度达到93.59%。基于特征融合的双通道面部表情识别模型在CK+和FER2013上的识别精度分别达到94.63%、72.59%,这基本达到当前较好表情识别方法取得的结果。
其他文献
视觉工作记忆在人类知觉活动中有着重要的作用。近年在工作记忆的研究中,主要集中在个体的工作记忆表征精度与容量上,以及它们的个体差异。而快速且有效的探测到威胁刺激对人类的生存至关重要,个体对威胁刺激的工作记忆表征精度和容量的加工目前还鲜有探讨。目前,针对工作记忆精度和容量的研究多采用颜色延迟估计任务,通过对标准色块与被试所选择色块在色环上的误差值进行模型拟合,可以得到其在不同条件下对回忆任务的真实反应
极端气候条件影响牲畜生产,引起蒙古牧民牲畜死亡。利用2017年2月在蒙古Southgobi和Khentii省的实地调查资料,考察天气灾害对蒙古牧民牲畜死亡率和畜牧业的影响,评估极端天气
移动互联网时代的到来,催生了“互联网+广播”这一新的商业模式,广播这一传统大众媒介又重新走入人们的生活,移动电台APP凭借其移动性、个性化、社交属性等优势发展迅猛。对
三峡葛洲坝船闸自上世纪通航以来,承担着重要的通航任务,其运行安全问题关系到长江中上游的航运功能。在复杂水域中,船闸人字门在复杂水域中启闭频繁,长期在重载低速的工况条
旅游业并非是一个“零污染”产业,人们在旅游过程中必然会消耗一定的自然资源。大量的化石燃料消耗必然导致二氧化碳的迅速排放,从而进一步加剧温室效应。改革开放40多年来,我国沿海地区凭借丰富的旅游资源和便利的交通优势,旅游业得以迅速发展,但同时也带来了旅游资源不断消耗、环境破坏等问题。因此,研究旅游过程中二氧化碳的排放量、旅游业生态效率核算及其变化规律和影响机制等问题,不仅可以有效改善生态环境,提高我国
面临矿井采掘接续紧张的难题,迎回采面掘进是十分有效的施工方法,而在迎回采面掘进巷道的围岩稳定性控制方面是亟需解决的技术难题,本文以白芦煤矿迎着4307工作面回采时,进行4308工作面回风、运输顺槽掘进为研究背景,采用有限元分析软件FLAC3D进行数值分析了不同煤柱宽度、掘进时期以及两次工作面回采过程中4308工作面回风、运输顺槽围岩变形特征,得到了相对合理的区段煤柱宽度,确定了4308回风顺槽以及
重点生态功能区承担着涵养水源、保持水土、维持生物多样性及调节区域气候等重要的生态系统服务功能,农户作为该区最主要的经济活动主体,其对生态系统服务功能的感知及选择偏
金融行业是维持国家经济运行的非常重要的行业,金融业大致分为四类、银行、保险、证券和信托,而银行是金融业的重中之重,银行业的经营运行情况直接影响着一个国家、地区的经
股权质押是指以公司的股权为担保进行融资的一种行为。股权质押能够缓解公司在发展过程中面临的融资问题,增加公司的融资渠道,控制公司的融资成本,为企业发展提供资金支持。
换热器是一种用来进行热量交换的设备,普遍应用在工业生产、社会生活等多个领域;同时在节约能源、环境保护、降低消耗、提高工业生产过程的经济效益方面扮演着重要的角色。换