【摘 要】
:
现有很多基于深度学习的方法在约束环境下表情数据集上具有很好的识别性能,然而,真实环境下的人脸表情识别仍然面临着很大的挑战。这个挑战主要来源于三个方面:一是采集差异,二是表达差异,三是识别难度差异。现有工作大多关注于解决前两个问题,如,通过采用合适的预处理(人脸校准、直方图均衡化等方式)来缓解采集差异问题,采用网络集成策略来解决表达差异问题等。针对已有网络集成策略中存在的效率低下问题,本文首先提出一
论文部分内容阅读
现有很多基于深度学习的方法在约束环境下表情数据集上具有很好的识别性能,然而,真实环境下的人脸表情识别仍然面临着很大的挑战。这个挑战主要来源于三个方面:一是采集差异,二是表达差异,三是识别难度差异。现有工作大多关注于解决前两个问题,如,通过采用合适的预处理(人脸校准、直方图均衡化等方式)来缓解采集差异问题,采用网络集成策略来解决表达差异问题等。针对已有网络集成策略中存在的效率低下问题,本文首先提出一种自动实现的网络选择方法,用于从多个候选网络中选出能使集成性能互补的最优网络集合。为了解决识别难度差异问题,本文利用最优网络集合的验证结果确定数据集中的复杂表情类别。接下来,为了改善复杂表情类别的识别准确率,本文提出了一种用于动态收集复杂表情样本的网络迭代训练方法。实验结果表明,迭代训练方法不仅缓解了数据不平衡问题,而且显著提高了网络对复杂表情类别的识别准确率。因此,改善了平均识别性能。考虑到表情识别是一个细粒度的分类问题,本文认为注意力机制能帮助进一步改善识别性能。因此,基于迭代训练阶段更新后的训练数据集,本文进一步探索了注意力机制对表情识别性能的影响。本文提出了一个面向人脸表情的注意力模块,该模块中包含一个无任何可训练参数的通道注意力单元和有轻量级参数的空间注意力单元。实验结果表明,与最新的注意力模块相比,本文提出的注意力模块更适用于真实环境下人脸表情识别问题。最后,本文也通过可视化实验分析了提出的注意力模块在表情识别中所起的作用。
其他文献
随着我国航天器运行数量的增长,空间碎片也越来越多,太空中越来越恶劣的碎片环境对我国航天器在轨运行的安全带来了严重威胁,通过对航天器结构进行优化和材料选择是一项十分重要的工作。为此我国启动了相关研究计划,同时也开展了很多的试验和数值仿真,由此产生了大量的数据,这些数据格式繁杂、标准不一致,同时数据的收集和分析是一项长期工作,为了形成标准的数据类型和数据格式需要建立一套完整的数据格式标准和对应的数据存
目的:自体骨环种植技术在种植床三维骨量不足临床处理取得较理想的效果,本文通过建立牙槽骨骨量缺损动物模型,植入预成异种骨骨环。对临床指标、影像学指标检测,所得结果进行
目的:神经营养蛋白3(Neurotrophin 3,NTF3)在许多生物学过程中发挥作用,尤其是对于神经元细胞的存活与分化。但是,关于NTF3在实体肿瘤中的研究内容不多,目前也尚未有报道其在
目的:双相情感障碍(Bipolar Disorder,BD)是一种常见的精神疾病。临床研究发现,不同性别BD患者的临床症状表现不同。影像学研究发现,不同性别BD患者的脑结构存在差异。然而,B
目的本项研究通过建立GDM孕鼠模型,探究在体外条件下,将人胎盘来源间充质干细胞(human placenta-derived mesenchymal stem cells,hPDMSCs)诱导分化为胰岛样细胞(Islet-like
目的:通过回顾性分析芜湖地区腮腺基底细胞腺瘤的临床表现,影像学特征及预后情况,并与腮腺中最常见的两种良性肿瘤多形性腺瘤和腺淋巴瘤对比研究,提取相对全面、综合、有意义
目的:通过比较和分析系统性硬化病(systemic sclerosis,SSc)合并间质性肺病(interstitial lung disease,ILD)病人组肺间质病变程度、外周血清生物标志物及相关临床因素的关系
本文在对吡咯烷酮类神经细胞保护剂的合成方法、药理活性的相关文献进行调查分析后发现,当多取代吡咯烷酮类化合物-光学活性黄皮酰胺酮的3位碳原子上连接上电负性较大的酯基
目的:本实验基于iTRAQ蛋白质组学研究技术,以16月增龄小鼠为实验对象,通过比较分析3月龄和16月龄雌、雄小鼠肝脏线粒体中蛋白质的变化规律,挖掘衰老密切相关的蛋白质标志物,
本论文以鄂尔多斯广播电视台“相识”栏目为研究对象。该栏目于2009年4月1日正式开播,与广大观众朋友们相见。至2018年11月1日共录制播放了 504期。具有鲜明的民族特色和地域特色的“相识”栏目的内容形式不仅符合盟市级广播电视台的特点,同时兼具贴近实际、贴近群众的性质,使其拥有了坚实的群众基础,深受广大观众朋友们的欢迎。“相识”栏目是鄂尔多斯蒙古语电视影响巨大的谈话类栏目之一,它对蒙古族文化建设