【摘 要】
:
近年来,随着“大数据”时代的来临和计算机处理能力不断提升,人工智能领域进入飞速发展阶段。面部表情是表达人类意图的最主要的非语言手段,以计算机技术为基础的面部表情识别研究旨在让机器理解人的情感,在人机交互和计算机视觉领域有着重要的研究意义和应用价值。获取大规模高质量的数据集始终是面部表情识别研究上的难点之一,对现有的原始数据集进行优化是解决这个问题的一个有效方法。我们可以将其分为两个子任务:一是扩充
论文部分内容阅读
近年来,随着“大数据”时代的来临和计算机处理能力不断提升,人工智能领域进入飞速发展阶段。面部表情是表达人类意图的最主要的非语言手段,以计算机技术为基础的面部表情识别研究旨在让机器理解人的情感,在人机交互和计算机视觉领域有着重要的研究意义和应用价值。获取大规模高质量的数据集始终是面部表情识别研究上的难点之一,对现有的原始数据集进行优化是解决这个问题的一个有效方法。我们可以将其分为两个子任务:一是扩充原始数据集;二是提高图像样本的质量。本文基于深度学习技术,分别从数据的数量和质量两个角度出发,设计了相应的面部表情识别模型。针对数据的数量问题,提出了基于关键信息剪裁的面部表情识别方法。本文从数据增强的角度,解决FER领域缺乏完全标注的大规模数据集的问题。同时,充分考虑视角信息对面部表情识别的影响。本文提出了基于关键信息剪裁的视角感知神经网络模型(Meaningful-cropping View-aware Neural Network,MCVNN),提出了基于关键信息剪裁的数据增强方法,能够在保留面部表情特征的同时,将原始数据集扩大4倍,获得的面部分块与人脸侧面视图有着高度相似性;同时,提出了视角感知模型,在Dense Net的基础上,设置不同的视角作为驱动网络的附加信息。最后,实验评估结果显示,提出的MCVNN模型在CK+和MMI数据集上,将现有模型的识别率分别提升了0.94%和3.28%。针对数据的质量问题,提出了基于ESRGAN图像生成的面部表情识别方法。本文从图像增强的角度,来解决面部表情识别领域缺乏高质量数据集的问题,采用ESRGAN对分辨率较小的原始表情图像进行图像增强处理,获得分辨率明显提高的生成图像;使用生成的图像来训练VGG、Res Net、Dense Net等深度网络,并在原始数据集上进行测试。最终的实验评估结果表明,基于图像增强的方法可以提高面部表情图像的分辨率,并且对于识别准确度的提升是有效的。
其他文献
本报告选取军事协定《澳大利亚政府与菲律宾共和国政府关于访问部队的地位协定》(以下简称“本协定”)作为翻译素材。本协定围绕缔约方的权利与义务展开,内容全面,结构完整,属于典型的军事协定文本。本报告以文本类型理论为理论框架,探讨如何全面准确地传递军事协定的文本信息。军事协定属于信息型文本,要求译者以简洁流畅的文字,在目标文本中传递其全部信息。鉴于军事协定的重要性和法律翻译的传统,译者应采用直译策略,忠
本文针对载体视觉导引自主着陆问题的需求,开展基于合作目标视觉特征信息的相对运动参数估计相关算法研究,为视觉导引自主着陆的状态估计提供理论和技术支持。主要研究内容总结如下:(1)研究了合作目标检测识别与视觉特征提取算法。首先,根据合作目标的构形设计准则设计了由一个圆环和T型标志组成的易于识别且具备充裕视觉特征信息的新型合作目标用于辅助载体进行导航定位;其次,针对合作目标采集图像,研究了图像预处理、基
互联网发展带来信息爆炸式增长以及表达方式的多样化,使信息的传递变得更加高效、方便和快捷。层出不穷的数字化智能化信息技术也正不断改变着人们的生活。互联网新闻因时效性强、信息丰富等特点,成为用户最常检索的内容之一。面对海量新闻,人们同样遇到了一些无法避免的问题,即由于文本信息的过度膨胀导致用户难以找到所需要的内容,这也促使了文本可视化与关联检索等辅助多样化检索方式的技术逐步发展,如何在互联网环境下对各
兴趣点(Point of Interst,POI)是指人们发现有用或有趣的特定位置。POI提供了多样化的城市功能,在方便人们的日常生活方面发挥着重要作用。在城市中,感兴趣区域(Area of Interst,AOI)是基于位置服务(Location Based Service,LBS)术语中对POI的扩展概念,是指具有地理边界信息一片区域,传统上AOI多指大的商圈和城市功能区。本文主要关注细粒度A
在软件开发过程中,开发人员从某处复制粘贴一段源代码并对其进行修改是一种常见的编程方式,这种软件开发方法称之为代码复用。虽然代码复用技术确实给软件系统的研发带来许多便利,但由此导致软件系统中可能产生的大量克隆代码,不仅使整个源代码变得臃肿,增加软件系统的维护成本,而且会影响软件的质量,导致代码漏洞的引入和繁衍。正因如此,代码克隆检测一直是软件工程领域的一个基础研究课题。鉴于此,本文重点围绕基于序列联
大数据时代的浪潮已然来袭,个性化推荐作为解决信息过载问题的有效手段,已应用于社会生活各个领域,其市场前景日趋广阔。然而,挑战与机遇并存,特别是随着数据收集能力不断提升、范围不断拓展、规模不断增加,传统推荐算法在信息融合能力方面瓶颈凸显。近年来,深度学习在图像处理、自然语言处理与语音识别等领域取得的巨大成功,其卓越的数据处理能力得到广泛认可。鉴于此,基于深度学习的个性化推荐算法研究成为新的热点。已有
图像的特征检测与匹配是图像处理技术中非常重要的一部分,在三维重建、医学图像处理、图像检索等领域都有着非常重要的作用,也是现今图像领域研究的热点方向。由于在图像匹配过程中会受到很多因素的干扰,为了获取更好的匹配效果,就要从图像的获取方式、预处理、匹配精准度与效率等方面进行改进,本文主要围绕上述问题,开展了如下研究。针对光照不均图像特征检测不准确的问题,提出了一种基于纹理抑制的光照不均图像改进KAZE
近年来,无人机在地球测绘、公共安全、精确打击等军事和民用领域的应用层出不穷。对无人机拍摄影像内容的定位(获取影像中每个像素对应的经纬度)是无人机多种典型应用的基础,既是无人机影像理解的内在任务,也是后续完成目标打击、目标跟踪等任务的关键。受限于无人机携带定位设备的精度、多径干扰及漂移等情况的影响,传统无人机影像方法定位流程复杂、定位误差大,难以适应应急保障等时效性强的无人机影像定位的现实需求。鉴于
目标检测技术的研究是一个十分重要和实用性很强的课题,是解决复杂或高层次视觉任务的基础。它的任务是从大量预定类别的自然图像中寻找目标实例。当前目标检测在智能安防监控方面,增强现实方面,以及自动驾驶方面都有着非常广泛的应用。其中,无人机平台上的目标检测任务是具有重要意义的课题之一,很多先进的目标检测技术围绕此课题展开。无人机(Unmanned Aerial Vehicles,UAVs)的优点是小巧灵活
目的:观察射频导入舒敏保湿特护霜治疗面部敏感性皮肤的有效性和安全性。方法:敏感性皮肤患者40例,采用随机对照试验分为治疗组和对照组,每组患者各20例。两组均口服枸地氯雷他定片8.8 mg/d。对照组外用凡士林霜每日两次,联合射频导入治疗,1次/周;治疗组外用舒敏保湿特护霜每日两次,联合射频导入治疗,1次/周。持续治疗4周。分别于0和4周进行疗效判定,使用无创皮肤检测仪检测两组患者经表皮水分流失(t