【摘 要】
:
人脸识别技术的研究与应用现已在各个领域有着不断深入的发展,特别是在有限制性条件下(正脸、无遮挡、光照充足且均匀等)的人脸识别技术也已较好地应用至某些特定场景,而对于更接近实际应用的非限制性场景下(侧脸、素描人脸、人脸遮挡等情况)的人脸识别效果,在安防、金融等重要领域有着更加突出的作用。因此,非限制性场景下人脸识别算法的研究与应用仍是这些领域亟待解决的难题。所以本文针对非限制性场景下的人脸识别问题,
论文部分内容阅读
人脸识别技术的研究与应用现已在各个领域有着不断深入的发展,特别是在有限制性条件下(正脸、无遮挡、光照充足且均匀等)的人脸识别技术也已较好地应用至某些特定场景,而对于更接近实际应用的非限制性场景下(侧脸、素描人脸、人脸遮挡等情况)的人脸识别效果,在安防、金融等重要领域有着更加突出的作用。因此,非限制性场景下人脸识别算法的研究与应用仍是这些领域亟待解决的难题。所以本文针对非限制性场景下的人脸识别问题,从神经网络结构(系统框架搭建)、人脸数据集制作/测试以及人脸预处理模型三方面做了如下研究:1、针对非限制性场景下为加强特征判别而引入角距度量学习A-Softmax时,所产生的超参数m对特征的强约束性的问题,以及人脸数据分布不均衡(如正负样本分布)和样本多样化问题,本文提出了结合角距度量学习的人脸识别系统模型(MDCNN模型)。(1)在引入角距度量学习加强对特征判别分类的同时,针对超参数m对特征的强约束性以及多样化样本数据分布不均衡问题,采用BN层(Batch Normalization)改善Sphere Face-20每一层网络结构以弱化其对网络模型的特征学习和判别能力的影响,提高模型的收敛性能和泛化能力;(2)针对非限制性场景下样本多样化的正样本特征信息提取问题,提出了MDCNN网络模型架构(Modified Sphere Face-20),采取多层次细化的方式加强特征提取,从而提升模型在非限制性场景下的人脸识别性能;(3)结合MDCNN模型搭建了完整的人脸识别/验证系统框架。2、基于MDCNN网络模型搭建的人脸识别/验证系统框架,分别采用LFW、CUFS(素描人脸)标准数据集,以及自制的人脸遮挡数据集(11000对人脸样本)和侧脸人脸数据集(4000对人脸样本)对系统进行算法验证:本文算法的性能与现存的大部分算法进行比较。实验结果表明,本文的方法在解决非限制性场景上的人脸识别问题时,有切实的性能提升;并且采用本方法的人脸识别系统已成功的在实际工程性应用中进行实验。3、在上述模型基础上,针对非限制性场景中的侧脸识别做了进一步研究:采用三维拓扑人脸结构的人脸信息重构模型设计算法。(1)相比于正脸,由于Yaw方向上的侧脸仅提供了相对较少的特征信息,无法完全满足网络模型特征判别的最低要求,本文基于人脸特征信息对称(非严格的几何轴对称)的特点,引入了三维拓扑人脸结构,通过对人脸进行特征信息映射互补,实现Yaw方向上侧脸人脸特征信息的权重重构;(2)采用渐进式的PCN(Progressive Calibration Networks)算法实现Roll方向上的多角度人脸检测。二者均与本文提出的MDCNN模型有机地结合,有效的实现了Yaw方向上侧脸和Roll方向上多角度人脸的识别/验证。经上述研究与实验,本文算法在实现非限制性场景下的素描人脸和人脸遮挡识别时,有显著的性能提升,且具有较好的系统鲁棒性;特别是非限制性场景中的侧脸识别。同时,本文算法在标准人脸数据集LFW上的识别性能,也优于大部分现存算法。
其他文献
近年来,随着工业化的脚步逐渐加快,光学仪器的使用变得更加广泛、频繁,提升光学元件的面形检测技术变得尤为重要。光学元件是光学系统的重要组成单元,在传统的检测工艺中,面形检测方案一般基于人工接触测量的方式对光学零件进行检测,需要用待测的光学零件与样本零件进行接触式比较才能进行测量、比对,因此,传统的面形检测方案容易对光学零件的面形、光洁度造成一定程度的损伤。伴随着时代进步,在硬件方面,由于光学仪器快速
血管靶向光动力疗法(Vascular Targeted Photodynamic Therapy,V-PDT)是一种通过光动力反应,选择性封闭病变血管实现靶向治疗的新型疗法,在临床中已经获得广泛应用。为了有效评估V-PDT疗效并及时调整V-PDT治疗剂量,需要对V-PDT治疗过程中各个V-PDT关键参量的变化进行实时监测。光学相干层析成像(Optical Coherence Tomography,
声光可调谐滤波器(AOTF)是一种新型的电调谐分光器件,其组件全固体,无活动机械部件,体积小,调谐速度快,且具有较高的光谱分辨率以及空间分辨率,这些特性使得AOTF在生物医学光谱成像领域有着广阔的发展前景;近年来,随着各类生物医学成像技术的快速发展,以AOTF为核心部件的超光谱成像系统开始崭露头角。然而现有的较为成熟的AOTF分光超光谱成像系统大部分都是结合大型显微镜等设备而设计,其体积比较庞大,
图像在如今数字信息化发展迅速和多媒体技术日益更新的时代,已经成为人们信息传递和情感交流的一种重要媒介。但图像在捕获时,图像视觉效果通常与光照条件,环境动态范围和图像捕获设备等因素有关,从而影响人和机器的图像识别分析,因此低光照图像增强技术的发展在实际应用中富含重要的意义。本文主要开展了基于多光子图像的低亮度增强方法与基于自然图像的多重曝光融合算法。首先,针对多光子图像,提出一种基于改进的卡方分布函
随着工业4.0、中国智造等概念的提出,机器视觉被应用在越来越多的行业领域,机器视觉镜头作为机器视觉成像系统中的核心元件之一,其成像的质量好坏影响着相关检测的速度和准确度。而目前的机器视觉镜头中,远心镜头由于其放大倍数恒定、无视差、高分辨率、低畸变等优点被越来越多的应用。本文为满足这一方面的市场需求,查阅相关资料研究了远心镜头的相关成像原理及远心系统的分类等,发现目前对于物方单远心或像方单远心镜头的
在如今这样一个信息时代,由于人们对更加安全可靠的身份识别的需要日益增加,以生物特征识别技术研发生产的识别设备已经投入到社会各界使用。其中静脉识别技术是生物特征识别技术的一种,由于手掌静脉特征稳定、独特以及不易被盗取的特点,而且相较于指静脉与手背静脉,其结构更丰富。因此,手掌静脉识别技术在社会各个领域都有广大的应用价值。在前端获取掌静脉图像的过程中,由于外部因素(如采集设备限制、周围采集环境的影响)
现实世界中摄像头无处不在,对人类而言是不可或缺的器备。人类对其做了大量的研究:光学镜片、传感器构造、图像采集电路及图像处理算法等等,本课题所研究的是图像处理中的四带图像颜色校正。当镜头中加入IR-CUT的红外截止滤光片时,通用RGB传感器只能接收RGB光源,所采集的图像本课题称之为三带图像;当移除IR-CUT的红外截止滤光片时,通用RGB传感器能接收到RGB以及IR光源,所采集的图像本课题称之为四
随着智能时代的到来,与人工智能(Artificial Intelligence,AI)相关的计算机视觉技术得以蓬勃的发展,特别是目标检测与识别的研究和应用广泛运用于各个场景,如人脸支付、安防监控、无人驾驶以及“天眼”系统等等。同时伴随着5G商用元年的开启,让万物互联(Io T)与5G成为了一个不可分割的整体,其中边缘计算就是Io T技术发展中的重要一环,即在网络边缘测的智能网关上就近处理采集到的数
为了降低视频目标追踪场景中的干扰问题对算法精度产生的不利影响,本文基于光照变化、相似物干扰、外观变形、运动模糊、快速移动、背景模糊和遮挡等干扰场景下进行运动目标追踪算法研究。目前目标追踪领域算法主要分成判别法的孪生网络和生成法的相关滤波,故本文采用深度学习的孪生神经网络算法进行目标追踪的研究,并基于Siamese-FC经典孪生网络结构进行改进。本文中将Siamese-FC中间特征提取层拓展为DRe
随着深度学习的快速发展,计算机视觉系统得到了广泛的应用,例如无人机航拍、视频监控、户外体育直播以及充满潜力的无人驾驶系统。但是在恶劣的气候下,尤其是自然界最常见的雨天,由于雨水条纹的影响,导致成像系统捕获到的图像质量大大降低,这往往造成计算机视觉算法产生严重的错误。因此,图像去雨技术逐渐成为研究的热点,开发出高效的自动去雨算法具有重要理论价值与实际应用价值。考虑到注意力机制可以在卷积神经网络中自适