基于卷积神经网络的人脸识别研究

来源 :天津大学 | 被引量 : 2次 | 上传用户:stone88822
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的蓬勃发展,人们的学习和生活方式都发生了深刻的变化,公共安全日渐成为大家关注的焦点问题。生物特征识别技术由此应运而生,尤其是其中的人脸识别技术。相较于指纹识别、虹膜识别等其他生物识别技术,人脸识别具有采集方式友好、较少需要或不需要人的配合、应用操作简单、隐蔽性好等优点。在日常生活的方方面面如公共安全、金融安全等,人脸识别具有广阔的应用前景,是当今安全技术中热门的研究课题。计算机技术的高速发展更是将人脸识别的研究推向白热化。长期以来,遮挡、光照、表情、姿态等问题一直是人脸识别的难点所在,建立对这些干扰不敏感的描述模型是当前人们面临的一项艰巨而迫切的任务。深度卷积神经网络模型的出现在很大程度上改善了人脸识别的现状。相比于传统的人脸识别方法而言,深度神经网络模型不需要人工地进行复杂而耗时的特征提取,只需搭建一个有效的网络框架便可实现自适应的自动学习。目前,深度神经网络模型已经成为最受欢迎的人脸识别研究方法,能很好地应对当前大数据的快速积累,并在实际场景中取得了成功的应用。本文借助深度神经网络模型,在不增加数据规模的情况下,就如何进一步提高网络模型的表达能力、提取更加有效的人脸判别特征等问题展开了以下的研究工作:(1)提出了基于分块策略的深度人脸识别方法。该方法的核心是将分块策略(patch strategy)嵌入卷积神经网络(convolutional neural network,CNN)以提取出互补、高效的特征。为此,该方法构造了一个新的网络层用来实现分块策略的嵌入操作,并搭建了一种多分支的网络模型结构实现了在线分块、多特征提取和特征融合的端到端的学习。卷积神经网络通常以整幅图像作为输入数据,提取人脸的全局特征描述。全局特征描述具有较强的判别性能,但容易忽视对人脸细节的把握,容易受到局部变化的影响。为了加强提取特征的有效性,弥补全局特征的不足之处,一种简便而直接的做法就是引入局部特征。相对全局特征而言,局部特征更注重对局部细节的刻画,对人脸中存在的遮挡、光照、姿态等因素不敏感,与全局特征形成互补。分块策略正是获得局部信息的有效途径之一。以此为契机,基于分块的多分支网络模型被提出。该方法选取了人脸的5个关键点(两个眼睛的中心,鼻尖和两个嘴角)进行定位,按照平均采样的原则裁剪出6个人脸块。之后,将每个人脸块送入一个网络分支进行特征提取。最后,提取出的各个特征经过归一化处理后又被进一步融合。相较于基于分块的多模型方法,该方法提出的分块策略的嵌入操作实现了线上分块,不需要额外的存储空间储存各个人脸块。更重要的是,这种方法采取端到端的方式对分块、特征提取和特征融合三个过程进行同步操作,可以进一步促进局部信息和全局信息之间、各局部信息之间的相互作用,使得多种特征自适应地被不同程度的削弱或加强,从而强化了最终的特征表示的判别性和有效性。在两个基准的人脸数据库LFW和YTF上的实验显示,该方法的识别效果优于基于分块的多模型方法,且在对遮挡、姿态、表情和光照四种变化的处理上表现出一定的优越性。(2)提出了一种基于核函数和去相关性的CNN正则化方法。针对CNN由于过拟合导致的模型的泛化性能下降的问题,采用有效的正则化方法能够很好地缓解这一问题。考虑到存在过拟合问题的CNN模型往往含有大量的参数冗余,这些冗余的参数通常以非常相似的模式捕捉数据中的信息,具有较强的相关性。该方法从正则化的角度出发,结合核函数的思想,通过去除参数间的相关性来正则化网络参数,从而保证了编译信息的最大化。相较于去除每维特征之间的相关性的做法,该方法直接对网络参数进行去相关性操作,大大地缩减了计算量,因为CNN输出的特征一般具有较高维数。鉴于核函数是特征空间的内积,本质即相似度,该方法利用高斯核函数来度量参数向量的相关性,既利用了向量之间的角度,又引进了距离远近对相关性强弱的影响。高斯核函数的值越大,两个参数向量之间的相关性越大。由于高斯核对核的宽度比较敏感,该方法在模型的训练过程中,根据当前迭代的参数间的平均距离自动地调整核的宽度。该方法与其他的正则化方法如Dropout、BatchNorm等有着很好的兼容性,它们一起使用时,识别效果甚至会得到更大程度的改善。并且,该方法适用范围广,它对复杂度不同的网络模型的泛化性能都有不同程度的提升。大量实验结果表明,该方法在物体识别和人脸识别的多个数据库上都展现出很好的识别效果。相较于其他的基于去相关的正则化方法,该方法在不同的识别任务上具有明显的优势,尤其是对于大规模的图像识别如人脸识别。
其他文献
目的了解首都机场口岸食品进口情况及其监管工作。方法对2014-2016年首都机场口岸食品进口情况进行分析。结果首都机场口岸进口食品批次不合格率维持5.0%左右,不同年份批次不
长期以来的工业废水排放导致我国流域呈现不同程度的重金属污染,其中,汞、镉、铬、铅和类金属砷为重点重金属污染物。目前,我国提出了流域单元与行政单元相结合的重金属污染
钢–混凝土组合梁由于兼具钢桥自重轻和混凝土桥面耐压的优势,在我国的应用正变得越来越广泛。组合梁桥服役期间同时受到环境腐蚀的间接作用和车辆荷载的直接作用,因此而引起
工学结合不仅是一种人才培养模式,更是高职教育安身立命的生存方式。工学结合有着深厚的教育理论基础,符合我国传统知行学说及国外的实用主义教育理念,并且也为马克思主义教育观
一、104例福建地区原发性肝内胆管结石患者临床分析目的:观察分析原发性肝内胆管结石(Primiary Intrahepatic Lithiasis,PIL)的发病特点和临床特征。方法:以福建地区104例原
明代是中国古代君主集权和政治体制高度发展和成熟的王朝,地方之权集于中央,中央之权集于皇帝。在这样的历史条件下,明代刑部的司法职能也有其自己的历史特色。虽然明朝开国
政府补贴是传递国家政策信号,引导社会资本流向,实现国家战略目标的重要手段。近年来,补贴资金的庞大规模使实务界和学术界对补贴的政策效果评价均表现出强烈的研究兴趣。以往的研究往往从企业研发投入、企业业绩的角度对补贴的微观绩效进行评价,事实上,补贴除了影响企业自身的投入和产出外,还可能通过间接信号传递的方式改变信贷投资者对企业的判断,进而影响企业受信贷支持的程度。通过对政府补贴动机及其影响因素的分析,我
本文采用有限元软件ANSYS和量子计算软件Material Studio(MS)对石墨烯增强智能混凝土的电学与力学性质进行了数值模拟。课题主要包括以下内容:(1)采用有限元软件ANSYS中APDL