基于非完整标注数据的人脸识别研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:cherry_20050901
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,生物特征识别技术受到了广泛的关注和应用,可用于有效识别的生物特征主要有指纹、虹膜、人脸、掌纹等。其中,人脸识别具有稳定、唯一、操作简便、成本低等优越的特性,已被广泛应用于公共安全、监控、个人信息管理、娱乐生活等诸多领域,并且成为了计算机视觉以及模式识别领域的研究热点。过去四十年中,人脸识别技术取得了显著的进展。可控条件下的人脸识别技术已基本趋于成熟,然而在非可控条件下,由于受表情、姿态、光照、年龄、遮挡等因素的影响,人脸识别依然是一个很有挑战性的问题。此外,非可控条件下很难得获取到大量包含丰富变化并且标注完整的训练数据,如在对犯罪分子的抓捕中通常只能得到一幅犯罪分子的图像或根据目击者描述得到的素描图像,不完整的标注进一步加剧了非可控条件下人脸识别的难度。本文针对非可控条件下出现的数据标注不完整的问题进行了深入的分析,并提出了使用不同完整程度的标注数据进行模型学习的方法。本文主要研究工作包括:  (1)针对单一样本下的人脸识别问题,提出了自适应判别分析方法,在单一样本人脸识别上取得了良好的性能。该方法利用一个每人多个样本的世界集来对单一样本的类内散度矩阵进行估计,解决了单一样本场景下没有类内变化的问题。该方法基于长相相似的人具有相似的类内变化的思想,通过组合单一样本的若干近邻的类内散度矩阵来实现估计该单一样本的类内散度矩阵。  (2)针对边信息情况下的人脸识别问题,提出了基于边信息的判别分析方法。边信息只提供了一对样本是否属于同一个人的信息,没有提供每个样本的类别信息。该方法在边信息的场景下重新定义了类内散度矩阵和类间散度矩阵,从而将Fisher线性判别分析扩展到了边信息的场景下。此外,还从理论上证明了类别信息已知时,基于边信息的判别分析与Fisher线性判别分析的等价性。  (3)针对半监督的人脸识别问题,提出了原型超平面学习方法,该方法旨在结合无标注数据和弱标注数据学习一组判别性的中层特征表示,取得显著优于底层特征的性能。该中层特征的每一维对应一个建立在无标注数据上的支持向量机(称为原型超平面)的输出,同时为了得到一组判别式的中层特征表示,通过最大化弱标注数据集上基于中层特征表示的类Fisher(Fisher-like)准则得到原型超平面的最优参数。  (4)针对无监督的领域适应人脸识别问题,提出了目标域化源域样本的方法将源域的知识迁移到目标域上,从而有效地提升了目标域上的识别性能。在无监督领域适应场景下,标注的源域与无标注的目标域的分布是不同的,无法直接用于目标域上的模型学习。本文通过在原始样本空间将源域样本表示为目标域少数近邻样本的线性组合以将源域的样本变换到目标域上,从而得到一组有标注的目标域样本,实现监督知识从源域到目标域的迁移。为了保证目标域化的可靠性和稳定性,本文提出在源域与目标域的公共子空间中对用于目标域化的稀疏线性组合系数进行求解,从而解决了原始样本空间中标注数据与无标注数据分布不同,不能直接用于学习识别模型的问题。  (5)针对多视图人脸识别问题,提出了多视判别分析的方法,显著提升了跨视图人脸识别的性能。在多视图识别的场景下,来自于多个视图的数据位于不同的空间,通常无法直接进行比对或识别。该方法通过学习多个视图特定的投影矩阵以将多个视图的数据投影到一个公共的子空间,从而去除视图间的差异。该公共子空间是通过最大化所有视图下的类间散度、最小化所有视图下的类内散度得到的判别式公共子空间,进一步提升了跨视图识别的性能。  综上所述,本文针对人脸识别中出现的训练数据标注不完整的问题开展了广泛和深入的研究,提出了基于非完整标注数据进行模型学习的方法。大量实验结果表明,本文提出的方法可以有效利用非完整标注的数据学习判别式的模型,显著提升了非完整标注下人脸识别的性能。
其他文献
学位
嵌入式技术随着后PC时代的到来得到了迅猛的发展,人才缺口较大。《嵌入式系统》是一门实践性很强的课程,其实验设备更新换代快、投入大,一些高校无力提供足够的实验设备。而
一直以来,如何快速地从空间数据中提取更加丰富和有用的信息,为人们有效地管理和利用空间数据提供信息决策参考是空间分析研究人员的目标。随着全球范围测量精度的不断提高,
因特网的迅猛发展使大规模的数据共享成为了可能,随之而来的还有数据爆炸式增长所导致的信息过载问题。推荐系统便是在这样的情况下应运而生,它的出现使用户潜在感兴趣的信息能
从移动Ad Hoc网络演变而来的无线Mesh网络(Wireless Mesh Network,WMN)是一种多跳的无线网格架构网络。具有大容量、高速率、宽覆盖和快速部署等优势,同时又能很好的融合多种异
随着软件规模的不断增大和日益复杂,软件危机已经变得越来越严重。解决这个问题的最有效的方法是软件复用。近年来RUP(Rational Unified Process软件统一开发过程)已经被广泛
如何构建高质量的软件系统一直以来都是软件工程领域的一个核心问题。尤其是软件系统进入到维护演化阶段,随着系统不断地修改,会不可避免地渐渐变得复杂、难以理解。另一方面,近
传统的地质体内部信息使用二维图形的表达方式,难以全面反映地质对象空间形态,需要进行大量制图来从多角度表达地质信息,并且工程技术人员很难对地质信息进行解释,利用结构分
计算机系统安全已经作为国家基本战略纳入了各国的发展规划中。而作为计算机系统智能载体的计算机软件,是攻击者入侵计算机系统的最重要途径之一,它的安全性在网络空间(Cybersp
信息安全已经成为国家安全的基石,直接而深刻的影响普通民众的生活和工作,涉密信息更是信息安全防护的重点。当前我国的涉密信息安全防护以涉密信息系统的安全防护和涉密人员的