特征融合和字典学习在人脸性别识别方面的应用研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:qiuyucen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于人脸图像的性别识别在人机交互、智能监控、视频检索等领域中有着广阔的应用前景,近年来已经发展成为计算机视觉领域的一个热点课题。与其它识别问题一样,人脸性别识别系统的基本框架需要包括特征描述和分类器设计两方面。一方面,人脸的描述特征可以分为全局特征和局部特征两大类,两种特征的作用不同具有互补性,而传统的人脸性别识别方法在特征提取方面主要是针对单一特征,必定会影响最终的识别率;另一方面,传统的性别识别分类器主要有支持向量机(Support Vector Machine,SVM)、Adaboost和神经网络等,由于SVM是针对二分类问题提出的,因此SVM在人脸性别识别问题上被应用得最为广泛,但是这些传统分类方法对有部分遮挡人脸的识别效果并不理想。为了解决上述两个问题,本文提出将全局特征和局部特征进行融合得到人脸的描述特征,该人脸描述特征较单一特征包含了人脸更多的有用信息。此外,由于稀疏表示已被成功应用于人脸识别领域,其对于存在光照,表情及遮挡等情况下的人脸识别具有很强的鲁棒性,因此本文将稀疏表示应用于人脸性别识别问题中,并在此基础上引入了类字典和字典学习进一步提高了识别率。本文的研究工作如下:(1)深入调研了目前常用的人脸性别识别方法。综述了目前在人脸性别识别领域中常用的人脸特征提取方法和常用的人脸性别分类方法。(2)提出了基于单特征和类字典的稀疏人脸性别识别方法。首先,鉴于稀疏表示在人脸识别领域中的成功应用,本文将稀疏表示应用于人脸性别识别问题中,提出了基于宏字典的稀疏人脸性别识别方法。然后,在基于宏字典的稀疏人脸性别识别方法基础上,提出了基于类字典的稀疏人脸性别识别改进方法。最后,分别基于PCA、LBP和2D-Gabor特征,在CAS-PEAL人脸库上比较了两种方法的识别率,通过实验证明了在单特征条件下,基于类字典的稀疏人脸性别识别方法识别效果更好。(3)提出了基于特征融合和类字典学习的新型稀疏人脸性别识别方法。首先,由于全局特征和局部特征在表征人脸方面作用不同且具有互补性,本文将全局特征和局部特征进行融合,使用融合特征作为人脸的描述特征,通过实验证明融合特征的识别率较单一特征要高。然后,由于不经过字典学习的类字典对于训练数据的表征能力有限,本文通过字典学习算法得到经过学习的类字典并将其应用于人脸性别分类,通过实验比较了未经过学习的类字典和分别经过三种字典学习算法得到的类字典的识别率,证明了经过学习的类字典的识别率较未经过学习的类字典更高并且通过RLS-DLA算法得到的类字典的识别率最高。接着,本文介绍了在稀疏表示识别问题中三种常用的稀疏表示向量求解方法,并从识别率和计算时间两个方面对这三种方法进行了比较实验,发现正交匹配追踪算法的综合性能最好。最后,通过实验比较了本文方法与SVM方法分别对有遮挡人脸和无遮挡人脸的识别率,在无遮挡人脸的识别方面,SVM方法稍好于本文方法,但是在有遮挡人脸的识别方面,本文提出方法要明显优于SVM方法,证明了本文提出方法的有效性。
其他文献
图像语义标注作为场景理解中的一个基本问题,已成为计算机视觉领域研究的热点;并广泛应用于探险搜索、自动导航、安全防护、医疗护理等领域,具有重要的学术研究和工程应用价
人体动作识别因为其广泛的现实应用前景,成为图像处理、计算机视觉、机器学习等领域的研究热点,但仍然是一个具有挑战性的课题。在人脑视觉机理的启发下,深度学习的提出使得机器
互联网技术飞速发展的当下,视频多样性服务也大量涌现,用户对于视频质量的需求也随之增长。为了更好地服务用户,提升用户体验,服务商致力于研究各方面指标以改善用户体验质量
针对图像版权保护和内容监管领域的应用需求,本文提出了基于局部特征的图像检索系统。该系统支持对经格式、旋转、缩放、变色、亮度、对比度、加Logo和剪裁等变化后图像的快速
近年来,随着无线通信的迅猛发展,多输入多输出(Multiple-Input Multiple-Output,MIMO)技术已逐渐成为核心技术之一。它在不增加带宽和额外发射功率的前提下,就能够实现高速率
Ad Hoc网络是一类无固定基础设施的无线多跳网络。因其自身特点,其研究内容和面临挑战,也与其他无线通信系统不同。本文从网络管理的角度出发,采用跨层设计的方法,设计了Ad H
随着TD-SCDMA技术的不断发展和完善,TD-SCDMA网络的商用和产业链发展也日趋成熟。而且为了充分利用原有GSM网络的覆盖优势,TD-SCDMA和GSM网络将长期共存。在这种环境下,终端
本文以参与合作式教学的本科学生为视角,以社会保障国际比较课程教学为支柱,探讨了自主--合作式教学对于提升本科学生自主探究学习能力的重要性,并分析了合作式教学对于提升
生理电信号是人体各种生理参数的重要指标,在临床治疗和诊断中有重要的作用。复杂度理论已成为研究生理电信号的热点,而符号转移熵是一种反映系统混乱程度的非线性指标,在生
眼图是一种直观快速地观测串行信号质量的方法。它可以反应系统物理层性能,如系统带宽对传输信号参数的影响。如果能够正确地构建眼图,并且保证用于构建眼图的数据量充足,就可以