基于增强Pictorial模型的鲁棒精确人眼定位技术研究

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:whhdgcr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人眼精确定位作为人脸图像规整化的预处理步骤对人脸识别系统的性能具有重要影响。但是人眼相对于人脸包含的特征较少,同时容易受到复杂光照、表情变化的影响,造成对象模式变化丰富,而且人眼经常会受到头发、眼镜等附属物的遮挡,很大程度上增加了精确定位人眼的难度。因此,探寻能够应对这些复杂条件变化,并实现高效鲁棒精确的人眼定位,将会在很大程度上推动人眼定位技术走向现实应用,从而本课题的研究变得很有意义。本文重点研究非控自然条件下的高效鲁棒精确人眼定位,在对当前人眼定位技术做了综述性的调查分析之后,确定了研究思路:综合利用人眼的外观特征以及人眼与周围面部特征之间的空间位置分布关系,选择标准Pictorial模型作为研究的出发点。结合Pictorial模型的特点以及人眼定位面临的挑战,提出了增强的Pictorial模型进行人眼定位。本文主要工作如下:1、把用于对象描述和对象检测的Pictorial模型引入到人眼精确定位问题中。虽然该模型在解决一般对象检测问题上有许多优势,但是要实现复杂情况下的人眼精确定位,还有许多工作要做。2、针对由于复杂光照和表情变化以及附属物遮挡造成的人眼模式复杂变化的特点,标准Pictorial模型中,基于高斯分布的生成模型已经不足以表达人眼外观模式变化的多样性。本文提出了使用基于概率支持向量机的判别模型来刻画复杂的人眼模式分布,该方法通过寻找特征空间中的一个最优分类面,从完全不同于生成模型的角度,可以得到一个推广能力较好的分类器。3、由于标准Pictorial模型中基于构件间的相对位置分布所建立的结构约束过强,导致对旋转、尺度放缩和平移等仿射变换不鲁棒。针对该问题,本论文提出了基于全局结构约束的结构模型来提高对常见的图像旋转、尺度放缩和平移等仿射变换的鲁棒性。在由眼睛和鼻子构成的稳定三角形空间位置分布结构中,结构约束表示为边长、边长比例和三角形内角余弦值,分别体现构件间的相对距离,构件间相对距离变化的一致性,三个构件间的结构整体性。4、为了消除光照和其它仿射变换的影响,以得到较稳定的对象表示形式,从而便于利用本文提出的增强Pictorial模型实现精确的人眼定位,采取了一系列的预处理措施,包括:人脸检测、人脸验证、尺度归一化和光照预处理。同时,为了减少实验细节对模型性能的影响,采取了一些参数优化方法,包括优化模板和搜索区域大小、采用Bootstrap方法收集具有代表性的反例样本和采用启发式方法处理遮挡问题。
其他文献
分布交互仿真系统技术复杂、开发周期长。如何使仿真技术平台对仿真应用开发人员透明;如何重用已有的仿真实验框架和模型。这是分布交互仿真系统开发亟待解决的两个问题。MDA
Internet在网络环境下得到了广泛的应用,语义web应用到网络资源描述和知识库的建立,成为计算机界和知识工程界的热点。本文从另一角度,将语义web成果与领域软件工程相结合,在
生物识别技术是利用人自身具备的生物特征进行身份鉴别的技术。与其他的生物认证技术相比,人脸识别具有更直接、友好、方便的优点。因此,人脸识别技术有着广泛的应用前景和迫
大型矩阵计算广泛应用于飞行器的设计、航天器设计、桥梁设计、生物科学、计算物理和石油勘探等领域。随着矩阵阶数的增加,矩阵求解和求特征值等问题的计算量和存储量将会急
交通流元胞自动机模型是20世纪90年代涌现的交通流新的动力学模型,它的出现和发展为交通流理论研究提供了一种新的方向,为交通流动力学理论中的系统整体行为与复杂现象的研究提
随着信息技术的不断进步,企业内部产生了越来越多的数据。快速增长的海量数据收集存放在大型和大量的数据库中,没有强有力的工具,理解它们已经远远超出了人的能力。基于数据
MIPS是世界上很流行的一种RISC处理器,它采用精简指令系统来设计芯片。和英特尔采用的复杂指令系统相比,RISC具有设计更简单、设计周期更短等优点,并可以应用更多先进的技术,
万维网服务是以XML为基础的一系列开放的Web规范技术,它的出现为异构系统之间的互通互操作提供了一种很好的解决方案。万维网服务组合可以解决企业集成和电子商务中的应用问题
嵌入式系统已经在航空航天、交通运输、核电能源等安全关键领域得到了广泛运用,系统故障引起的安全事故往往会造成不可挽回的灾难性后果。保证嵌入式系统的可靠性与安全性已
随着社会快速发展,汽车数量快速增加,智能交通系统在道路交通管理上发挥了越来越重要的作用,受到越来越多的关注。车辆特征抽取与识别是智能交通的重要组成部分。本文在研究