单目摄像机实现的注视方向估计研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:adupt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
注视方向估计是计算机视觉和模式识别研究的热点问题之一,具有重要的理论意义和应用价值。对注视方向估计技术的系统研究能够推动这些领域的发展,在人机交互、心理学研究等领域具有重要的应用前景。近年来,虽然侵入式的注视方向估计取得了很大进展,但非侵入式的注视方向估计尚不成熟。要实现真正鲁棒、实用的非侵入式的自动视线估计和跟踪系统还需要解决大量的关键问题,尤其需要研究高效的人眼描述特征,以及实现头部自由动作的视线方向估计算法。本文研究了以单摄像机作为信息获取手段的非侵入式注视方向估计的相关问题,包括基于单摄像机的数据获取与基准数据(ground truth)的自动标注、眼部表观特征的表示、头部自由运动的注视方向估计等问题。概括而言,本文的主要研究工作包括:1.设计了一种同步采集注视方向、头部姿态数据和面部图像的方法,并实现了相应的装置。在基于统计学习的算法中,系统的性能依赖于大量标注的训练数据。因此,标注的数据集是注视方向估计研究的基础和前提。本文设计的这种数据采集方法,能够在复杂环境下,同步采集图像、姿态、注视方向以及各个目标间的空间位置关系。其采集的数据为后续实验的训练和测试提供了保障。2.提出一种基于方向二值模式特征的注视方向估计方法。随着注视方向的改变,在眼窝中巩膜和虹膜位置之间的相对位置也随着改变。这些改变可以看作是虹膜横向和纵向运动,这种运动会引起眼部图像纹理的相应变化。针对虹膜纵向和横向的移动变化特点,提出方向二值模式(Directional Binary Pattern, DBP)的表示方法。通过计算四个方向上差分信息,使DBP特征不仅包含局部纹理信息,同时还包含特定方向的二值差分信息。因此,DBP特征适合解析虹膜相对运动而引起眼部图像的纹理变化。同时DBP特征对光照变化具有鲁棒性,能减少因光照影响而引起的计算误差。3.提出了一种基于混合特征的注视方向估计方法。混合特征由模型特征和表观特征组成。模型特征提取特征点间的几何向量;表观特征是从眼睛图像提取基于Gabor特征的方向二值模式(Gabor Directional Binary Pattern, GDBP)。本文将两种特征通过支持向量回归(Support Vector Regression, SVR)算法融合起来,从而获得某一确定的头部姿态下的注视方向。将方向二值模式(DBP)用于编码图像的Gabor幅值特征,从而表示表观特征,并取得了较好的性能。基于混合特征的方法具有如下特点:(1)根据不同的计算方向对眼部图像进行二值化;(2)成功地将DBP算子和Gabor幅值特征进行结合,最后提取空间直方图特征作为判别特征;(3)既利用了表观特征较好的统计特性,也得益于模型特征在对光照变化的鲁棒性。4.提出一种头部自由动作的注视方向估计方法。对基于图像特征的注视方向估计研究而言,包含两个重要的问题:头部姿态和眼睛注视方向。目前,头部自由动作的注视方向估计方法多数通过先确定头部姿态,后估计注视方向的方法实现。本文提出一个分布式算法实现头部可动作的注视方向估计,分别估计头的姿态和眼睛的注视方向。在此基础上,提出了一种基于人脸和眼睛特征层级融合的注视方向估计方法。实验验证了该方法的有效性。通过上述工作,本文对基于单摄像机的注视方向估计涉及的一些相关问题进行了研究。结果表明:眼部图像的模型特征和表观特征从不同角度描述了注视方向的信息,高效地对二者进行融合,可以取得更为稳定的估计结果。另外,本文基于所提出的方法实现了相应的原型系统。实验结果表明,本文提出的方法具有潜在的应用价值。
其他文献
目的探讨整体护理方案在宫腔镜手术中的作用。方法选取230例宫腔镜下手术病人,随机分为整体护理实验组和对照组,通过术前、术中、术后3个阶段的整体护理实施,评估传统护理与
在支持替代/补偿的实时事务模型ACTM(Alternative Compensate TransactionModel)中,替代增加了事务的自适应能力,而补偿则能够消除夭折事务所产生的外部影响。基于ACTM事务模型
目的观察并分析妊娠期糖尿病对孕妇妊娠结局的影响。方法回顾性分析2014~2015年该院收治的妊娠期糖尿病孕妇320例(甲组)和同期无妊娠并发症孕妇280例(乙组)的临床资料,观察两
十月一日,是新中国成立三十五周年。为反映建国以来,贵州经济和社会发展的伟大成就,本刊刊登几组统计资料。
甲烷是大气中主要温室气体之一.由于甲烷排放的增加,近200年来其在大气中的含量以每年1%的速度急剧上升,对温室效应贡献已达到15%~20%.广泛存在于自然界中的甲烷氧化细菌(Meth
铬盐的基本产品是红矾钠,由铬酸钠制红矾钠的方法有硫酸法、电解法和碳化法。硫酸法是我国和多数国家采用的方法,1t红矾钠副产硫酸钠约0.7t,若铬酐副产的硫酸氢钠用于中和及预酸
“三维数字地球”是国产的专业虚拟地球类软件,具有集成数据及影像丰富、数据及影像分析处理能力强、支持数据下载及倾斜投影、真实呈现各种地理信息等优势。将“三维数字地