稳定的非接触式眼球跟踪与视线估计

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:xq_wang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
眼睛不仅是人们观察、了解外部世界的一个重要器官,更是人们心灵的窗口。稳定的眼球跟踪与视线估计系统已经在心理学、军事、市场调研和广告测试、计算机视觉、医学等领域有了初步应用。基于视线控制人机交互系统也在给传统的人机交互方式带来巨大挑战。近年来,基于图像法的非接触式眼球跟踪与视线估计受到越来越多的关注。本文总结了国内外关于眼球跟踪与视线估计的研究现状,提出了一种新的快速准确的虹膜中心定位方法,并在该定位算法基础上实现了对眼球的跟踪。本文还提出了一种可以允许头部大范围转动的视线估计方法。主要工作内容与成果如下:1.为了提高虹膜中心定位的精度与速度,本文提出了一种快速准确的虹膜中心定位算法。首先检测图片中的人脸并确定初步的眼部区域,然后设计不同卷积核与眼部区域图像进行卷积,将卷积后的图像对应相除获取卷积商矩阵。通过计算商矩阵最大值处对应的位置及卷积核的半径来获得人眼的中心和半径。卷积核的设计时考虑了虹膜中心处的位置、灰度值及虹膜巩膜边界灰度值的变化规律,并加入傅立叶变换计算卷积,从而实现快速、准确的定位虹膜中心及半径,并且在公开的人脸数据集BioID上与现有的虹膜中心定位方法进行精度与速度的对比。最后在该定位算法的基础上利用视频序列上下帧之间的关系实现了眼球跟踪。2.针对现有的视线估计系统要求的高分辨率图像,红外光源,头部转动等要求,本文提出了一种可以利用普通网络摄像头的并且是无光源的可以允许头部转动视线估计方法。在该算法中,利用监督下降的优化方法(Supervised Descent Method,SDM)对人脸图像计算人脸特征点,再利用POSIT算法确定头部朝向。然后将人眼的眼角,虹膜中心及眼皮上的点作为人眼特征点,定义人眼特征向量,建立人眼特征向量与视线角度的匹配模型。通过校准屏幕上的点来获取人眼的训练数据,再利用自适应线性回归的的方法来确定模型参数,从而计算头部静止时的视线相对头部运动的三个偏移角度,最后通过结合人头部朝向与视线偏移角度来确定视线方向,从而实现了可以允许头部转动的视线估计系统。3.最后,在分析总结上述研究方法的理论基础与实验结果之后,本文对后续的研究方向进行了展望。
其他文献
零码软件生产平台是一个面向领域的软件产品线,该平台主要面向以信息处理过程为主体的业务领域,支持该领域的应用系统的“零编码”开发。而报表模块是此平台的一个重要组成部
纹理绘制是真实感图形学的重要组成部分。三维网格的纹理绘制通常需要先参数化到二维参数域中去,再映射到纹理空间中去。三维网格参数化作为网格纹理绘制的重要组成部分,同时
工作流建模主要研究如何清晰、准确地表示实际应用中的业务过程。一个好的建模方法是建立工作流模型的关键,目前基于活动、事务和语言等常用的建模方法普遍存在同一个问题:建
打印机光谱色域描述及可视化是打印机光谱色彩管理的内容,是进行光谱色域匹配的前提和基础。针对光谱特性文件连接空间描述的光谱色域由于维数较高而不适于可视化及打印机光
视频目标跟踪技术是计算机视觉领域中的热点话题,在军事制导、智能交通、安全监控、医学、气象等领域有着广阔的应用前景和经济价值。该技术通过分析在各帧图像中检测出的各
信息隐藏技术是信息安全领域的一个研究热点,在信息保密、多媒体版权保护方面有着加密技术所不具有的优点,并与之有着很强的互补性。信道编码是通信领域为提高信息传输可靠性
医学图像分割是医学图像处理与分析的一个重要领域,同时也是计算机辅助诊断与治疗的基础。所谓图像分割就是根据某种均匀性(或一致性)的原则将图像分成若干个有意义的部分,使
多媒体数据的数字化为多媒体信息的存取提供了极大的便利,各种数据可以自由地发布到网上,但是盗版问题也随之而来。数字水印技术是解决这一问题的有效途径,它通过在数字媒体(
集成了传感器、嵌入式技术、分布式信息处理技术和无线通信技术而形成的无线传感器网络(wireless sensor network ,简称WSN)是一种全新的信息获取和处理技术。但由于无线传感
网络教学作为一种新的教学手段,充分利用了计算机、网络和多媒体等技术手段,使教学行为能够跨越时间、空间的限制,具有极大的灵活性和交互性。同时,对比传统教学方式,网络教