论文部分内容阅读
眼睛不仅是人们观察、了解外部世界的一个重要器官,更是人们心灵的窗口。稳定的眼球跟踪与视线估计系统已经在心理学、军事、市场调研和广告测试、计算机视觉、医学等领域有了初步应用。基于视线控制人机交互系统也在给传统的人机交互方式带来巨大挑战。近年来,基于图像法的非接触式眼球跟踪与视线估计受到越来越多的关注。本文总结了国内外关于眼球跟踪与视线估计的研究现状,提出了一种新的快速准确的虹膜中心定位方法,并在该定位算法基础上实现了对眼球的跟踪。本文还提出了一种可以允许头部大范围转动的视线估计方法。主要工作内容与成果如下:1.为了提高虹膜中心定位的精度与速度,本文提出了一种快速准确的虹膜中心定位算法。首先检测图片中的人脸并确定初步的眼部区域,然后设计不同卷积核与眼部区域图像进行卷积,将卷积后的图像对应相除获取卷积商矩阵。通过计算商矩阵最大值处对应的位置及卷积核的半径来获得人眼的中心和半径。卷积核的设计时考虑了虹膜中心处的位置、灰度值及虹膜巩膜边界灰度值的变化规律,并加入傅立叶变换计算卷积,从而实现快速、准确的定位虹膜中心及半径,并且在公开的人脸数据集BioID上与现有的虹膜中心定位方法进行精度与速度的对比。最后在该定位算法的基础上利用视频序列上下帧之间的关系实现了眼球跟踪。2.针对现有的视线估计系统要求的高分辨率图像,红外光源,头部转动等要求,本文提出了一种可以利用普通网络摄像头的并且是无光源的可以允许头部转动视线估计方法。在该算法中,利用监督下降的优化方法(Supervised Descent Method,SDM)对人脸图像计算人脸特征点,再利用POSIT算法确定头部朝向。然后将人眼的眼角,虹膜中心及眼皮上的点作为人眼特征点,定义人眼特征向量,建立人眼特征向量与视线角度的匹配模型。通过校准屏幕上的点来获取人眼的训练数据,再利用自适应线性回归的的方法来确定模型参数,从而计算头部静止时的视线相对头部运动的三个偏移角度,最后通过结合人头部朝向与视线偏移角度来确定视线方向,从而实现了可以允许头部转动的视线估计系统。3.最后,在分析总结上述研究方法的理论基础与实验结果之后,本文对后续的研究方向进行了展望。