论文部分内容阅读
人机交互技术是一门集计算机应用学,计算机图形学,人工智能,心理学等学科交叉融合的综合性学科。当前计算机硬件技术飞速发展,人类越来越高的交互需求也对人机交互技术提出了新的要求。人机交互作为当前信息产业的一个焦点,被众多国家列为21世纪重点发展的关键性技术。它的目标,就是能研究出一种“能看、能听、能说、能理解人类语言”的智能计算机。其中基于视觉的人机交互系统因其高效的交互效率,良好的用户体验和低廉的使用成本已被广泛开发并应用。本文主要的研究内容有:视觉人机交互系统的研究背景及国内外现状、人脸特征区域快速检测并定位、基于视觉的人机距离测量、人眼虹膜精定位以及交互算法研究。本文在全面总结视觉人机交互系统的基础上,提出一种单目视觉条件下基于人脸特征区域定位的人机交互系统。本文改进了传统的Adaboost算法,扩展了Haar特征集,提高了特征检测的效率和准确率。本文通过建立距离与图像像素关系,构建人机测距方程,完成人脸到摄像头的距离测量,为交互算法提供距离参数。在虹膜精定位模块,通过引入人机距离信息,估计并预设虹膜半径,优化Hough变换的计算量,提高运算效率。通过引入眼角点,判断人眼注视信息,完成交互过程。在人机距离测量模块,首先通过改进的AdaBoost算法快速检测并定位特征区域,其次利用系统约束条件、摄像机标定原理和面积映射关系推导像距测量方程,完成距离测量。通过规定距离实验,证明了像距测量方程的可行性。复杂环境实验表明系统在复杂背景下有较好的鲁棒性,但不同光照会影响测量精度。系统适应性实验验证了对多名待测者的普遍适用性,但佩戴眼镜会影响测量的精度和实时性。所有实验表明,测量系统在量程内有较高精度,处理速度约为5帧/秒,满足精度与实时性要求。对于虹膜精定位模块,通过对传统的Haar特征进行扩展,引入能更好区别人眼和眉毛的特征矩阵,提高人眼特征检测率。通过预处理粗定位的人眼图像,提取并恢复人眼虹膜边缘。利用人机距离信息,预设虹膜圆半径,提高运算效率。通过对两种改进方案的对比,可知采用约束圆半径范围的方法能更好地保持检测准确率与运算效率之间的平衡。该方法将运算效率较传统Hough变换提高一个数量级,具有良好的定位效果。本文提出的基于人脸特征区域定位的人机交互方案具有较高的交互效率和良好的使用性能,系统在复杂环境下依然具有良好的使用性能,对于不同的用户,系统也有较好的适应性。除此之外,系统仅需要一个摄像机既可完成交互,具有使用方便,成本低廉等优点。