论文部分内容阅读
随着计算机视觉技术的深入发展,通过鼠标、键盘作为输入接口的传统交互模式已然无法满足人们的需求,用户直接与计算机交流的自然人机交互才是理想的人机交互模式。手势识别作为以人为中心的更自然的人机交互方式,能够满足用户与虚拟环境之间的直接交互,在智能家居、体感游戏、哑语识别等多个领域都有广泛应用。因此,实时手势识别技术具有重要的学术价值和应用前景。现有的手势识别研究仍然存在诸多不足:训练固定手势模板的识别方法难以满足实时性交互需求;单一基于手部肤色特征提取的手势识别方法在手势分割时容易出现分割不完整,导致识别率不高;基于可穿戴设备的手势识别方法要求用户必须佩戴数据手套等设备,此类设备价格昂贵且不利于推广。本论文主要针对手势识别算法中的手势区域肤色分割、手势特征提取、数字手势识别三大部分进行了详细研究,主要工作如下:首先在手势区域分割阶段,研究了普通摄像头平台下采集图像未出现人脸和出现人脸两种情况下的分割方法。当摄像头采集图像未出现人脸时通过阈值化肤色检测器直接提取手势区域;当摄像头采集图像出现人脸时,根据人脸与手部肤色一致性原则,提出了融合人脸肤色检测的手势区域分割新方法。该方法通过人脸检测获取人脸区域肤色像素值范围,再与传统阈值法相结合,通过双阈值法准确的分割背景和手势区域,可以在一定程度上优化分割效果。其次在手势特征提取阶段,采用运动目标图像检测方法,在两帧帧间差分法的基础上,采用三帧帧间差法结合肤色分割来实现运动手势区域检测。根据本文算法提取了手势轮廓、手势凸包与凸缺陷、指尖与指间凹槽等重要手势特征,并在此基础上提出了基于指间凹槽最小外接圆的实时掌心检测定位方法,准确有效的实现了手势掌心的定位。该方法适应手势区域进行平移、旋转、翻转等不同场景下的识别特征提取要求,具有较好的鲁棒性。最后在数字手势识别阶段,根据提取到的指尖与指间凹槽和掌心等特征,构造出识别决策树模型,实现了对常用的数字手势快速准确识别。搭建的基于VS 2013集成开发平台的实时手势识别系统验证了上述方法的有效性。