论文部分内容阅读
随着计算机技术的发展,人机交互在人们的日常生活中显得非常重要。人们开始追求一种更自然、更智能、更符合人类交流习惯的交互方式。基于手势的信息交流自然、方便,并能实现非接触式的交互,能够满足人机交互的新需求。因此,手势识别技术一直是人机交互领域的研究热点。目前,手势识别技术已经取得较大发展,但在实际应用中仍然存在一些问题。主要难点包括以下两方面:(1)如何消除复杂背景对手势分割的影响。在实际应用中,背景往往包含很多形状复杂、颜色多样的非手势区域以及人脸和其他身体肤色部分的干扰,同时光照的颜色和亮度也会发生各种变化。在这种环境下,基于运动信息的方法虽然可以有效排除类肤色区域的干扰,但很难提取到完整的手势;基于肤色模型的方法很难适应人种肤色差异、光照变化且无法排除类肤色区域。(2)如何提取有效的手势特征。人做手势时有多个自由度且人手本身存在肤色、尺寸的差异,几何结构也比较简单,可提取的信息较少,所以提取有效的手势特征比较困难。针对手势分割和识别方法存在的问题,本文的主要贡献和创新点包括以下几点:(1)在手势分割方面,针对背景中非手势区域、类肤色区域的干扰,将区域对比度模型用于手势分割中,并针对该模型存在的不足,提出肤色-区域对比度模型。该模型通过建立基于HSV和YCbCr颜色空间的高斯肤色模型,得到肤色显著图,与区域对比度显著图融合得到最终的手势显著图。最后通过固定阈值分割方法提取手势区域并通过实验验证了该方法较基于区域对比度模型的手势分割方法有更好的手势分割效果。(2)在手势分割方面,针对人脸和身体其他部分肤色的干扰,本文首次采用了一种基于多特征的贝叶斯推理模型用于手势分割,该模型通过HMAX模型提取形状和纹理特征,排除类肤色区域干扰;并对HSV和YCbCr颜色空间进行量化后提取颜色特征,排除其他非肤色区域干扰。最后将得到的特征作为贝叶斯网络的输入得到手势空间概率分布图即手势显著图。实验结果表明,该方法有效降低了复杂背景的干扰,提高了手势分割的精确率和召回率。(3)在手势识别的特征提取中,本文提出Hu矩特征和HOG特征的融合方法,并采用PCA降维,通过支持向量机实现手势识别。最后通过实验验证了该方法较单一特征识别率有显著提高。