论文部分内容阅读
手势是日常生活中除语言以外的另一个经常使用,自然且易于理解的交流方式,也是人机交互中信息传递,表达的重要载体。自然手势识别作为人机交互领域的重要研究课题,它的操作要求也代表了人机交互未来的发展方向:更自然,易操作,成本低,人性化等特点。本文针对2010年上海世博会广州案例馆中的360度互动体验区部分的动作感应操作中存在的问题做了深入的研究,在实验室已有的研究基础上提出手势检测,特征提取,分类识别的新方案,旨在提高手势识别的正确率和识别系统的稳定性。本文的主要研究内容包括以下几个方面:(1)手势检测与分割方面,在以前的研究基础上做了进一步的改进,使用肤色分割结合运动前景检测的方法进行手势定位检测,综合了两种方法的优势,相比于前期单纯使用肤色分割的方法,在分割效果,排除环境类肤色干扰方面有了较大的改进。(2)在手势的特征提取方面,将成功应用于行人检测系统的HOG特征应用到静态手势的特征提取环节。该特征描述子主要用于目标检测,对图像局部出现的方向梯度次数进行计数,此方法类似于边缘方向直方图,尺度不变特征变换以及形状上下文方法,相较于其他描述子,HOG特征保持了几何不变性,对手势的小幅度旋转具有一定的鲁棒性。(3)在分类识别方面,本文使用SVM线性分类器进行分类。支持向量机是建立在统计学习理论的VC维理论和结构风险最小原理基础上,根据有限的样本信息在模型的复杂性(即对特定训练样本的学习精度,Accuracy)和学习能力之间寻求最佳折衷,在解决小样本、非线性及高维度模式识别中具有特定的优势。(4)实现了数字手势的识别算法,并且根据该算法开发了一个手势控制PPT文件的演示系统。实验验证表明,基于HOG和支持向量机的静态手势识别算法在识别率,处理速度和稳定性方面有了较为明显的改善。本文的创新之处体现在手势的定位检测方面,综合使用肤色分割和运动检测的方法,分割出图像中具有肤色并且运动的手形,有效地排除了类肤色的干扰,为后续的分类识别工作做了较好的铺垫。