论文部分内容阅读
近年来,随着计算机技术的应用越来越广泛,人们对人机交互的要求也越来越高,希望整个交互过程能够方便自然、实时准确。至今仍广泛使用的输入设备如键盘、鼠标等严重限制了人机交互的速度和自然性。而基于视觉的识别方法则可以让用户摆脱对设备的依赖和束缚,直接通过身体的姿态和动作完成交互。这种方法一般会使用二维摄像头或深度摄像头如kinect等来采集动作图像的序列。其中,二维摄像头是最为常用的采集方式,相关的研究工作也较为深入,但由于检测方法繁琐和建模方式过于复杂等原因,大多不适用于实时性较高的场合。另外,手臂运动作为一种重要的交互方式,可以被广泛应用到游戏和机器人交互等方面,但其识别方法尚未得到广泛的深入研究。基于以上原因,本文提出并实现了一个实时手臂运动识别系统。该系统在单目2D摄像头下对手臂运动进行捕捉,得到一定数量的图像序列后(一般是一个动作的一个周期)通过三帧差分算法检测手臂运动,并使用基于手臂的二维棍状模型进行建模,最后通过朴素贝叶斯分类器对建模后的手臂运动进行分类。识别精度方面,系统可以准确识别单手臂和双手臂完成的挥手、招手、绕圈、推手这四个动作。实时性方面,在普通计算机上,对每个动作的识别时间一般是4-6秒,而用户做一个动作的时间一般是2秒,即计算时间大概是2-4秒。归纳而言,本系统的优点体现在三个方面:第一,在单目摄像头的环境下完成手臂运动识别,没有额外的设备和环境要求,实用性高;第二,采用了高效的运动检测算法和建模方法,计算量少,速度快,较好的满足了实时性的要求;最后,在分类时将时间信息加入到属性值中进行训练分类,得到比较精确的分类识别结果。