论文部分内容阅读
随着科技的进步,计算机技术迅猛发展,软硬件设备不断更新,有关机械设备和人类之间的交互应用呈指数级增长势态,人机交互技术开始成为当今技术研究热点。随着研究的深入,计算机和用户之间的关系也从用户主动去适应计算机,逐步走向以用户为中心,计算机主动去适应用户的新阶段。目前,学者们正致力于研究出一种以使用者为中心的,自然的,和谐的人机交互技术。手势是一种自然,直接,符合用户习惯的交互方式,手势交互具有快速,非接触,容易理解等优势,因此,对手势识别的研究,可以增强用户的沉浸感体验,使交互体验更为直观和舒适。手势识别在手语识别、游戏娱乐、机器人操控、智能监控、视觉环境操作等领域均发挥了重要作用,对手势识别的研究是实现人机自然交流的必不可少的一环。目前国内外针对手势识别的研究,主要分为基于2D摄像头的二维手型识别和二维手势识别以及基于3D摄像头的三维手势识别这三类,前两种完全基于二维层面,第三种包含深度信息。最初,研究者主要是利用机械设备辅助检测人手的各个关节的位置,角度信息(易靖国等,2016),从而识别手势含义。1983年,数据手套的推出,使得手势识别的精度和稳定性有了较大的提高,但是存在手势的自然性受限和可识别手势较少等缺点,近年来,深度摄像技术逐渐兴起,在深度数据的辅助下,基于视觉的手势识别研究不断取得新的突破,有力地推动了手势识别系统的实用化发展(陈红梅等,2018)。但是仍存在复杂背景下识别精度低,模型泛化能力不足等问题。Kinect作为一种深度摄像头,可以捕获三大数据信息:深度、彩色以及原始音频数据(孙鑫等,2017)。Kinect具有功能强大、价格低廉、环境适应性好(朱涛等,2014)和开发便捷等优点,有鉴于此,本文提出了基于Kinect数据识别静态手势的方法,主要研究了以下几个方面的内容:(1)基于Kinect数据的静态手势设计。本研究设计了十种手势,分别表示0~9来进行实验。手势自然,常见,力求使实验结果更加可靠全面,对比明显,分析准确。(2)结合Kinect的彩色、深度数据以及骨架信息,提出了一套静态手势识别的算法流程。本文通过对国内外手势识别的研究现状进行深入理解学习,并对相关算法进行实验对比,针对识别手势多变,背景复杂,实时性要求高等特点,总结现有算法的优势与不足,提出了一套基于Kinect数据的静态手势识别的算法。识别算法流程包括:数据获取、预处理、手部区域定位、分离背景、提取手部、手势识别七个部分。实现了基于Kinect数据的静态手势识别,保证了识别的正确性和实时性。(3)实验验证。设计开发了基于Kinect数据的静态手势识别软件,针对设计的十种手势,搭建了手势识别界面,实现了数据录入,手势识别,结果输出的功能。并进行实验对比,结果分析,证明了本文所提出的识别算法的效率和准确性。为今后的静态手势识别研究提供了参考。