基于深度信息的实时手语识别技术研究

来源 :武汉理工大学 | 被引量 : 1次 | 上传用户:fjsgxxs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能等技术的快速发展,手势识别作为一种主要的人机交互方式逐渐成为热点问题。手语作为一种特殊的手势,也是语言障碍者的主要交流方式。手语携带有丰富的信息,具有良好的表达能力。一般无语言障碍者不具备手语技能,基于计算机视觉的手语识别的研究,既能方便语言障碍者和无语言障碍者之间的交流,又对人机交互的发展有着重要意义。本文通过Kinect传感器提取手语过程中的运动轨迹和关键手型作为实时手语识别的依据,对静态手型的特征提取、动态手语的跟踪和实时识别策略进行了研究和改进:(1)使用深度阈值和肤色阈值相结合的手部分割方法来获取手型:首先对获取的深度数据进行阈值分割,得到手部和小臂所在区域,将其映射到彩色图像空间,再进行肤色阈值分割;通过追踪骨骼点坐标来获取运动轨迹,并对其进行预处理。(2)提出了一种融合Hu矩和SURF(Speeded Up Robust Features)的特征提取方法:Hu+SURF-BoW。通过SVM分类器采取不同特征进对静态手语进行分类实验,实验表明Hu+SURF-BoW特征具有较好的识别性能,相对于Hu矩和SURF具有更好的稳定性。提出了一种在使用SURF对手语图像配准过程中剔除误匹配点的方法:以手型二值图的主方向作为基准,来确定两幅图像中的匹配特征点的相对角度,然后计算特征点的相对位置来剔除误匹配点。(3)将高速跟踪算法核相关滤波(Kernelized correlation filters,KCF)算法应用到手语跟踪当中跟踪双手,针对在手语过程中手部发生尺度变化和遮挡等情况,建立独立的尺度相关滤波器来进行多尺度追踪,使用Kalman滤波和自适应模型更新的策略来抵抗遮挡。(4)使用动态时间规整(Dynamic time warping,DTW)作为手语识别算法。使用端点放宽的条件约束、提前终止匹配和LB_BC下界函数剔除部分候选序列的方法,提高DTW算法的匹配速度。提出一种根据手部运动轨迹点的密度曲线采用滑动窗口来提取有效关键手型的方法,提高系统的实时性。最终设计手语识别系统,采用前文的识别算法和识别策略,完成对70个手语词的实时识别,识别率达到90.54%。
其他文献
作者于2004年3月至2006年4月在吉林省左家自然保护区进行了山地次生林喜鹊(pica pica sericea Gould)巢址选择的研究。主要内容包括:喜鹊行为观察、喜鹊巢址选择特征、喜鹊潜
本文简要介绍了GPRS技术的特点及目前的部署状况:利用西门子公司的GPRS模块,重点提出了一种基于GPRS实现桥梁检测远程数据传输系统的设计和方法;具体说明了系统实现中的难点和关
随着时代的进步,人们的审美观念不断在提高与发展,汽车产品的造型设计也不断地向高水平发展,纵观汽车造型设计的演变,汽车设计语言有一个明显的趋势,就是汽车外观越来越“棱角分明”,但是,这大大增加了汽车车身覆盖件的生产难度。在汽车行业中,汽车覆盖件通常被称为A级曲面,这类曲面要求喷漆后在光照条件下不会出现严重的反射问题,常见的汽车A级曲面表面缺陷有模具压痕,塌陷,畸变,冲击线以及滑移线等。滑移线是冲压成
作为一种新型的变压器用绝缘油,植物绝缘油与矿物绝缘油在成分上存在差异,其理化、电气性能也不尽相同,这势必对两者构成的油纸绝缘老化特性产生影响。目前关于植物绝缘油的