结合决策树分类和运动轨迹拟合的Kinect手势识别方法及其应用研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:neversoft
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机软件技术和硬件设备的快速发展,近年来人机交互模式发生了巨大改变,传统的鼠标与图形界面的交互方式已无法满足人们日益增长的交互需求,各类更加自然的交互模式应运而生,如用户可以通过语音、触控、手势等符合日常生活习惯的方式与计算机进行各种交互。其中,手势交互是一项广泛应用于家庭娱乐系统中的技术,而Kinect作为一项创新性应用成果,为手势交互提供了重要的设备支持。传统的基于视觉的手势识别方法在识别过程中存在着一些不足和问题,如基于模板匹配的方法在手掌倾斜的情况下匹配正确率较低;当模板数量较多时,匹配所消耗的时间会大大提高。此外,复杂背景以及环境的干扰也会对手势识别产生影响。针对以上问题,本文提出了一种结合决策树分类和运动轨迹拟合的Kinect手势识别方法,从融合静态手势识别和动态手势轨迹拟合这一角度探索了手势动作的实时识别问题。本文从Kinect的组成结构和关键技术出发,通过运用Kinect的深度图像和骨骼追踪功能实现了手掌轮廓的提取。然后,本文使用圆周序列曲线对手掌轮郭进行建模;利用极值点对法准确地区分出各个手指的轮廓来建立特征集,并利用决策树对特征集进行分类训练,从而完成静态手势的分类与识别。本文静态手势识别的方法在自采集数据集和10-Gesture上进行了实验验证,平均识别率分别为85.31%、85.30%。针对手势交互中的人手轨迹识别问题,本文提出了一种手势轨迹的直线与抛物线拟合方法,通过识别出的手掌运动轨迹类型来辅助判断手势,从而消除交互过程中手部不规则运动对手势识别的干扰。本文分别对直线拟合与抛物线拟合进行了实验验证,拟合这两类手势运动轨迹的平均正确率为97%、92%。在此基础上,本文结合静态手势与动态手势轨迹识别结果,以轨迹的类型和轨迹起始帧与结束帧的静态手势类型确定手势语义,并将其应用于FreeScup雕塑辅助设计应用之中,从而通过使用手势与三维雕塑辅助设计平台的自然交互,达到提高建模效率的目的。
其他文献
该文对软件静态分析技术进行了深入的研究,分析了软件静态分析技术的起源和发展,特别讨论了手工静态分析技术与计算机自动静态分析技术的不同特点和关系,对静态分析技术的发
绘制技术是将几何模型转变成人们视觉上清晰直观图像的手段,它的研究内容非常广泛,该文主要集中研究如下三个方面:一、辐射度技术及其工程应用,辐射度技术是全局光照的主要算
随着Internet技术的成熟和计算机应用的广泛深入,越来越多的企业选择通过互联网进行产品的宣传和介绍。目前,常见的作法是在一些知名的网站运用它们已设计好的固定模式来进行产
该文首先阐述了基于CSCW技术的协同创作系统CAS的特点,并通过比较目前CAS并发机制几种常用的方法,选用了实现复杂度较小的加锁方法.针对目前加锁法较难解决的封锁粒度选择问
该文主要研究了数学内容的MathML表现形式的标记表示和识别.第一,实现了数学内容到其MathML代码的自动转换输出,并生成其对应的XHTML文件的数学内容处理系统MMPS(Mathematica
该文建立了一个用于指导相异性设计的系统管理模型框架,并对模型框架中与相异性设计紧密相关的三个关键模型问题作了进一步研究,模型包括相异性模型、设计方法模型和过程活动
该文从新特征挖掘、特征鲁棒处理、与识别基元集相关的特征选取三个方面研究适合鲁棒语言识别的声学特征提取与处理方法,主要的研究工作包括:(1)提出了基于最小分类错误的特
软件可靠性是软件的重要质量指标之一,软件容错技术是软件可靠性技术中非常重要的一项.软件容错技术包括很多方面的技术,主要有故障检测、故障恢复、冗余技术等.该文主要对基
随着数字通信的发明,数字数据共享的增加使得安全需求急剧增加。这些信息可以作为文本或多媒体的形式,即(语音、视频、图像)通过现有的互联网上发送。如今,数字图像是一个需要保证
该文主要从以下方面展开论述:课件的发展及模块化课件开发模型概述;设计系统所需的相关技术研究;远程教育标准的发展现状及其应用;利用模块化课件开发的技术,设计一个面向教