基于骨骼数据的人体动作识别系统的设计与实现

来源 :北京邮电大学 | 被引量 : 3次 | 上传用户:goddragon007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机视觉和图像处理的不断发展,人体动作识别这一技术在人机交互、虚拟现实等领域得到了广泛的应用。然而因为人体运动的复杂性以及由不同主体进行的相同动作的多样性,人体动作识别仍然是一项具有挑战性的任务。作为彩色摄像机的补充,深度摄像机在研究和发展上取得了很大的突破,并且一些深度传感器设备还能提供提供实时的人体骨骼数据,从而基于骨骼数据的人体动作识别成为了研究热点。本文利用Kinect提供的骨骼数据,对骨骼数据的特征描述以及分类识别算法进行了深入研究,提出了一个人体动作识别的新框架,并通过实验验证了其有效性;然后使用此框架设计并实现了一套人体动作识别系统。本文的主要工作和创新点如下:1.本文提出了基于关节划分的骨骼特征提取方法。该方法充分研究了骨骼数据以及人体运动的特点,首先将人体骨骼分为了躯干、一级关节、二级关节三个部分,并用基于关节向量夹角、关节位移矢量和关节相对位置的三种方法对骨骼数据分别的进行特征提取,构建了由多个特征子集组成的特征集。这一方法不仅去除了骨骼数据中大量的冗余,保留了具有较强判别能力的特征,并且在实验中验证了每个特征子集能有效提高识别准确率。2.使用局部聚合描述子向量(VLAD)对动作特征进行描述,并提出了基于PCA白化的VLAD改进算法。骨骼数据序列中同时包含着空间与时间特征信息,有别于学界常用的HMM模型以及DTW算法,本文将用于图像检索领域的VLAD模型应用在了动作识别中,将动作序列中的时间信息与空间信息融合在了一起,对动作特征进行了更进一步的整体描述。之后使用PCA白化的方法对VLAD进行了改进,降低数据维度的同时去除了噪声和冗余,提高了框架的识别准确率。3.引入大间隔最近邻算法(LMNN)构建分类器,并对其过拟合问题以及运算速率进行了改进。基于上述的特征描述方法,本文利用LMNN算法,通过度量学习的方法提高了 K近邻算法(KNN)的识别准确率。之后本文针对动作识别中容易出现的过拟合问题,在LMNN中引入了正则项,并使用小批量梯度下降法提升了其运算速率。最后在实验中验证了改进的LMNN算法的性能,并且与SVM算法进行了比较。4.设计并实现了一套动作识别系统。动作识别系统主要由动作捕捉模块、动作分割模块、动作训练与识别模块组成。其中,在动作分割模块,为了更好的将摄像头捕捉到的动作序列进行分割,本文还提出了 一种基于运动状态和时间阈值进行分割的方法。
其他文献
灯夹戏是我国传统优秀民间文化,它的历史悠久,是一门自明代起就有记载的民间艺术。随着时代的变迁,现在农村出现的灯夹戏已经出现了本质的变化,它不再是传统的戏剧表演,取而
研究和开发一种具有高活性和稳定的催化剂,并且价格低适合于大规模的工业生产应用,一直是甲烷催化重整反应研究的关键课题,本文设计和制备了一系列以铝镁的复合氧化物为载体的镍
通过对辽河干流坝间10个断面耕地土壤05 cm、515 cm、1530 cm沉积层重金属铜、镉、锌、铅含量测定,评价了该区土壤重金属污染程度,并采用地质累积指数法评价单一重金属污染状
古人云:欲立其业,先树其德。可见,德育对人的一生影响之大,不言而喻。信息技术教学不仅仅是让学生具备一定的信息素养。更重要的是培养学生良好的道德行为和意识。本文从教师
本文研究机载合成孔径雷达(SAR)斜视区域成像,提出在一维距离像上对地面像素逐个进行距离对准和相位补偿的运动补偿方法.该方法在完成斜地校正的同时,还能有效地改善方位聚焦并
<正>1问题描述和解决方案桃江南方脱硝系统自2012年投运以来,由于采用的手动控制,存在较大的问题如因操作不及时造成氮氧化物排放波动大、时均值偶尔超标、氨水用量较大,迫切
生物酶法合成生物柴油具有原料-生产过程-产品全绿色的特点,但酶法生产生物柴油过程中,由于底物短链醇、油脂和催化剂脂肪酶之间在溶剂中不能很好的相溶,使得生物柴油产率降
总结了1200例微型腹腔镜下疝手术的手术配合,重点强调手术室护士必须熟悉手术步骤,熟练掌握手术仪器、器械的性能及其灭菌方式与使用,术中密切配合实施气腹的完成,做好各种导
一项并购成功与否,并购价格的合理性是一个重要因素。要对目标企业合理定价,不失公允地保障各方的利益,就必然需要进行合理有效的资产评估。资产评估已经成为并购活动中重要
内源性肽以细胞因子、生长激素、激素肽等形式在人体的内分泌、神经、细胞生长和生殖各个领域发挥功能。神经肽是一种内源性肽,与痛觉、睡眠、情绪、学习与记忆等生理活动相