基于深度学习和路径重积分特征的手势识别研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:hccstarttttt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,手势交互受到越来越多的关注。同时,随着深度摄像头(如Kinect,Real Sense)的应用和人体姿态估计算法的发展,我们可以从图片或视频中获取人体的关键点坐标。虽然基于关键点轨迹的手势识别已经取得重大的进展,但是仍然存在以下挑战:(1)信息量较少;(2)尺度变化大;(3)类内差异大;(4)类间差异小。现有的方法主要可以分为基于特征设计的方法和基于深度神经网络的方法,前者相对简单,但是特征缺乏泛化能力,且对领域知识有较高的要求,后者效果较好但是通常有较大的计算量且需要更精细的超参数调整。基于上述的观点,本文从特征提取、网络设计、特征提取与网络训练融合三个方面对基于关键点坐标的手势识别进行了深入的研究,包括:(1)基于手部单关键点轨迹及其路径重积分特征的手势识别;(2)基于骨架多关键点轨迹及其路径重积分特征的手势识别;(3)基于路径重积分卷积一体网络的手势识别。主要的研究内容和贡献如下:基于单个关键点的时间轨迹进行手势识别,关键在于对轨迹点的时序信息进行建模。本文利用路径重积分特征对手部轨迹进行建模,提出了路径重积分网络和对数路径重积分网络,该网络结构能够对时序信息进行建模,同时将彩色和深度视频的信息融合。另外,本文还提出一种随机丢帧的数据增强方式。最后在SKIG数据库上进行实验,实验结果证明了算法的有效性。基于骨架信息的多关键点轨迹进行手势识别,需进一步对空间信息和时空信息进行建模。本文基于骨架序列的特点,设计具有时间、空间和时空信息的路径重积分特征。在网络结构方面,本文提出了时序平移模块用于对齐骨架序列的关键帧。本文使用多支路的全连接结构进行最终的分类,并在Chalearn 2016,Chalearn 2013,MSRC-12三个数据库上验证了算法的有效性。本文进一步引入了可微分的路径重积分模块并设计了三种模块,分别为:可变形路径重积分模块、时间路径重积分模块和空间路径重积分模块。主要目的是针对性优化前面工作的两个局限性:(1)特征提取与网络训练相互独立;(2)需预先定义用于计算路径重积分特征的路径。最后,本文基于路径重积分模块提出了端到端的路径重积分卷积一体化网络,并在Chalearn 2013数据库上验证算法的有效性。综上所述,本文在特征提取、网络设计、特征提取与模型训练融合三个方面对基于关键点轨迹的手势识别任务进行研究。在特征提取方面,本文引入路径重积分特征,设计多种类型的特征对手部轨迹进行时空建模;在网络设计方面,本文提出时序平移模块用于解决关键帧偏移问题,并通过鲁棒的特征以及高效的特征融合进一步简化网络结构;最后,本文设计可变形路径重积分模块来融合特征提取和网络训练过程,并通过网络监督的形式自动学习路径形状。
其他文献
近年光伏、风电等新能源迅猛发展,新能源发电在电力系统中的渗透率日益上升。但是光伏、风电的波动性和间歇性,以及传统的新能源发电缺少惯性和阻尼特性,对电网的稳定运行产生了负面影响。在此背景下,虚拟同步发电机(virtual synchronous generator,VSG)技术应运而生。虚拟同步技术在控制系统中引入惯量和阻尼,模拟了同步发电机的旋转惯量和阻尼特性,提高了系统的稳定性。在孤岛模式下,V
织物疵点是影响纺织品质量和价格的重要因素。目前织物疵点识别大都采用人工识别的方法,但因受主观因素影响存在着效率低下、精度有限、识别结果缺乏客观性等不足。尽管国内
栾树(Koelreuteria paniculata Laxm.)观赏、应用价值高,适应性强,是我国优秀的园林绿化乡土树种,具有巨大的推广前景。为了筛选出具有较高观赏价值的栾树优良类型,本研究调
1978年以来的40多年间,党和人民就如何促进农村改革和发展进行了诸多探索。1978年初菏泽市小井镇在全国最早实施家庭联产承包责任制,比作为全国农村改革先锋和模范的小岗村分
在我国,冶炼烟气是大气中SO_2的重要排放源,随着冶炼行业大气污染物排放标准的提高,净化冶炼烟气中的SO_2已成为急需解决的难题。本文以铜冶炼烟气为研究对象,针对铜冶炼烟气中SO_2浓度高、气量波动大等特征,提出一种铜冶炼烟气中SO_2的净化及脱硫液制备黄钠铁矾的方法。本研究采用铜渣尾矿制成的矿浆液相吸收冶炼烟气中的SO_2,达到净化烟气中SO_2目的,并对反应后脱硫液中的铁元素和硫酸根进行回收利
多聚焦图像融合是将同一场景下聚焦不同目标的清晰区域进行融合,来获得全清晰图像,在航空、医学、军事等领域应用十分广泛。该技术涉及图像分割、特征提取和特征层信息融合等多个技术难题,其中特征信息融合为核心问题。然而融合模型的设计常常忽略前后步骤的关联,为了解决模型设计独立和应用场景有限的问题,引入当下流行的深度神经网络技术。本文的研究内容包含以下几个方面:(1)分析研究了不同层次的图像融合方法的操作流程
电致化学发光(Electrochemiluminescence,简称ECL)是在化学发光基础上发展起来的一种新的分析方法,是化学发光与电化学结合的新的技术。它同时具有化学发光与电化学技术的优点,比如灵敏度高、选择性好、背景信号低、线性范围宽,反应可控等特点。目前,已有的电化学发光体系包括无机体系、有机体系和纳米材料体系。其中,无机体系主要包括钌配合物和铱配合物,有机体系主要包括蒽、芴、噻吩基三唑,
本文中,我们探讨了机器学习中的稀疏重构问题。针对非凸且NP-难的L0优化问题介绍了两种求解思想:L1正则化方法和贪婪策略。对于这两种求解思想我们列举出了相应已提出的算法。贪婪逆尺度空间流算法由自适应逆尺度空间流算法演变而来,同时结合了L1正则化方法的准确性和贪婪算法的高效性。本文介绍了精度矩阵的统计学意义,并将贪婪逆尺度空间流算法自然地推广到稀疏精度矩阵的重构中。最后,我们将贪婪逆尺度空间流算法重
随着大数据时代的到来,信息过载问题日益突出。如何从大量的非结构化的数据中找到对自己有用的信息成了急需解决的问题,在这种情况下,推荐系统应运而生。本文主要介绍了关于topN推荐的协同过滤算法和基于图模型的算法,针对本文用到的学生刷卡数据集,进行了符合实际的算法的改进。本文提出了两种新的描述商品在推荐列表中的位置的评价指标。针对协同过滤算法,我们提出了一种计算相似度时减少算法复杂度的算法。针对图模型算
作为全球的重大挑战之一,癌症和基因疾病正严重危害人类的生命和健康。前人研究表明,金属元素可以通过与脱氧核糖核酸(DNA)碱基鸟嘌呤结合,打开鸟嘌呤和胞嘧啶间氢键,或者选