基于骨骼点信息的人体动作识别方法研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:glrioa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体动作识别是计算机视觉领域的重要研究内容之一,它能够代替我们人眼进行人体动作意图的理解,随着近些年人工智能技术浪潮的迅猛来袭,它越来越受到研究者的青睐。人体动作识别在很多领域有着重要的应用,例如在医疗监护,公共安防,人机互动,和游戏娱乐等领域。现存的方法中,根据计算机处理数据类型的不同,大致分为以下几类:基于RGB数据的,基于RGB-D数据的,基于人体二维,三维骨骼点数据的。RGB数据携带大量冗余信息,因此除了带来计算量大的缺点外,还易受到光照,背景变化,遮挡等因素的影响,对识别精度和识别速度都有较大的影响。因此本文采用基于深度信息的三维骨骼点数据作为人体动作识别的特征。针对目前动作识别算法精度还不够高和实际动作识别系统比较难实现的问题,本文的研究内容主要包括以下几个方面:1.本文首先提出了一种基于两种特征协同规整的特征用于动作识别,这两种特征分别是经过预处理的骨骼点位置特征和速度特征,我们使用动态时间规整(DTW,Dynamic Time Warping)的方法把它们从骨骼序列中提取出来,因为在特征提取时对这两种特征使用协同规整的方式,所以我们把提取出来的特征叫做协同规整(CWTDF,Cooperative Warp of Two Discriminative Features)特征。在后面实验部分的识别精度对比中,在三大标准数据集MSR-Action3D,Florence3D-Action和UTKinect-Action上,我们提出的这种特征表示的识别精度超过了许多现有的方法。为了证明CWTDF特征的优越性,我们还考虑了另外一种场景,同样使用上述两种特征组合,但是在使用DTW算法进行特征抽取时,两种特征分别进行抽取,然后再进行融合,我们把用这种方式得到的特征叫做分离规整(SWTDF,Separate Warp of Two Discriminative Features)特征。在后面的实验部分也证明了,这种特征的识别精度在三大标准数据集上均不如CWTDF特征。这个结论也说明了利用DTW算法进行特征之间的协同挖掘所获得的特征比单独进行特征挖掘再融合所获得的特征更能够表示一个特定动作,这也是本论文的贡献之一。2.为了进一步提高动作识别的精度,在基于传统方法提取的特征对识别精度提升有限的情况下,本文还提出了一个使用机器学习的方法自动从原始特征中提取有用信息的算法,即基于骨骼点子特征学习的动作识别算法。该算法按人体的自然结构把人体的骨骼点分为5个部分,分别是人的四肢和躯干,每个部分都包含3个骨骼点,然后分别计算每个部分的相关特征。这样划分的依据是当我们在做某个动作时通常是身体的四肢和躯干中的一个或某几个部分动作的组合。在后面的实验部分也证明了这种分法能够为后续的特征学习提供足够的信息,使得分类精度达到较高的水平。在特征学习阶段我们设计了一个损失函数,因为我们最终采用的是K近邻分类算法,所以损失函数的目的是使得训练集中样本的原始特征X经过线性变换(左乘转换矩阵L)后,同类样本之间的欧式距离尽量的小,同时异类样本之间的距离尽量的大。经过梯度下降法不断的迭代,使得算法的识别精度不断提升。经过三大标准数据集的测试,我们的动作识别算法精度超过了许多文献的方法。我们还用实验的方法选取了算法中的相关参数,以使分类精度达到较高的水平。3.本文还设计了一个基于Kinect的动作识别系统,该系统可以利用Kinect摄像头对人体动作进行实时的识别,我们已经使用C#语言完成了系统的编写工作。该系统利用人体上半身和下半身共计12个角度作为每帧的动作特征,利用平均取帧法,每个动作取得12帧数据组成一个向量作为这个动作的特征表示。分类器选用一个3层的神经网络,是我们使用python编写的,待在python上训练好模型后,我们将权值矩阵拷贝到C#中。数据集是我们自己用Kinect设备采集的。经过测试,我们系统的分类正确率为85%。虽然本方法的正确率不如上述两种方法高,但是本方法的优点是特征计算简单,易于实际系统(C#)的实现,且利用角度特征不受骨骼尺寸大小的影响。
其他文献
慢性萎缩性胃炎(CAG)是消化科常见病、多发病,1978年被世界卫生组织列为胃癌癌前病变之一。阻止癌前病变的进展是降低胃癌发生率的有效措施之一。因本病发病因素多样,迁延反
含能材料作为现代武器装备的能量载体,必须满足高能量密度及低易损性的要求,但是含能材料的高能量和低感度性质却通常是对立的。因此开发高能量、低感度及综合性能优异的新型含能材料是近年来含能材料领域研究的热点。富氮杂环类化合物因具有高的正生成焓、低的碳氢含量以及环境友好的特点,受到含能材料科研工作者越来越多的关注。富氮杂环类含能离子盐与其分子类似物相比,具有更低蒸汽压、较高稳定性和低感度的特点,而且含能离
研究背景与目的自泌尿系统CT成像(computed tomography urograpy,CTU)应用于临床日常工作以来,已替代静脉肾盂造影(IVU)成为评估血尿患者病因的首要影像学检查方法。然而传统
<正>随着经济社会的不断发展,我国社会主要矛盾发生了转变,不平衡不充分的发展现状成为了新时代的主要问题。针对2020年实现全面建成小康社会的宏伟目标,习近平总书记在十九
随着信息化社会的高速发展,人们对光通信传输距离和传输容量的要求也越来越高,超长传输距离、超大容量的高速相干光通信系统是当前光通信领域的研究热点。色散是制约高速相干
以480t/h的循环流化床锅炉为研究对象,根据热效率和?效率的定义和计算方法,结合热力学第一定律和热力学第二定律,建立了适用于循环流化床锅炉的热效率和?效率的计算模型。分
本文根据农产品冷链物流发展的需要和气调库厂商的实际情况,设计了基于ASP.net四层架构的气调库综合信息管理系统。该系统通过设计强大的数据访问类,提高了数据的逻辑独立性
花呗作为支付宝平台新型网络支付工具,在网上消费、投资理财等方面得到广泛应用。但是日益频发的花呗套现案作为互联网金融领域的新型违法行为,扰乱了正常互联网金融秩序,给
水滴是组成水流的基本单元,下泄的水流可以近似看成是由多个离散的水滴形成的连续下泄的水体。水流入水时产生的所有现象均可以通过改变单个水滴下落时的粒径及高度进行体现,
随着我国农业发展规模化、现代化、专业化,农户进行农业生产所需要的资金日益增多,现代农业生产所需资金仅靠农户内源性融资已无法得到满足。为了解决农户融资困难,我国政府