论文部分内容阅读
随着计算机视觉和图像处理的不断发展,人体动作识别这一技术在人机交互、虚拟现实等领域得到了广泛的应用。然而因为人体运动的复杂性以及由不同主体进行的相同动作的多样性,人体动作识别仍然是一项具有挑战性的任务。作为彩色摄像机的补充,深度摄像机在研究和发展上取得了很大的突破,并且一些深度传感器设备还能提供提供实时的人体骨骼数据,从而基于骨骼数据的人体动作识别成为了研究热点。本文利用Kinect提供的骨骼数据,对骨骼数据的特征描述以及分类识别算法进行了深入研究,提出了一个人体动作识别的新框架,并通过实验验证了其有效性;然后使用此框架设计并实现了一套人体动作识别系统。本文的主要工作和创新点如下:1.本文提出了基于关节划分的骨骼特征提取方法。该方法充分研究了骨骼数据以及人体运动的特点,首先将人体骨骼分为了躯干、一级关节、二级关节三个部分,并用基于关节向量夹角、关节位移矢量和关节相对位置的三种方法对骨骼数据分别的进行特征提取,构建了由多个特征子集组成的特征集。这一方法不仅去除了骨骼数据中大量的冗余,保留了具有较强判别能力的特征,并且在实验中验证了每个特征子集能有效提高识别准确率。2.使用局部聚合描述子向量(VLAD)对动作特征进行描述,并提出了基于PCA白化的VLAD改进算法。骨骼数据序列中同时包含着空间与时间特征信息,有别于学界常用的HMM模型以及DTW算法,本文将用于图像检索领域的VLAD模型应用在了动作识别中,将动作序列中的时间信息与空间信息融合在了一起,对动作特征进行了更进一步的整体描述。之后使用PCA白化的方法对VLAD进行了改进,降低数据维度的同时去除了噪声和冗余,提高了框架的识别准确率。3.引入大间隔最近邻算法(LMNN)构建分类器,并对其过拟合问题以及运算速率进行了改进。基于上述的特征描述方法,本文利用LMNN算法,通过度量学习的方法提高了 K近邻算法(KNN)的识别准确率。之后本文针对动作识别中容易出现的过拟合问题,在LMNN中引入了正则项,并使用小批量梯度下降法提升了其运算速率。最后在实验中验证了改进的LMNN算法的性能,并且与SVM算法进行了比较。4.设计并实现了一套动作识别系统。动作识别系统主要由动作捕捉模块、动作分割模块、动作训练与识别模块组成。其中,在动作分割模块,为了更好的将摄像头捕捉到的动作序列进行分割,本文还提出了 一种基于运动状态和时间阈值进行分割的方法。