论文部分内容阅读
基于视频的动作捕捉技术一直是计算机视觉领域中热门的研究方向之一。它主要应用于影视动画制作、人机交互游戏、动作分析(运作、医学方面)、以及智能监控等方面。人体运动捕捉的关键技术是姿态估计,即从二维视频中提取三维人体姿态参数。研究的主要内容涉及相机定标、背景分割、三维重建、姿态初始化、运动跟踪等方面;其中跟踪问题是研究的难点和重点。在非标记的动作捕捉系统的研究中,可分为基于模型和基于无模型的方法。其中基于无模型的方法需要建立样本训练集,系统的复杂度较高;而基于模型的方法存在模型与实验数据不匹配等问题。本文针对这些问题提出一种自顶向下分层次地跟踪方法,可准确地从视频中恢复出人体姿态。主要的工作归纳如下:首先,本文提出了一种基于轮廓分割的初始化方法。此方法通过整合首帧图像中人体的二维及三维信息进而自动地恢复出人体的三维姿态,并建立自适应的人体模型,从而完成人体模型的初始化。该方法首先从选定的视图中提取前景信息,即人体轮廓,然后采用区域分割法对人体轮廓进行标记;接着采用基于查找表的轮廓恢复外形(Shape-From-Silhouette,即SFS)算法,结合二维图像的人体姿态信息与三维空间信息,恢复出分块标记的三维人体体素;最后,根据分块标记的体素信息以及人体骨架的拓扑约束关系,提取出三维人体骨架的参数及空间位置信息,从而完成三维人体模型的初始化。其次,根据人体运动在时间和空间的连续性,本文提出基于标记体素的运动跟踪方法。为了快速实现运动跟踪,本文首先根据人体体素的连通性,将人体体素分为表层体素、内层体素和中间层体素。其中中间层体素用于人体运动跟踪,表层体素用于模型参数的全局优化。该方法首先通过模板搜索的方法检测出头部的信息;然后预测人体躯干的主方向向量,并采用主成分分析(Principal ComponentAnalysis,即PCA)算法提取出根部节点信息。接着,将余下的体素与前一帧的模型参数在马式距离约束下进行分割标记,并与其对应的模型体块通过最近点迭代(Iterative Closest Point,即ICP)算法进行匹配,获取局部最优参数值。最后,对此刻获取的人体模型参数进行全局优化。最后,对本文提出的非标记姿态恢复系统中初始化和跟踪算法进行实现,并采用Brown Universigy公布的运动捕捉视频和误差评估的方法,对本文所提方法进行验证。实验证明,本文的方法具有可行性,且复杂度较低,具有一定的研究价值和应用价值。