论文部分内容阅读
近几十年来,随着多媒体技术的快速发展,计算机视觉技术在军事,医疗,制造业等领域中得到了广泛的应用,同时也促使了模式识别、人工智能、机器学习等相关学科的进一步发展。人体行为识别作为计算机视觉研究领域中的一个备受关注的研究课题,在军事和民用领域有着广泛的应用前景和实用价值,如智能视频监控、视频检索、虚拟现实、人机交互等。尽管当前对行为识别的研究取得了一定的成就,但是还没有一种可以通用的行为识别方法,在行为识别领域中依然面临着许多困难与挑战。本文研究的是单人行为的识别方法,即通过对视频中的目标行为进行合理的描述,实现对该行为的分类。论文介绍了当前行为识别技术的研究现状与基本理论,并针对传统识别方法仅使用底层视觉特征进行识别的不足,提出了一种基于动作属性的人体行为识别方法。算法分为训练动作属性分类器、建立识别模型两个阶段。在训练动作属性分类器阶段,首先提取视频中的时空兴趣点及兴趣点的3D-SIFT局部时空描述符,用词袋的方法建立时空词典直方图对视频行为进行表示,生成底层特征样本集。然后根据预定义的动作属性将部分底层特征向量贴上属性标签,并使用支持向量机对其进行训练,生成动作属性分类器组。在建立模型的过程中,将未贴上属性标签的底层特征样本经过动作属性分类器组后得到对该行为的属性预测,利用这些预测信息对以属性、行为变量为节点的贝叶斯网络进行结构学习与参数学习。最后在进行识别测试时,首先用动作属性分类器组预测出待识别行为的属性分布,然后用先前训练好的贝叶斯网络模型对其所属的行为进行预测,将取得最大概率的行为作为识别结果。本文分别在Weizmann与KTH视频库中对该方法进行验证,实验结果表明本文方法相比仅依赖底层视觉特征的传统识别方法有更好的识别效果。