论文部分内容阅读
人体行为识别是计算机领域的一个重要研究课题。人体行为识别是指通过计算机技术,使计算机能够从视频或图像序列中自动识别出人体的动作行为并对其进行分类。本文对人体行为识别方法进行探讨和研究。人体行为识别过程主要分为预处理、特征提取及动作分类三个阶段。在预处理阶段,本文主要介绍了三种目标检测方法,并比较了三种目标检测方法的优劣性。在特征提取方面,本文介绍了Gist特征、STIP特征、Dollar特征、Hog3D特征、HON4D特征及骨架点特征,并详细阐述了各个特征的提取过程。在动作分类方面,本文首先简单介绍了当前主流的判别式模型和生成式模型,包括:朴素贝叶斯模型、隐马尔科夫模型、随机森林模型及支持向量机;其次,本文从图结构、学习和推断算法详细介绍了条件随机场模型。论文主要进行了两个方面的研究:1)在相同的人体特征下,本文设计实验比较分析不同分类模型的优劣性;2)在基于隐条件随机场的分类模型下,设计实验探究当前流行的人体运动表征特征的优劣性。此外,本文分析了当前流行的人体行为识别数据集的不足,并录制了一组新的多视角多模态人体动作数据集。本文的实验应用Matlab进行仿真实现,所用数据集为公开的MSRC-12数据集和DHA数据集。本文实验表明:1)在相同骨架特征条件下,隐条件随机场因能够利用序列结构特征进行动作建模,其性能优于朴素贝叶斯、隐马尔科夫模型、随机森林和支持向量机;2)在相同隐条件随机场的模型条件下,深度图像特征比灰度图像特征对人体运动表征能力更强。