论文部分内容阅读
为了提高视频序列中人体行为识别的正确率,提出了一种结合两层K-means聚类优化码本和视频表达级特征融合的行为识别方法。首先对训练集视频提取出的时空兴趣点利用梯度方向直方图(HOG)和光流直方图(HOF)进行描述,并对属于不同视频以及不同种类动作视频的描述子使用两层K-means聚类形成各自更具有代表性的视觉词汇,从而提高码本的表达能力。然后将表示每个视频的HOG和HOF描述子分别作为码本优化后的词袋模型的输入,得到两种不同的视频全局表达并进行特征融合,由于HOG和HOF描述子在形成视频表达级特征时