论文部分内容阅读
人体动作识别在智能监控、高级人机交互等方面的广泛应用,使得模拟视觉系统的动作识别成为当前计算机视觉领域的研究热点。视觉系统是如何处理感知的人体动作视觉信息,以及如何模拟人类视觉系统实现准确而快速的动作分类与识别,是研究者共同关注的课题。随着脑神经科学研究的不断深入,人类对视觉系统的了解越来越清晰,深入认识人类视觉信息处理过程,模拟人脑视觉机制系统建立更加准确有效的识别模型具有极其重要的意义。本文在总结分析了已有的仿生动作识别系统的基础上,对生物视觉系统信息处理的层次结构模型进一步展开研究,初步取得了以下几个方面的研究结果:首先,提出了一种整合形状特征和运动特征进行人类动作识别的方法。根据人类视觉系统的基本生理特性,提出了模拟视皮层双通路理论的动作识别计算模型。该模型在原HMAX模型的基础之上加入了对视觉系统腹侧通路的模拟,从单纯的模拟背侧通路扩展为同时模拟腹侧通路和背侧通路两条通路,分别提取形状特征和运动特征。即形状通路,从每帧提取密集的局部形状信息,而动作通路则从每帧提取富含运动信息的运动特征向量。最后,被整合后的特征向量将被送入支持向量机(SVM)进行识别分类,从而实现对人类动作的识别分类。其次,根据人类视觉注意机制,提出了一种有效快速获取特征模板的方法。由于特征小块的选取与之后的模板学习及特征提取息息相关,严重影响到系统能否准确地进行动作识别。本文通过限定特性小块的选取区域,有效的提高特征小块的质量。该方法在基于时空显著性的视觉注意模型获取的感兴趣区域基础上,通过分析视频序列的中间级特征,即复杂细胞的响应,建立复杂细胞响应的能量值与运动目标对应的关系,从而获取候选特征小块的位置。此外,根据识别要求选取相应的特征小块,该方法能直接获得性能较好的特征小块。同时,在计算最终的特征向量时,通过视觉注意机制获得显著性区域,可提高整个系统的识别效率。最后,提出了用较少的帧数进行动作识别的方法。对于视频的动作识别而言,先前的识别研究大都是基于视频的全部帧或者视频的较多帧,加入形状信息之后,用较少的帧数进行特征提取就可以获得较好的识别效率,并缩短动作识别所需要的时间。将本文所提出的识别方法在KTH标准数据库上进行测试实验。结果证明,该方法有效的提高了动作的识别效率。