论文部分内容阅读
随着动作识别在视频监控、视频检索和人机接口等领域的广泛应用,激起了研究人员极大的研究热情,且取得了较多的研究成果。然而,由于人体结构的复杂性,个体之间的差异性,以及行为动作的多样性,使得快速、准确地识别动作变得十分困难。随着认知科学和神经科学的迅速发展,推动了模拟视觉感知机理的图像处理研究,特别是人体动作动作识别的研究。虽然近年来研究人员针对该应用领域的研究,提出了许多基于生物启发的人体动作识别的模型,但这些模型仍存在计算量大、识别性能不稳定的缺憾。因此,为进一步探索视觉感知本身所固有的特性,实现人体动作的准确、快速识别,本文模拟视觉感知系统中视觉神经元的信息处理机制进行动作识别。视觉信息处理在大脑皮层中形成了信息处理通路,其中致力于运动信息处理通路中包含有许多区域,如初级视皮层(V1)和中颞区(MT)。虽然有关运动模式是在哪个区域完成的,仍存在不同的推测,目前大部分围绕MT区展开动作识别的研究,构建了很多模型,但其结构复杂、效率低。为此,本文以视觉神经科学的研究成果为理论依据,在对现有的动作识别模型进行认真分析的基础上,围绕V1区展开动作识别的研究,得出了初步的研究结果。首先,给出了模拟初级视皮层V1中细胞的运动信息检测方法。该方法首先以Marr的特征分析理论为基础,采用三维Gabor(3D Gabor)时空滤波器及其组合分别模拟简单、复杂细胞的感受野,以此对视频图像进行处理,从而获取对运动速度和方向敏感的运动信息。其次,提出了无方向性和有方向性的环绕抑制模型。根据V1中无方向选择性和有方向选择性细胞的环绕抑制特性,以三维Gabor时空滤波器中的三维高斯函数为基函数,构造了无方向和有方向的环绕抑制模型。通过该模型,有效地避免视频图像中各种背景噪声对信息检测的影响,保持了运动信息的完整性。最后,提出了基于脉冲神经元平均发放率分析的运动特征提取方法。以神经脉冲作为信息处理和传递的载体,依据基于电导率的Integrate and Fire(I&F)神经元模型,构建脉冲神经网络。通过对神经元脉冲平均发放率的分析,从而获取行为动作的平均运动图,提取动作特征。利用支持向量机的分类方法,实现对人体动作的识别。利用Weizmann和KTH等人体动作视频数据库对本文提出的方法进行测试,实验结果表明本文提出的方法既减少了识别计算量,加快了识别速度,又提高了动作的识别率。