论文部分内容阅读
基于监控视频的人体异常行为检测算法研究是计算机视觉领域的研究热点之一。传统的采用人工值守方式的视频监控系统,由于受制于人的生理特点,具有实时性差、效率低下、人力成本高、容易出现漏判误判等缺点。相比之下,以异常行为检测算法为核心的智能监控系统在无需人工干预的情况下能够自动从视频中检测出异常行为并发出警告,具有巨大的科研价值与应用前景。本文全面介绍并深入分析了异常行为检测技术当前的研究现状和发展趋势,在已有算法的基础上提出了相应的改进算法,进行了完整的视频异常行为检测实验与数据分析,验证了改进算法在检测精度和鲁棒性方面的优势。首先,本文提出一种新的用于表征视频中人体行为的时空特征描述子。该特征描述子由基于像素邻域时空卷的稠密采样方法得到。针对视频的时空特性将原始的HOG特征从二维图像特征扩展到三维时空卷中,在时空卷中计算HOG特征。采用高斯权值度量时空集合中不同位置的时空卷的梯度直方图的不同贡献,权值大小由高斯函数根据时空集合中当前时空卷与中心时空卷的距离计算得到。最终的实验表明,该特征描述子能够有效地表达人体各种行为,提高算法的鲁棒性。其次,本文提出了一种基于对称KL散度的加权模糊聚类方法,用于得到视频中各种行为在特征层面的分布特性。本文算法将一次聚类改进为多次分步聚类,每次聚类后将参与聚类的数据压缩为几个加权的聚类中心,参与下一次聚类,降低了对系统存储设备内存的要求。为了更好的刻画特征之间像与不像这一问题,采用基于对称KL散度的相似性度量方法计算每个特征与聚类中心的相似程度,使模糊聚类方法更适用于异常行为检测领域。再次,本文结合视觉词袋模型提出了基于视觉词典的自适应阈值异常检测方法。首先采用基于对称KL散度的加权模糊C均值聚类方法得到视觉词典和隶属度矩阵,根据视觉词典和隶属度矩阵找到有代表性的像素,最后通过对所有的有代表性的像素进行计算得到每个视觉单词的异常监测阈值,由该阈值对每个像素进行判断是否为异常像素。在UCSD异常检测数据库上验证本文算法,实验结果表明本文的算法具有较高的准确率。综上所述,本文对人体行为特征描述子、特征学习方法和异常行为检测方法这三方面进行研究,提出改进算法。实验证明,该算法能够准确地从监控视频中检测异常行为。