论文部分内容阅读
视频异常行为识别是智能监控系统的重要功能之一,是指利用相关的图像处理与视频处理技术,自动识别监控视频中的诸如反常举动、暴力活动、不符合相关规定的行为。然而,在实际应用过程中,由于受到诸如异常行为定义的模糊性、监控场景多样性、背景复杂性以及实时性等因素的限制,视频异常行为识别面临着巨大的挑战。目前,有许多研究使用不同的方法来提升视频异常行为识别的准确率与稳定性,总的来说,这些算法可以分为基于传统思路与基于深度学习的两大类。然而,现有的算法优缺点明显,在识别准确率与稳定性上始终存在不足。
本文首先研究了传统的视频特征提取方法。传统手工特征提取方法最大的问题就是描述符无法与视频中丰富的时空特征相匹配。卷积稀疏编码可以对图片进行全局的字典分解,并保留相邻图像块之间联系,从而有望解决特征提取中表达能力不足的问题。本文从全局视频异常检测入手,提出了基于卷积稀疏编码的异常检测算法。在此基础上,本文将卷积稀疏编码与局部特征提取方法方向梯度直方图(Histograms of Oriented Gradients,HOG)相结合,完成了视频中全局特征与局部特征的良好结合,提升了局部异常行为识别的准确率与稳定性。
易于忽视视频中时间维度的特征是基于深度学习算法的主要问题之一。针对这一问题,本文采用了三维卷积神经网络提取视频中时空特征,并在其中加入光流特征作为约束。基于深度学习的重构与预测网络优缺点显著,重构网络对于训练样本的多样性有着较高的要求,预测网络往往对于时域异常事件敏感,而对空域异常事件则表现不稳定。为了解决这一问题,本文巧妙的将重构网络与预测网络相结合,所提出的模型中自编码重构模型与预测模型是两个并行而共享自编码部分的分支,在充分发挥两者优势的同时,提升了网络的稳定性。
本文使用了视频异常行为识别中常用的三个数据集(UMN、UCSD、CUHK Avenue)对所提出的全局与局部异常检测算法进行评估。在UMN数据集中,基于卷积稀疏编码的全局异常检测算法能精确识别不同场景下的异常行为,达到了100%的识别准确率。在UCSD与CUHKAvenue数据集中,证明了所提出的局部视频异常检测算法的有效性,所提算法在不同子集中均有着良好的识别准确率,在UCSD数据集的ped2子集中,所提的基于全卷积自编码重构与预测的视频异常检测算法达到了92.5%识别准确率。实验结果验证了本文提出算法的有效性。为了更进一步证明所提算法的有效性,本文还进行了实测视频异常检测实验,实验结果证明了所提算法的有效性。
本文首先研究了传统的视频特征提取方法。传统手工特征提取方法最大的问题就是描述符无法与视频中丰富的时空特征相匹配。卷积稀疏编码可以对图片进行全局的字典分解,并保留相邻图像块之间联系,从而有望解决特征提取中表达能力不足的问题。本文从全局视频异常检测入手,提出了基于卷积稀疏编码的异常检测算法。在此基础上,本文将卷积稀疏编码与局部特征提取方法方向梯度直方图(Histograms of Oriented Gradients,HOG)相结合,完成了视频中全局特征与局部特征的良好结合,提升了局部异常行为识别的准确率与稳定性。
易于忽视视频中时间维度的特征是基于深度学习算法的主要问题之一。针对这一问题,本文采用了三维卷积神经网络提取视频中时空特征,并在其中加入光流特征作为约束。基于深度学习的重构与预测网络优缺点显著,重构网络对于训练样本的多样性有着较高的要求,预测网络往往对于时域异常事件敏感,而对空域异常事件则表现不稳定。为了解决这一问题,本文巧妙的将重构网络与预测网络相结合,所提出的模型中自编码重构模型与预测模型是两个并行而共享自编码部分的分支,在充分发挥两者优势的同时,提升了网络的稳定性。
本文使用了视频异常行为识别中常用的三个数据集(UMN、UCSD、CUHK Avenue)对所提出的全局与局部异常检测算法进行评估。在UMN数据集中,基于卷积稀疏编码的全局异常检测算法能精确识别不同场景下的异常行为,达到了100%的识别准确率。在UCSD与CUHKAvenue数据集中,证明了所提出的局部视频异常检测算法的有效性,所提算法在不同子集中均有着良好的识别准确率,在UCSD数据集的ped2子集中,所提的基于全卷积自编码重构与预测的视频异常检测算法达到了92.5%识别准确率。实验结果验证了本文提出算法的有效性。为了更进一步证明所提算法的有效性,本文还进行了实测视频异常检测实验,实验结果证明了所提算法的有效性。