论文部分内容阅读
随着智慧城市建设的快速发展,越来越多的网络视频监控设备增设到城市的各个角落,并产生了海量的监控视频数据。这些视频数据已经不能单纯依靠人眼完成监控,因此迫切需要开发更加智能化的网络视频监控系统。视频数据结构化是解决视频数据智能分析的核心技术之一。视频数据结构化包括视频运动目标检测、视频目标关联、视频数据结构化描述、存储与管理等关键技术。跨摄像机视频目标的再识别是视频监控网智能监控的关键技术之一。本文针对视频目标检测、视频目标关联、视频数据结构化描述、存储与管理和跨摄像机视频目标序列再识别进行了研究,开展的工作和取得的成果如下:首先,对课题组已有的基于混合高斯目标检测的视频结构化方案进行分析,针对该方案存在较多局限性问题,提出基于深度学习目标检测的视频结构化方案。其次,针对深度学习目标检测模型对特定目标检测准确率低、漏检率高的问题,设计了一个针对监控视频行人和车辆目标的增强数据集,并训练YOLOv2深度神经网络模型,实现行人和车辆目标更高性能的检测。其三,在深度学习视频目标检测的结构化数据基础之上,提出了一种基于概率关联矩阵的多分立目标关联算法,该算法两两组合质心距离特征、颜色直方图特征和SURF特征,各自形成概率关联矩阵,并进行概率矩阵的加权融合,实现分立目标的出色关联。其四,在深度学习视频目标关联的结构化序列基础之上,提出一种可扩展的xml视频目标序列结构化数据描述方案和结构化数据存储方案,并设计了一个可以统一管理结构化目标数据的数据管理系统。最后,在实现视频目标的结构化描述、存储和统一管理的基础之上,提出两种增强视频数据智能化处理的行人目标再识别算法,分别是基于直方图统计小方差匹配准则的再识别算法和基于区域分割的分立目标序列再识别算法。前者利用了视频目标序列的整体颜色特征,后者则利用了视频目标序列的局部显著颜色特征。