论文部分内容阅读
随着智能视频监控技术的发展,多场景多摄像头下的行人识别及跟踪受到越来越广泛的关注,其中多摄像头信息融合处理、实时检测识别跟踪、算法模型轻量化等问题成为研究热点。本文主要针对多场景行人检测、识别及跟踪算法的优化,多摄像头并行应用等方面进行研究,其主要研究内容包括:(1)结合用于精细结构检测的MTCNN算法和用于整体检测的YOLO算法,并通过数据增强、数据集扩增进行优化,提出一种多场景行人检测算法。受视频来源及环境噪声影响,单一的行人检测算法具有各自的局限性,而本文提出的检测算法通过提取多尺度特征信息,以丰富深度卷积网络的表征语义,实现了高精度的多场景行人检测。(2)提出一种基于多种算法融合的行人识别算法。本文首先对Inception-ResNet主干神经网络进行调整,扩宽了人脸网络宽度以提取更多人脸信息,从而提高人脸识别准确率。接着利用SE-ResNet对残差网络进行改进,将空间通道内的信息进行融合,以提高多标签属性识别的抗干扰能力,进而提升了识别行人属性的性能。最后采用Open Pose姿态估计和Mask-RCNN人形分割算法进行行人姿态识别。因此,相比单一的行人识别算法,本文提出的算法能获取更全面的行人信息,解决了单一维度的行人脸部特征、外部属性特征及行人姿态特征对识别精度不高的问题。(3)基于知识蒸馏方法,提出ResNet主干网络的压缩模型。针对上述(2)所提算法模块移植困难、计算实时性无法保障等难点,本文通过对多个模块中的ResNet主干网络进行知识蒸馏模型压缩,并在不同压缩率下进行实验验证,提升了模型识别分类精度。(4)提出一种改进的DeepSort行人跟踪算法。针对多个摄像头中的多个行人的实时跟踪问题,本文引入YOLOV4算法进行行人检测,提高了在线跟踪的速率及可靠性。本文基于多场景下行人检测、识别、跟踪的研究背景,从底层特征提取、中层属性姿态识别、上层轨迹预测跟踪等研究路线,形成了一套由下至上、由浅至深的理论算法框架,可广泛应用于智能安防、智慧旅游、无人驾驶等领域,对相关算法的优化具有指导作用和工程应用价值。