论文部分内容阅读
在社会生活中,视频监控是保障公民的生命安全和财产安全的重要手段之一,随着监控摄像头的不断增多,传统通过专业的监控人员进行视频监控的方式面临巨大的成本和效率问题,突发安全事件发生后,传统人工调查方法往往存在时效低,效果差等问题,运用自动化监控技术是安防行业迫切的需求,行人重识别技术正是应用于这一领域的重要技术之一。随着深度学习在行人重识别领域的高速发展,在此领域研究现状表明行人图像的全局和局部特征的组合可以成为提高行人重新识别算法判别性能的关键点之一。本文提出了一种基于深度学习卷积网络的机器学习模型,可以很好地在减少背景影响情况下提取行人多粒度的整体与局部特征,并通过多粒度特征对齐和多损失函数提高整体网络性能。本文的主要工作和创新之处如下:(1)提出一种基于RPN的人体部件检测网络,该网络模块主要用于检测行人图像中人体躯干的各个部位,进而可以提取对应的局部特征。相比较于直接将传统行人图像硬性划分为线条或网格形状区域等算法,本文提出的人体部件检测网络,能够有效地减少引入背景噪声,提取到的特征无需再次对齐可直接进行融合,避免了部件对齐造成的误差,另外相比于直接根据人体关键点定位人体区域的算法,本文提出的网络通过融合人体部件多个感兴趣区域特征,可以减少因关键点定位误差导致的最终部件特征误差。(2)结合人体部件检测网络和图像金字塔网络,提出基于ROI Align和特征图融合的多层级多粒度人体局部特征提取算法,并使用多粒度识别网络实现行人重识别。多粒度识别网络依据人体部件特征的粒度层次设有三个分支,充分利用了多层级多粒度的行人特征。相比于单任务学习网络,本文结合度量学习方法,使用多任务学习策略,在完成行人重识别任务同时可使得每种粒度的行人特征具有判别性和特异性,进而提升网络的最终性能。整体网络工作原理具有更强的可解释性,这亦有利于深度网络参数调整过程。(3)综上所述本文提出一种多粒度人体结构对齐的行人重识别算法。该算法将人体部件检测网络、多层级多粒度特征融合、多粒度识别网络和多任务学习融合到一个深度网络模型中,使得网络能整体同时优化,减少了训练时间。本文在行人重识别数据集Market1501进行了实验验证,实验结果本文算法在数据集上的Rank-1识别率达到了 79.3%,证明了本文提出的深度学习网络的可行性和有效性。