论文部分内容阅读
多行人跟踪是目前较热门的课题,属于视觉感知的中间处理部分。基于视觉的多行人跟踪主要目的是对多个行人目标进行持续跟踪,期间维持每个相同行人的ID不变化,并对每个行人进行未来帧状态的预测。本文主要针对十字路口场景下多行人跟踪算法存在的鲁棒性不足的问题进行研究,研究较为实用的DeepSort算法,并将其解耦合为三大模块,目标状态预测模块、目标表观模型建模模块、目标表观模型匹配模块,文章分别从目标表观建模模块和目标状态预测模块两个方面对DeepSort算法进行改进。文章主要贡献如下:针对原DeepSort跟踪算法在十字路口场景下鲁棒性不足的问题,提出了一种基于多特征融合DeepSort算法的多行人跟踪算法。在目标表征建模阶段,提取目标行人的HOG特征和CNN特征建立目标和背景的分类器模型,分类得到待跟踪目标行人的图像置信图,并将得到的表观模型置信图放入DeepSort跟踪算法进行多行人的跟踪。使用MOT Challenge比赛中专用数据集MOT16数据集对改进算法的性能进行测评,实验证明,提出的改进方法比原算法的鲁棒性有所提升。由于十字路口路况复杂容易出现非线性情况,针对提出的基于多特征融合DeepSort的多行人跟踪算法在非线性情况下鲁棒性不足的问题,提出了一种基于多特征和无迹卡尔曼滤波(Unscented Kalman Filter,UKF)融合DeepSort算法的多行人跟踪算法。由于跟踪任务中需要对目标行人未来帧运动状态进行预测,原始算法中使用的卡尔曼滤波方法只能对较为简单的线性环境进行目标行人的状态预测,故在目标状态预测阶段将卡尔曼滤波算法扩展为UKF算法,并将其运用在改进后的跟踪算法中,使用MOT16数据集对提出的改进算法进行性能测评,实验证明,提出的改进方法比原算法鲁棒性有所提升。