论文部分内容阅读
目标跟踪技术是计算机视觉算法的核心研究方向之一,是视频分析的关键技术,也是目前科学界关注的焦点。目标跟踪技术在人机交互、增强现实、自动驾驶、智能监控等领域有不可替代的作用。目标跟踪算法的任务可以定义为:给定感兴趣目标在初始视频帧中的位置表示,通过跟踪算法得到目标在后续视频帧中的位置信息,但目标的先验信息仅能从第一帧获取。因此,跟踪的独特性给深度学习技术在目标跟踪中的应用带来了许多挑战:(1)深度网络的训练需要大量样本数据,仅由初始帧获得的先验样本显然不足;(2)对于跟踪算法的训练阶段,常见的数据增强方法如仿射变换、颜色空间变换得到的数据冗余度大,缺乏多样性;(3)对于跟踪算法的在线更新阶段,通用的线性插值法得到的模板样本置信度不足。因此为了满足现有跟踪算法对于数据增强的迫切需求,本文对目前主流的两大类跟踪算法进行了研究分析,分别为两种不同的跟踪框架设计了两种不同的数据增强算法。本文的主要研究工作如下:(1)研究了两类主流的基于深度学习的目标跟踪算法的基本框架和原理,分别探究了两类算法现有的数据瓶颈环节,并分析了两类算法对于数据增强的不同的需求。(2)针对基于检测的深度学习目标跟踪算法缺乏多样性类内负样本的问题,本文提出基于对抗网络的人体类内数据增强方法,对训练负样本进行数据增强,该方法生成冗余度低的难例人体目标负样本,具体则是生成了姿态与跟踪目标相似。,表观特征不同的难例类内负样本,使用这些负样本扩充训练样本池,并运用到跟踪网络的训练环节中。(3)针对基于匹配的深度学习目标跟踪算法模板数据更新不鲁棒的问题,本文提出基于UpdateNet的模板数据增强方法,对匹配模板数据进行数据增强,本文方法通过对UpdateNet引入循环一致损失和双向模拟跟踪的训练策略,得到了收敛性和准确性提高的模板数据增强算法,该方法通过网络生成当前帧的最佳预测模板数据,并运用到跟踪网络的在线更新环节中。本文将两种数据增强方法分别应用到两类跟踪算法中具有代表性的两种方法:RT-MDNET以及SiamRPN中,并在公开测试集OTB100、以及LaSOT上进行了验证实验,证明了本文提出的方法的有效性。