论文部分内容阅读
目标跟踪是计算机视觉领域核心的问题之一,在智能视频监控、视频分析、无人驾驶等场景发挥着重要的作用。近些年来,得益于卷积网络相关研究的日益发展,单目标跟踪也迎来了一次新的发展浪潮,基于孪生网络的单目标跟踪方法便是一个很典型的例子。然而,越来越深的网络带来的不一定是精度的提高,可能是更大的模型以及更慢的运行速度,从而使跟踪无法在整个系统中更加高效紧凑地完成工作。所以,针对系统运行设备和速度都受限制的场景,由于主流的跟踪算法无法使用,本文设计了一种轻量级的单目标跟踪网络,其较少的参数量可大大降低模型的体积,方便部署;较快的运行速度可以提高系统的上限,完成更多的工作。本文设计了一种轻量级的基于孪生网络的单目标跟踪方法FSSiamese,并将其应用在了视频目标检测中。通过与传统目标检测算法相融合,FSSiamese能够在简单的视频场景下改善目标检测效果。最后,我们将本文提出的算法成功地应用到了实际场景中。本文的主要内容如下:1.本文提出了一种全新的单目标跟踪网络Faster and Simple Siamese Network(FSSiamese)。首先,在FSSiamese中,我们引入了基于通道域的视觉注意力机制,通过对特征图的不同通道赋予不同的权重来代表通道与关键信息的相关度,使网络更加容易关注特定的通道,从而更容易收敛以及达到更好的效果;其次,我们使用了全新的回归方式得到最终目标的位置,新的回归方式可以在减小网络模型复杂度的同时提高运行效率,并且网络的准确度不会受到太大影响。为了更好地训练出FSSiamese,我们设计了一种新的训练样本生成方法,可以实时地生成随机训练样本,节省模型训练所需的空间。2.本文将FSSiamese算法成功应用到了视频目标检测中。在巧妙地与轻量级目标检测算法结合之后,FSSiamese对于场景简单、运行环境苛刻且对运行速度有一定的要求的视频检测效果提升较为明显。在FSSiamese的加持下,该方法可以实现1+1大于2的效果,降低目标检测漏报率的同时提高整体的运行速度。3.本文提出的FSSiamese算法在实际的系统中也得到了验证,系统运行的结果显示,FSSiamese确实能在具体的应用中发挥良好的作用。通过实验,本文提出的轻量级单目标跟踪网络FSSiamese相比较于传统的单目标跟踪算法在运行效率上有巨大的提升,并且准确度也较为理想。同时,FSSiamese被应用在了视频检测中,多个实验证明,在简单场景下FSSiamese可以显著提升视频检测效果。最后,FSSiamese在实际的辅助驾驶系统中也发挥了重要作用,可以带来运行速度和运行效果的双提升,充分证明了其应用价值。