基于重识别技术的多目标跟踪算法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:jackyz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于多目标跟踪(Multi-Objects Tracking,MOT)技术已在现实生活中广泛的应用,越来越多的学者对其展开更加深入的研究,以提升跟踪性能。目前,多目标追踪方式主要包括基于检测的多目标追踪、联合检测和嵌入学习的多目标追踪,以及基于注意力机制的多目标追踪。而随着重识别(Re-Identification,ReID)技术的发展,有很多学者发现将其与多目标跟踪算法结合可以有效提升算法性能,主要原因在于ReID算法可以将不同场景中的目标联系起来,由ReID网络提取的外观特征可以更好地应用于重新找回短暂丢失后的目标。为了进一步发掘ReID在多目标跟踪领域中的潜力,进而提升多目标跟踪的性能,本文分别对联合检测与嵌入学习多目标跟踪和基于检测的多目标跟踪方法进行深入的研究,并提出一定的改进,最后通过实验证明其有效性。(1)对严重遮挡问题进行深入分析后,得出其导致跟踪性能下降的原因主要是由于遮挡使得目标检测器极容易丢失被遮挡目标。为了降低目标遮挡所带来的影响,本研究提出了一种创新的遮挡预测模块,用来判断目标是否发生遮挡,并且在遮挡预测图中得到被遮挡物体的预测中心点位置,为了使遮挡预测模块能更好的应用于多目标跟踪算法,本研究还提出了一种丢失目标寻回算法。最后将该模块与基于ReID且采用联合检测与嵌入学习范式的多目标跟踪算法进行结合,实验结果表明该模块可以有效地减少目标丢失,从而提升多目标跟踪算法整体性能。基于MOT17数据集,将本模块分别与FairMOT与CenterTrack结合,MOTA指标分别为68.6%与62.1%,相较于原算法提升了1.1%与1.4%。(2)ReID根据数据源可以分为基于图像的ReID和基于视频的ReID,后者较前者多了时序信息,因此可以对视频数据中的时序信息加以利用,从而提升ReID算法性能。为了更好的利用视频数据中的时序信息实现多目标跟踪,本文对一种基于三维卷积的视频ReID方法进行了改进,该算法可以对近邻帧进行重建,使特征图表观对齐,然后使用三维卷积对表观信息进行时序建模。最后将该算法与基于检测的多目标跟踪框架结合,实验结果表明改进后的ReID算法可以进一步增强多目标跟踪算法的性能。基于MOT17数据集,本文提出的方法最终的MOTA为58.2%,相较于同为基于TBD范式的DeepSORT算法,提升了1.9%。
其他文献
深度信息对高级场景应用具有重要的意义,比如三维重建、自动驾驶等。获取深度信息的方法包括基于雷达,双目相机,单目相机和RGB相机等,本文研究从单目图像中获取深度信息的方法。目前一些基于卷积神经网络的深度估计方法预测的深度图依然有轮廓不清晰、深度不平滑等缺陷,而且几乎没有提出针对施工现场的深度估计方法。针对这些问题,本论文主要完成了三个任务:一是提出了用于提升特征融合效率的自适应混合注意力机制;二是提
学位
在当今快节奏的生活方式中,无线移动通信已经被应用在我们生活中的方方面面。目前,它不仅局限于电信,还进入了娱乐、安全、商业等领域。移动环境是指由几个计算能力有限的移动节点以及资源有限的强大节点组成的一种不平衡的网络。现在有很多基于移动环境的面向群组的应用程序,如手机的视频会议,移动设备办公等。随着面向群组的应用程序越来越受欢迎,在移动环境中如何保障群体通信中的安全性和避免隐私泄露问题成为了现在急需解
学位
随着人类社会所积累的数据规模愈发庞大,数据分析和处理的成本和代价不断增加,能否从海量数据中高效地获取知识,成为影响数据分析方法的效率的关键因素之一。数据探索,是指从源数据中获取知识的过程;基于自然语言进行数据探索,能够为数据提供自然语言接口,降低数据分析门槛,提升数据分析的效率。知识推理技术能够挖掘现有知识中潜在的数据语义,对知识库和知识图谱进行补全和完善。本文针对自然语言数据探索任务中元数据不够
学位
古代工匠作为造物的直接主导者和参与者,其整个群体的审美趣味是时代文化意蕴的凝结,是审美文化的体现。汉代是古代丝绸之路的开拓期,时代视野广阔,呈现出大一统的生机蓬勃和征服世界的信念气势。随着丝绸之路的开通,汉代中原地区的工匠,无论是在造物表现形式上还是审美趣味上,都受到了西域文化不同程度的影响,在应对外来文化的态度和审美表现的处理方式上对现代设计有着借鉴意义。文章通过对工匠审美趣味的形成因素进行分析
学位
随着科技和社会的发展,实时操作系统已经应用到了人们生活的方方面面,尤其是航空航天,移动设备以及汽车等领域,已经离不开实时操作系统的支持。与普通的操作系统相比,实时操作系统通常要求能够严格保证任务在特定时间内完成,不能有较长的延迟,评价实时操作系统好坏的一个重要方式就是分析它的实时性。因此,本文针对影响实时操作系统实时性的重要因素做了研究和分析,针对这些因素设计了实时性的分析方法。最坏执行时间(Wo
学位
在复杂多变的环境下,企业发展战略规划和内部管理制度能否及时适应环境做出改变,是企业能否长远发展的关键。而全面预算管理能否有效实施是能否实现战略目标的关键。此外,面临环境的多变性,企业的管理不能一成不变,需要及时做出调整。但是传统的预算管理在企业发展中越来越显示出其刚性、迟滞性、拘泥性,缺乏与企业战略之间的连接,没有有效地促进企业战略的实现。因此,柔性战略与全面预算如何有效融合、互相成就是企业能否在
学位
在过去的十年中,图神经网络在实体推断领域取得了巨大的成功,图神经网络因此也广泛应用于节点分类、实体对齐等任务。在图神经网络快速发展的同时,图网络涉及的隐私安全问题也逐渐引起了人们的关注。人们在外包图数据给云服务商计算的同时,会担心自己的敏感图数据是否会被泄露;多个用户在共享图数据,合作挖掘更多有价值的信息时,也会担心自己的数据是否会泄露个人的隐私。因此,越来越多的学者投身于安全的图神经网络研究,在
学位
视觉里程计问题一直以来都是计算机视觉领域的一个研究热点课题,它在智能机器人、自动驾驶、无人机导航等很多方面都有广泛的应用,是很多智能应用场景的基础架构支撑。因此,在该领域人们已经提出了多种方法,比如基于传统的图像处理方式,通过设计不同的算子来对图像进行特征检测和匹配,再结合几何关系来进行相机的位姿求解。此外,也有人提出基于深度学习的方法,通过设计构建特殊的神经网络架构,并经过训练优化,实现端到端的
学位
文物作为人类文明宝贵的历史遗产,具有不可替代性和不可再生性。除了自然损耗外,天灾、战争和人为破坏也使得文物数量日益减少。现代比较普遍的文物保护方法是将文物放置于博物馆内进行集中保存和供人参观。然而随着城市建设的快速发展,博物馆周边施工活动产生的振动对博物馆内文物影响愈发明显,尤其是对体量巨大、难以移动的石造像类文物的影响更是不容忽视。但目前对于这类文物在施工扰动下的损伤特征、振动阈值都缺乏相应的研
学位
问答系统是自然语言处理领域里几个研究重点之一,在实际场景中有重要应用。其目的在于人们以文本语言向模型给出问题,模型通过正确分析语义信息和文本内容后给出问题的正确答案。但是随着数据和场景的复杂化,现有的简单文本问答系统和纯表格的问答系统已经无法完成问答任务。随着复杂文本结构数据集的提出、检索算法和阅读理解算法的创新优化给现有的简单问答系统提供了新的解决方向。对于现在的复杂文本结构数据,现有的问答系统
学位