基于深度学习的多目标跟踪方法研究

来源 :长春理工大学 | 被引量 : 0次 | 上传用户:ICE867200WXM
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频多目标跟踪是计算机视觉领域研究的重要技术之一,该技术研究的关键点在于对视频中多个感兴趣目标进行连续追踪,目前常被用于自动驾驶、视频监控和智能交通等领域,随着人工智能技术的发展,如何利用深度学习提升多目标跟踪的性能成为当下研究热点之一。当前,多目标跟踪技术主要有三个难点:首先是目标定位,即如何检测出待跟踪的感兴趣目标;其次,如何对感兴趣目标进行运动预测,即将目标的身份信息逐帧传递下去不发生丢失;第三是目标被障碍物遮挡时如何跟踪目标。本文对如上三点难题展开针对性研究,主要包含基于深度学习的目标检测技术、目标运动状态估计以及特征融合方式研究,具体的研究内容如下:(1)基于深度学习的目标检测技术研究。本文采用无锚点框的策略设计一阶段的目标检测模型,通过预测中心点热力图的方式取代从预设锚点框回归目标的机制。主干网络使用改进的Hourglass Network提取深度特征,在一个大尺度的特征图上进行目标的分类回归预测,网络架构上采用跳层密集连接的方式聚合空间和尺度信息用于防止单一尺度特征图信息缺失,以此保证最后一层特征可以进行像素级预测。同时,在模型输出上增加Re-ID深度表观特征提取分支用于提取相应目标的重识别特征,从而实现卷积特征的共享。(2)运动状态估计。检测出待跟踪目标后需要对目标进行运动预测,针对跟踪场景差异目标可能存在的非线性运动的问题,采用扩展卡尔曼滤波算法建立恒定转率和速度的二次运动模型,用于目标在二维图像上运动状态的预测与更新,利用仿真实验和实际跟踪结果验证扩展卡尔曼滤波建模的有效性。(3)多特征融合方法研究。完成待跟踪目标的检测与运动状态估计之后,需要用当前帧的检测信息更新跟踪状态,将同一个目标的二者相关联需要利用特征来度量相似性。为了能够全面描述目标,本文选择HSV颜色直方图特征、Re-ID深度表观特征和运动特征三种特征,分别采用卡方距离、余弦距离和马氏距离来综合度量检测与跟踪轨迹的相似性。同时为使本文的多目标跟踪算法能够适应多种跟踪场景,将三种特征进行加权融合,并针对常见的跟踪场景设配出性能最佳的权重配置作为参考。根据相似性度量的结果采用KM二分图匹配算法关联检测与跟踪轨迹,为了应对遮挡问题,设计基于存活期的状态更新算法来保存一定时间内被遮挡目标的轨迹不会丢失,当目标重新出现时保证目标的有效找回。
其他文献
军事信息化建设一直是各国的研究热点,但我国的武器存在着种类繁多、信息散落等问题,这不利于国防工作提取有效信息,大大妨碍了我军信息化建设的步伐。同时,我军武器常以文字、二维图片和实体武器等传统方式进行展示,交互性差且无法满足更多军迷了解武器性能、近距离观赏或把玩武器的迫切需求。本文将改进后的Yolo v4算法应用到武器识别中,将武器图片中的武器快速识别出来,提取武器的相关信息,并将其放入三维的武器展
学位
新冠疫情期间,各类智能移动机器人在药物物资配送、疫情区域消毒、公共区域安全巡逻和出入安检测温等无接触服务方面发挥了重要作用。智能移动机器人相关技术当中,同时定位与构建地图(Simultaneous Localization and Mapping,SLAM)是自主性的核心,也是机器人实现自主移动的基础。近些年,深度学习作为备受追捧的技术,能够增强计算机对数据的有效利用能力,那么将深度学习结合到SL
学位
表面肌电信号(Surface electromyography signals,s EMG)是最有价值的生物电信号之一。通常用于测量肌肉的活动状态,能够为许多康复医学和智能假肢的研究提供有用的信息。但肌电信号是很微弱的一种电信号,使得手势识别效果差强人意。当它与其他类型的信号结合使用时,可以弥补这些缺点。加速度信号能够精确反映运动的方向、速度和位移,陀螺仪是一种可以检测出物体运动时角速度的传感器,
学位
目标检测算法被广泛应用于交通管控,视频监控,无人驾驶以及医疗图像识别等任务,以上各种实际的应用场景中,由于场景复杂度高,目标在复杂背景下检测精度被干扰,小目标检测的速度较慢,同时特征提取与融合部分中对小目标的关注度不足,有效的小目标信息很难最终被检测器接收,因此小目标的检测更成为检测难题,其平均精度始终不超过25%。该文针对复杂场景中小目标检测精度不高,检测系统实时性较差等问题展开研究,主要研究工
学位
随着医学成像技术的发展,医学图像在临床诊断中变得越来越重要。不同模态的医学图像提供的信息差异较大。例如,计算机断层扫描(CT)图像对于骨骼的成像非常清晰,磁共振成像(MR)图像可以清楚地反映软组织结构,正电子发射断层(PET)图像可提供人体代谢信息,单光子发射断层扫描(SPECT)图像可提供清晰的组织和器官的血液信息。但是单一模态的医学图像有自身的局限性,只能反应个别方面的组织信息,无法提供全面准
学位
随着铁路交通运输的飞速发展,铁路交通运行过程中的安全问题日益凸显,直接影响了铁路运输效率与运营成本。铁路道岔转辙机作为铁路交通中的一种关键设备,其安全状况直接影响着铁路交通能否正常运转。然而,传统的道岔转辙机维护手段存在着诸多问题,无法有效的保障设备的运行安全,寻找有效解决方案已成为迫在眉睫的任务。自上世纪60年代以来,健康管理系统技术在许多工程领域内得到了长足发展,该技术是一种有效的设备健康运维
学位
当前,电子商务飞速发展,用户面对海量的信息很难快速找到满足需要的商品信息。推荐系统是信息过滤的重要手段,其核心为推荐算法的应用。目前比较流行的推荐算法是协同过滤,许多电子商务企业的核心推荐系统都基于协同过滤。然而,不经过安全性处理的基于协同过滤的推荐系统非常容易受到托攻击的影响。托攻击是指非法用户通过向推荐系统中注入伪造的用户数据,对目标项目的推荐热度进行改变,进而导致用户对推荐结果的满意度降低。
学位
近些年来,智能制造与传统制造业紧密结合形成了新的制造业产业形态。分拣是当前制造业中较为常见的工作方式,其作业场景具有高危、操作单一等特性,因此很多公司引入机器人代替人工进行分拣。传统的自动分拣系统基于图像,通过对目标图像二值化、边缘轮廓提取实现物体分类,该方法存在目标物体识别率不高、鲁棒性较差等问题,而基于深度学习的管件自动分拣系统,具有较高的识别率及较好的鲁棒性。本文设计并实现了基于深度学习的管
学位
医学图像融合是综合医学图像、数字图像处理、数字建模和计算机视觉等学科的交叉领域。当前伴随着计算机技术的不断成熟,通过使用多模态医学图像融合技术,对图像的质量保证起到了积极推动的作用,对辅助医疗诊断、精细手术规划、科研进展等工作具有重大的意义。目前,针对医学图像融合算法的研究逐渐成为了焦点,同时对于算法的研究取得了一定的成果,但是,当前的融合算法依然存在不足。本文主要从融合过程中基于多尺度分解图像和
学位
随着我国矿产资源开发进入空前发展时期,矿山废弃物的排放规模日益加大。尾矿坝作为一种堆放矿山废弃物的形似堤坝的构筑物,其中含有大量的重金属离子。尾矿坝的安全运行一直是矿山安全研究的核心,而尾矿坝的稳定性研究是其中最主要的研究方向之一。一旦坝体失稳破坏,不仅对下游人民群众的生命财产安全造成严重伤害,而且对环境造成的污染更是难以估量。降雨事件是导致尾矿坝失稳因素之一,评估降雨事件发生时尾矿坝的稳定性对矿
学位