基于相关结构与深度学习的目标跟踪算法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:hm00562000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标跟踪是计算机视觉领域中的一个重要研究方向,其发展能够推动视频智能处理技术以及智能机器人技术的突破。目标跟踪的主要任务是对于任意视频序列,给定第一帧中目标位置及尺寸等相关信息,准确地定位出剩余视频序列帧中的目标。虽然当前已经有很多算法在测试数据库上取得了不错的跟踪效果,但是在一些复杂的跟踪场景下,现有跟踪器的性能还达不到理想的跟踪状态。本文针对基于相关滤波结构以及深度学习跟踪框架中存在的问题,分别从增强相关滤波跟踪框架的稳定性、解决深度学习中带有标签的训练数据不足以及提升目标边界框预测的准确性三个方面进行了研究。主要研究内容如下:(1)提出一种基于粒子滤波重检测的跟踪算法,用来解决基于相关滤波框架的跟踪器在某些复杂的跟踪场景中无法准确定位目标的问题。大多数基于相关滤波框架的跟踪算法都可以实现良好的性能并保持快速的跟踪速度,但是这类算法过度依赖于最大响应值来确定目标的位置。因此在跟踪过程中,当目标受到干扰导致响应图会变得不理想时,该类算法的跟踪目标很容易丢失。而重检测模型可以通过重采样策略提供丰富的候选样本,从而对跟踪的目标进行重新定位。此外,还提供了一种新的目标尺度评估机制,该机制仅考虑连续帧中最大响应值之间的差异来确定目标的尺度变化。(2)提出一种基于时间正则化策略的跟踪算法,用来提升背景感知相关滤波跟踪器的跟踪性能。基于相关滤波框架的跟踪器的优势源于其可以把时域计算转换为频域计算的能力。但是这些算法存在的一个重要问题是跟踪器容易受到遮挡、形变和其他具有挑战性的因素的影响而丢失跟踪目标。考虑时间序列中运动目标在连续帧之间的关系,通过前一帧的目标有效地调整滤波器模型使其适应跟踪场景的变化,从而增强跟踪器的稳定性和准确性。此外,该跟踪器的目标函数可以通过改进的交替乘子法进行求解,从而保证跟踪器具有实时的跟踪速度。(3)提出一种基于自监督学习的跟踪算法,用来缓解带有标注的训练数据不足的问题。基于深度学习的跟踪器的特征提取网络的训练通常需要大量的手动标注的训练样本,而训练数据的标注是一个耗时且昂贵的过程。通过在Siamese相关跟踪框架下采用前后向跟踪的方式给无标注的训练数据生成伪标签,利用多周期一致性损失来训练特征提取网络。此外,提出了一种低相似性丢弃策略来剔除一些低质量的训练样本对,并在每个样本对中采用循环轨迹一致性损失来协同训练网络,可以在降低模型对标签需求的同时保证跟踪器的跟踪性能。(4)提出一种基于主动学习的跟踪算法,用来降低模型对标注数据规模的需求。训练用于跟踪任务的深度网络模型需要大量带有标签的训练样本,这使得在有限数据上训练的模型的表示能力受到了限制。在主动学习的指导下,基于训练好的模型的跟踪器可以在降低标注成本的同时实现具有竞争性的跟踪性能。具体来说,为了确保所选样本的多样性,提出了一种基于多帧协作的主动学习方法来选择需要被标注的训练样本。同时,考虑到选定样本的代表性,采用基于平均最近邻距离的最近邻判别方法来筛选和剔除孤立样本和低质量样本。此外,还采用Tversky损失来改进跟踪器的边界框估计,这可以使跟踪器获得更准确的目标状态。(5)提出一种基于距离交并比损失的跟踪算法,用来对目标边界框进行精确估计。所采用的跟踪器由目标估计部分和目标分类部分组成。大多数现有跟踪器都是基于分类器和多尺度估计来预测目标状态,这使得其跟踪精度较差。尽管某些跟踪器采用基于交并比损失的最大重叠方法来缓解此问题,但是交并比损失固有的缺陷也很难准确估计目标的真实状态。距离交并比损失可以在保持交并比损失优势的同时最小化两个边界框的中心点之间的距离,从而使目标估计更加准确。分类部分可以给出目标的粗略位置,利用该位置信息可以生成不同的候选边界框。通过训练目标估计部分来预测目标真实边界框和候选边界框之间的距离交并比分数来确定目标最终的位置信息。
其他文献
短临降雨预报指的是对指定区域内短期的(一般为0到6小时)降雨分布情况进行预报。虽然现阶段已经有着各种各样的观测设备来对降雨进行监测,但是为了满足短临降雨预报对时空分辨率的需求,本文将以多普勒气象雷达数据作为核心数据,先对雷达回波图像序列进行预测,再根据雷达回波图像中雷达回波反射率和降雨量之间的对应关系,来对降雨量进行定量的精准预报。随着大量的历史雷达回波图像数据的产生,如何利用这些海量数据,并从中
学位
自然语言处理工具是实现自然语言处理领域子任务的功能集成构件,为文本处理和分析提供有效的支撑。当前自然语言处理工具种类较多,各种工具对子任务支持程度以及具体适用领域等差异会对工具选用造成困扰。首先依据处理顺序将工具支持的子任务划分为辅助任务、基础任务以及应用任务并介绍,选取LTP、NLPIR、OpenNLP等23种国内外自然语言处理开源工具,对这些工具的调用方式、支持的程序语言等方面作比较,总结各种
期刊
现实世界中,很多现象可以用反应扩散系统来描述,例如生物种群的扩散迁移、传染病的扩散、河流污染物的对流扩散、热传导现象等,对该类系统进行有效控制具有重要的实际应用价值。目前关于反应扩散系统的控制主要有分布式控制和边界控制两种。分布式控制需把控制器安置在系统所在区域的每一点处,而边界控制只需将控制器安置在区域边界处,在实际中更易于实现。本文针对几类反应扩散系统,给出连续边界控制器和间歇边界控制器的设计
学位
我国雪致工程灾害分布广泛、发生频繁、影响巨大,凸显灾害防控工作的重要性与紧迫性。其中,雪致建筑损坏、倒塌事故逐年增加,建筑结构抗雪形势严峻。而事故发生的主要原因之一是,对复杂环境因素影响下屋面积雪演变的全过程认知不明,尤以风-雪-热因素联合为主导。现阶段,屋面积雪全过程演变的研究多面向风雪耦合作用开展,对风-雪-热联合作用的讨论却寥寥无几。其中,为明确所讨论的风雪环境,学者们及工程从业人员多参考相
学位
充分利用太阳能这类绿色能源是解决能源危机的一种有效途径。与传统的无机太阳能电池相比,聚合物太阳能电池(PSCs)因其轻质、柔性、易于溶液加工等优点,受到国内外研究人员的广泛关注。目前,通过改进分子结构、器件结构和器件制备工艺,聚合物太阳能电池的发展已经取得了巨大的进步。但是,如何有效提高聚合物太阳能电池的能量转换效率(PCE)和稳定性仍然是该研究领域面临的最大挑战。为了实现高效的聚合物太阳能电池,
学位
随着电子成像技术的发展和医疗成像设备的普及,胸部X光影像检查已成为胸肺部疾病诊断过程中最为常用的筛查手段和诊断依据之一。然而,由于胸部X光影像存在疾病异常多样、病理特征复杂等特点,传统的人工阅片模式往往需要通过长时间的手工病灶标注和疾病推衍分析来获取相关解剖信息。同时,其诊断精度严重依赖于影像科医生的临床知识积累及主观凭判依据。近年来,人工智能技术和临床大数据的进步和发展,使得从海量胸部X光影像数
学位
基于光学信号的传感和成像技术具有灵敏度高、特异性好、响应速度快、成本较低、能够实现非侵入性成像等特点,已成为生物医学领域中的重要工具。与无机发光材料相比,有机发光材料具有更高的光捕获能力、更高的亮度、更好的生物相容性、性能连续可调等特点。然而,当前的有机发光材料在生物成像和传感应用中仍然缺乏对生物标志物特异性的识别能力,极大限制了其临床转化和商业应用。研究人员已经开发出了生物分子偶联策略来解决上述
学位
计算机博弈作为人工智能领域的重要研究方向,一直被视为验证人工智能理论的试金石。根据博弈信息是否完全可见,计算机博弈可以分为完全信息博弈与非完全信息博弈。相比于完全信息博弈,非完全信息博弈由于包含博弈参与者不可见的隐藏信息,其策略求解研究更加困难也更有挑战性。在非完全信息博弈场景中,如何求解博弈参与者的博弈策略成为亟待解决的重要问题。在此背景下,虚拟遗憾最小化(Counterfactual Regr
学位
随着半导体集成器件的飞速发展,人类已经逐渐进入了信息化技术促进产业变革的智能化时代。智能化时代一个重要的发展趋势就是器件小型化,高度集成化和工业自动化,因此,对终端产品的核心器件——透镜,也必须能够满足器件小型化和集成化的需求。然而,传统透镜的庞大体积,严重阻碍了其进一步发展,此时,基于衍射光学的平面光学元件——超构表面透镜(metalens)成为了透镜集成化很好的选择。这种通过亚波长纳米结构来进
学位
为了满足人类日益增长的发展需求,寻找和开发绿色可再生能源已迫在眉睫。有机太阳能电池由于其价格低廉、质轻体薄、颜色多样以及可实现建筑一体化处理等优点在新能源材料中逐渐崭露头角。在近20年的努力下,有机太阳能电池的光电转化效率从不到1%迅速提高至超过18%,展现出巨大的发展潜力。其中设计新型的非富勒烯受体材料成为推动电池快速发展的有效策略之一。然而,在发展材料的同时,还需深入研究材料的内在作用机理,尤
学位