复杂场景下基于深度学习的单目标跟踪算法研究

来源 :沈阳理工大学 | 被引量 : 0次 | 上传用户:slientlamb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标跟踪技术是计算机视觉领域重要研究方向之一,广泛应用于交通、监控、军事等领域,有着极其重要的实用价值和研究意义。目标跟踪任务是指根据初始视频帧中目标的位置,预测后续帧中目标的位置坐标,并使用边界框对其进行标记。近年来随着科学技术的进步,目标跟踪技术得到长足的发展,涌现了一大批优秀的目标跟踪算法,但目标跟踪领域中运动模糊、低分辨率等难点仍未被很好地解决,因此复杂场景下实现对目标的鲁棒实时性跟踪仍是一个具有挑战性的课题。现有的目标跟踪算法主要分为传统目标跟踪算法和深度学习目标跟踪算法,传统目标跟踪虽然在特定简单场景下表现优异,但在复杂场景下跟踪效果较差,无法满足实际应用需求。深度学习目标跟踪算法能够很好地应对复杂场景下各种干扰因素,但由于其所采用的特征提取网络结构复杂,计算量大,导致其实时性较差。鉴于此,本文对基于深度学习的目标跟踪算法进行深入研究,权衡准确性和实时性,选取合适的跟踪网络框架,并对其进行相关改进达到鲁棒实时跟踪的要求。本文主要研究内容如下:1、本文对目标跟踪的基本定义、跟踪流程以及跟踪过程的相关难点进行了研究,对目标跟踪基础框架的每个模块在目标跟踪的作用以及涉及的关键技术进行了分析和介绍。研究了前馈神经网络和卷积神经网络的结构特点和工作原理,为后续章节的研究奠定了理论基础。2、本文通过对比分析现有基于深度学习的目标跟踪算法,并根据实际应用需求权衡跟踪算法的准确性和实时性,最终选取基于全卷积孪生网络的目标跟踪算法(SiamFC)作为基本跟踪网络框架,且对SiamFC采用浅层的AlexNet作为特征提取网络,导致提取目标特征表征能力较差的问题进行分析。针对运动模糊和低分辨率情况,SiamFC无法有效提取目标特征,模型发生漂移,导致跟踪失败的问题,本文对原SiamFC进行改进,提出了基于条件对抗生成孪生网络的目标跟踪算法(CAGNSiamFC)。通过在SiamFC跟踪网络中嵌入条件对抗生成(CGAN)去模糊网络模块,对输入的运动模糊和低分辨率视频帧进行去模糊,使特征提取网络能够有效的提取目标特征,提高跟踪网络的动态调节能力,增强跟踪算法的鲁棒性,实现运动模糊和低分辨率情况下对目标的跟踪。3、为了减少训练时间和降低训练难度,本文采用迁移学习的思想,使用分离训练线上组合方式对CGANSiamFC进行训练和测试。训练时分别采用不同的训练数据集对SiamFC跟踪网络和CGAN去模糊网络模块进行优化训练,测试时将训练完成的SiamFC跟踪网络和CGAN去模糊网络模块进行嵌入组合。最后使用OTB100测试集评估本文所提出的CGANSiamFC,且将评估结果与原SiamFC以及其它跟踪算法对比。实验结果表明,本文所提算法与原SiamFC相比能够准确的应对运动模糊和低分辨率难题,明显的提高跟踪精度。
其他文献
随着国内经济发展,基础设施大量建设,各城市都出现了用地紧张等限制城市发展的问题,因此将城市交通系统置于地下的想法应运而生,地下空间的开发利用成为了各大城市竞相开展的
激光诱导击穿光谱技术(Laser-induce breakdown spectroscopy,LIBS)技术是一种基于激光等离子体的原子发射光谱成分分析技术,在过去的二十年中,由于其快速、无损、原位、实时
情感分析是自然语言处理中的一项重要任务,其通过挖掘用户的评论文本,获取用户的情感观点倾向,具有巨大的实际应用价值。根据分析对象的粒度不同,情感分析可分为文章情感分析,句子情感分析和方面情感分析。其中,方面情感分析最为特殊,该任务需要针对评论文本中的不同情感表达对象给出其对应的情感极性。这种指向性的情感分析任务相较于其他两种任务具有更大的价值,近年来受到越来越多研究者的关注。深度学习作为一种强大的机
随着金融市场的不断发展,商业银行的经营环境逐渐复杂化,经营风险不断增加,为了使商业银行能够稳健经营,我国金融监管机构对银行业的经营制定了一系列政策进行监管,其中包括对商业银行资本的监管。根据巴塞尔协议的相关要求,监管机构对商业银行资本的监管主要通过资本充足率来体现,资本充足率越高意味着资本监管越严格,监管机构通过约束银行资本使得商业银行拥有足够资本来应对经营过程中的风险。然而这种资本约束虽然在一定
近年来,随着我国经济的迅速发展,交通堵塞的状况在城市中出现得十分频繁,像这种交通拥堵的状况给城市里的居民带来了很多不便。为了给城市里的居民的出行带来方便以及缓解交
随着城镇化的不断推进,城市中基坑工程将会越来越多,面临的施工环境也将越复杂,这就使工程研究人员更多的关注基坑稳定性的研究。在现在的基坑工程设计与施工中,经济性和安全
FS团队由国内稀缺的休闲帆船航海船长从业者组成,致力于将帆船这一欧美流行的度假方式带回国内,设计了一款创新的境外帆船航海度假产品原型,在过去两年里小范围试运行,用以打磨出适合国人消费偏好及度假习惯的帆船产品,并收到了市场上的良性反馈。FS团队希望借此时机将该产品原型进行商业化,正式进入规模化运营。为了使企业步入商业化经营的轨道,FS团队迫切需要对海外帆船度假产品的竞争战略进行深入梳理和规划,设计出
本体作为语义网中表达语义信息的一种方式,一直是语义网相关理论和技术的核心。随着越来越多的本体在语义网上可用并且本体的描述变得越来越复杂,构建没有错误的本体也变得十分困难。造成本体错误的一个重要原因是本体中存在不可满足概念,这就会导致本体不协调问题。本体诊断是解决本体不协调问题的一个重要途径,而且本体诊断对于本体质量的保证起着关键作用,因此对不协调本体进行诊断具有重大意义。通常一个不协调本体可能包含
物联网技术被称为世界信息产业的第三次浪潮,目前已广泛应用于人类的生产生活当中,对异构物品进行编码标识及解析是实现物联网技术的前提。因此异构物品编码与解析技术是物联网领域的核心技术之一,更是将物联网技术广泛应用于其他领域的基础。在国际标准化组织及其他相关机构的共同努力下,物联网编码标准与解析标准的发展得以大幅推进。但目前还没有形成一个一致统一的编码与解析标准,各解析系统所采用的编码标准及信息服务接口
随着无线网络通信技术的快速发展,移动端在线视频服务已经成为了移动互联网的主流应用,并占据大部分的无线通信流量。与此同时,用户对无线网络下在线视频业务的体验需求逐步发生改变,单一的主观评分以及传统的视频体验质量(QoE)建模方案难以充分反映用户的实际体验质量。因此,构建符合当前用户需求的无线网络视频体验质量预测模型已成为当前具有挑战性的热点问题。本论文依托于国家自然科学基金面上项目“网络视频体验质量