【摘 要】
:
多目标跟踪(Multi-Object Tracking,MOT)作为计算机视觉的热门研究方向之一,在智能交通、自动驾驶、安防监控等场景有重大商业价值。然而,主流的多目标跟踪模型往往引入了大量参数,难以在移动设备上实时运行。因此,本文将提出一个可以在移动设备上实时运行的多目标跟踪模型,并针对两个关键问题进行研究:(1)目标检测作为多目标跟踪的上游任务,对跟踪效果尤为重要,跟踪模型需要在保证实时性的条
论文部分内容阅读
多目标跟踪(Multi-Object Tracking,MOT)作为计算机视觉的热门研究方向之一,在智能交通、自动驾驶、安防监控等场景有重大商业价值。然而,主流的多目标跟踪模型往往引入了大量参数,难以在移动设备上实时运行。因此,本文将提出一个可以在移动设备上实时运行的多目标跟踪模型,并针对两个关键问题进行研究:(1)目标检测作为多目标跟踪的上游任务,对跟踪效果尤为重要,跟踪模型需要在保证实时性的条件下尽可能提高检测器的性能;(2)表观特征是解决目标重叠和障碍物遮挡等问题的有效手段,跟踪模型需要在保证实时性的条件下快速提取出目标的表观特征。本文主要工作内容概括如下:(1)针对目标检测问题,本文选用轻量级目标检测模型YOLOv5s(You Only Look Once)作为多目标跟踪的检测器,通过问题分析,针对YOLOv5s提出多条优化方法:新增高分辨率检测头,舍弃模型原有的三个检测头,提高小目标的检测精度;对检测头进行解耦,解决目标检测子任务间的矛盾;增加正样本的数量,缓解正负样本不平衡问题;在骨干网络中嵌入通道注意力模块,提高特征的表达能力。实验结果表明,这些优化方法将YOLOv5s的参数量减少了2.34M,FPS提高了5帧,m AP50提高了2.8%,在保证实时性的条件下提升了检测器的性能。(2)针对表观特征提取问题,本文基于JDE(Joint Detection and Embedding)范式的设计思想,在优化后的YOLOv5s中增加了一个表观特征提取的网络分支,使目标检测分支和表观特征提取分支共享骨干网络,因为这种设计思想避免了SDE(Separate Detection and Embedding)范式的冗余计算问题,不会由于目标增多而大幅增加表观特征的提取时间,具有很好的实时性。其次,本文采用分类的思想优化表观特征提取分支,根据目标的运动特征和表观特征制定了多目标跟踪策略。实验结果表明,本文模型取得了有竞争力的跟踪精度,其FPS达到了59帧,可实时运行,已在精度和速度之间取得良好的平衡。(3)利用合作企业提供的交通监控数据集,本文将实时多目标跟踪模型部署到监控摄像头上,并对跟踪效果进行了展示,其FPS达到了20帧。
其他文献
在移动互联网高速发展的当今时代,随着移动应用的蓬勃发展,各种新业态逐渐催生。自动驾驶、短视频与远程办公等应用的出现也逐渐对图像处理等领域提出了新的要求。彩色图像分割作为一种已经研究多年的计算机视觉领域,也随着不同应用需求的提出与计算技术的提升而更新迭代。本文研究主要集中于对彩色图像分割算法的优化。在彩色图像分割问题中,主要以传统非监督型图像分割算法为主。传统非监督型图像分割算法是一种比较底层的图像
一直以来,爆炸物的滥用给国家与社会安全均带来巨大的威胁,虽然目前对典型的硝基芳香类爆炸物(例如TNT)的检测技术日趋成熟,但对新兴的过氧化物类爆炸物的检测仍是一项艰巨且有意义的挑战。过氧化物类爆炸物中应用最广、危害最大的当属三过氧化三丙酮(TATP)。由于TATP没有紫外吸收与荧光发射,其化学结构中也没有硝基与苯环,因此缺乏有效的检测手段。TATP的稳定性极差,在实验室中无法安全制备与长期保存,易
关系分类旨在确定一个句子中给定两个实体之间的关系类型。目前有监督的关系分类方法需要大量提前标注的数据,而基于远程监督的方法能通过自动对齐语料库的知识来扩展数据量,但是会出现明显的长尾分布问题。因此,如何利用尾部的少量样本完成关系分类成为任务的热点,也是本文的主要研究方向。目前大多数研究都是采用预训练模型结合微调(Fine-tuning)的方式,但是随着模型参数的增多导致微调的过程需要大量的时间和数
投票是我们日常生活中非常常见的一项集体活动,是实现集体决策的一种常规手段。2017年,Mc Corry等人在以太坊区块链上实现了一种自计票投票协议来达成完全去中心化的秘密投票,但现有的自计票投票协议要求所有投票人都必须在规定时间内完成秘密投票,否则就会导致投票失败或者投票人损失押金,而未能及时投票的投票人(以下简称懒惰者)可能并非是恶意的,只是因为网络堵塞或者设备故障,甚至仅仅只是因为临时有事耽搁
蛋白质作为人类生命活动的主要承担者和生物功能的最直接执行者,目前存在多种形式的翻译后修饰,而糖基化是其中最重要的以及研究最广的翻译后修饰之一。质谱技术的兴起对分析检测糖蛋白/肽具有不可估量的作用,但是却不能用质谱对糖蛋白/肽直接进行检测,这是糖蛋白的丰度低以及非糖肽的信号强度高会掩盖被检测的糖肽信号峰所导致的。因此,科学家们研究并开发了一系列对糖肽进行分离和富集的亲和方法,主要包括凝集素亲和法、肼
十多年来,共价有机骨架(COFs)快速进展并取得实质性成就,目前已经开发出分子水平修饰、表面工程、异质结耦合和纳米结构等有效策略来提高光催化性能。不同于非晶态多孔有机聚合物,具备拓扑学分子可设计性是晶态COFs最为关键的特征之一,因而COFs从结构设计到合成过程,乃至COFs的功能化都能实现高度可控,这赋予COFs在结构上的独特优势。目前,COFs作为光功能材料被成功制备和研究,并广泛应用于水分解
无感知环境下的人脸识别无需用户停留或注视摄像头,而只需他们自然通过即可被识别,这不仅能够提高用户体验,还能帮助实现人员追踪及搜索等应用。然而,现有的训练数据集缺乏人脸被遮挡、角度大、虚焦和光照过亮或过暗等无感知场景下的人脸数据,从而使得人脸识别模型难以提取这类场景中数据的有效特征,最终导致样本漏识别或误识别。因此,为了让模型具备适应无感知场景的能力,需要在其训练过程中加入大量的这类场景下的数据,从
超分子凝胶是由小分子凝胶剂在非共价相互作用驱动下自组装形成的一种软物质材料,在制备手性光学材料和开发手性应用方面具有重要作用。本文旨在基于超分子凝胶制备手性光学材料,尤其是进一步开发新的基于L-谷氨酸的两亲性手性凝胶因子,并对其手性纳米结构和超分子手性进行调控;同时,通过将荧光基元与已有的L-谷氨酸两亲性手性凝胶复合,进一步赋予和拓展其在圆偏振荧光方面的性质和应用。研究主要分为以下两个方面:(1)
网络表示学习的目标是在有效保留网络信息的前提下将节点映射到低维向量空间进行表示,从而支撑网络数据挖掘的众多下游任务,如链路预测、节点分类等。网络表示学习已经成为网络分析领域的研究热点。现有的网络表示学习方法主要面向静态同质网络进行设计,然而现实世界中的网络通常是包含多种类型节点和链路的异质网络且网络结构随时间不断变化的动态网络,如电商网络、社交网络等。静态同质网络建模方法忽略了异质网络中丰富的语义
有机小分子荧光探针具有选择性好、响应时间快、使用方便等特点,被广泛应用于小分子,阴阳离子等的检验。荧光探针根据不同的响应机制,可分为淬灭型荧光探针、增强型荧光探针和比例型荧光探针;与另外两种只有单一响应机制的淬灭型和增强型荧光探针相比,比例型荧光探针可通过两种发射峰的强度比值变化来进行自校正以消除其他因素对探针的干扰。有机小分子荧光探针不但适用于传统的检测实验,还由于其对细胞伤害非常小的特点,应用