【摘 要】
:
长期目标跟踪技术受目标消失再现、目标尺度剧烈变化与目标外观剧烈变化等各种复杂情况影响,算法的实际表现与现实应用有巨大差距。随着科学技术与相关算法理论的发展,科研人员通过不同的方法获取目标更为丰富的高级且抽象的深层特征,使得跟踪算法的准确度得到提升。针对目标消失再现、目标尺度剧烈变化与目标外观剧烈变化的问题,以及基于时空一致性假设的目标跟踪方法存在的误差积累问题,本文利用深度学习方法提取被跟踪目标的
论文部分内容阅读
长期目标跟踪技术受目标消失再现、目标尺度剧烈变化与目标外观剧烈变化等各种复杂情况影响,算法的实际表现与现实应用有巨大差距。随着科学技术与相关算法理论的发展,科研人员通过不同的方法获取目标更为丰富的高级且抽象的深层特征,使得跟踪算法的准确度得到提升。针对目标消失再现、目标尺度剧烈变化与目标外观剧烈变化的问题,以及基于时空一致性假设的目标跟踪方法存在的误差积累问题,本文利用深度学习方法提取被跟踪目标的深层语义信息,通过对目标的浅层与深层特征进行编码与解码处理,输出准确位置,并提高长期目标跟踪模型的准确性与鲁棒性。本文主要工作内容如下:(1)设计了基于多尺度全局检索与时空一致性匹配的目标跟踪模型。本文提出的模型将长期目标跟踪任务重新定义为单样本检索任务,即在搜索图上根据固定不变的模板图像进行全局检索,以此来保证每一帧的推理结果是相互独立且互不相关的。基于此方法可以解决基于时空一致性假设的目标跟踪方法存在误差积累的问题,并可以克服跟踪过程中的目标消失再现问题。在此基础上,利用空洞卷积获取不同感受野下的目标深层语义信息,解决目标尺度与目标外观变化引起的跟踪失败问题。在无误差积累的前提下,引入时空一致性匹配模型,充分提升模型的跟踪准确度。通过在VOT2018LT与Ox Uv A数据集上进行的性能分析实验与消融实验分别证明了本文提出的模型的有效性与时空一致性匹配模型的有效性。(2)在上述模型的基础上,进一步探索模型的性能表现,包括准确度提升、推理速度提升与鲁棒性提升,并设计了基于注意力与在线更新机制的改进跟踪模型。针对跟踪算法实时性受限的问题,本文选用深度可分离卷积来减少运算量,并提升跟踪算法的推理速度。针对跟踪算法准确度受限的问题,引入轻量注意力模型Non-Local来增强特征图的自编码和互编码能力。在提升算法准确率的同时,保证了模型的推理速度。为保持模型在长时间推理状态下的鲁棒性,引入在线更新机制。在线更新机制能有效地使模型自适应的学习到不同场景下的目标深层次外观信息。通过在VOT2018LT数据集、Ox Uv A数据集与GOT-10K数据集进行的性能分析实验证明了改进模型的有效性。
其他文献
板式换热器是通过一系列具有波纹形状的金属板片进行换热的装置。在生产板式换热器板片过程中,板片因重力冲压作用致使表面产生缺陷,当板片投入使用时,缺陷位置将无法承受注水后的压力而开裂,存在安全隐患。目前人工抽检与渗透探伤法是常用于板式换热器板片上的缺陷检测方法,但此类方法检测效率低,且受检测人员主观因素影响。随着人们对机器视觉应用地深入探索,根据板式换热器板片表面缺陷特征,以及基于对缺陷所处区域的了解
随着国民经济的快速发展和人民生活水平的显著提高,越来越多的人选择购买私家车,汽车数量的增加导致交通事故频发,造成大量财产损失和人身伤害。在造成交通事故的众多原因之中,疲劳驾驶占有很大的比重。因此,研究一种有效的驾驶员疲劳检测方法具有重要意义。本文查阅了大量相关文献,比较了三种常用的疲劳驾驶检测方法,选择了基于人脸特征的疲劳驾驶检测方法,该方法不会干扰驾驶员,且检测精度高。基于单一疲劳特征判断疲劳程
雷雨大风是一种影响较大的灾害天气,对整个国民经济能够产生严重的危害。目前气象领域使用机器学习方法来预测雷雨大风天气的场景少之又少,大多数都是研究雷雨大风的形成过程,而针对雷雨大风的预测往往需要专业人员结合专业知识进行预测,过度依赖专业知识,其预测效果也不理想。因此本文充分利用气象历史数据,研究了一种基于机器学习的天气预测方法。本文分别采用美国气象环境预报中心获取的全球化气象数据和某省地面观测站的实
随着大数据时代的不断发展,隐私保护已成为现代数字化社会需要面临的重要问题之一。当用户与在线服务提供商交互时,需要提供所需的身份信息来进行认证。然而,恶意的服务提供商会过度收集用户的个人信息,将用户身份数据与其行为数据相关联并对用户进行大数据定位,从而导致用户隐私信息的泄露。匿名认证技术的提出解决了传统身份认证隐私泄露的问题,即用户可以根据服务场景要求,提供相应发行方为其发布的匿名凭证证明自己有资格
生物特征识别技术是指利用人类个体之间的生理特征或者行为特征的差异对个体身份进行识别的技术。近年来,随着计算机运算能力的快速提升和信息数据爆发式的增长,基于深度神经网络的新一代人工智能技术正在被广泛地应用在生物特征识别领域。步态识别是一种新型的生物识别技术。与指纹、人脸、虹膜等对输入数据质量要求较高的识别技术不同,步态识别对输入数据的质量要求很低,录入时不需要特殊的设备,使用普通监控摄像头即可进行。
在全球信息化的大背景下,工业高速发展,旋转机械设备发展方向趋于结构复杂化、过程自动化、操作智能化。齿轮因其承载能力大、传动效率高等优点广泛应用于现代设备中,如航空、采矿、农业机械、军事装备和冶金机械等领域。齿轮是设备运行中故障率较高的传动部件,齿轮故障将直接影响整机的可靠运行,降低整个设备的效率和精度,甚至造成不可逆的严重后果。因此,开展齿轮故障的诊断识别具有重大意义。声发射检测是一种无损检测技术
信息隐藏被视为保障数据安全的重要手段。图像是最常见的一类数据媒体,在网络上广泛传播具有一定安全隐患,同时,也存在一些特殊应用场景,如需要在图像中嵌入URL等其他信息,这使得图像隐写技术受到研究者的更多关注。部分研究对隐写容量和鲁棒性等问题进行了探讨,但生成的载密图像质量不稳定,部分载密图像在低频区域有明显的改动痕迹,处理后的图像模糊,质量低,与载体图像差距较大。本文以生成高质量的载密图像为研究对象
与CT、超声等医学图像相比,病理图像能提供更多有效的诊断信息,故被广泛地应用于临床诊断和医学研究中。在传统的肺部细胞病理学诊断过程中,由于病理医生资源的短缺以及不同肺部疾病的异常细胞形态和排列结构的复杂性,均导致了肺类疾病诊断时误诊率的上升。因此,有助于降低误诊率的肺部细胞病理图像辅助诊断系统具有十分重要的研究意义,而肺部异常细胞的准确分割作为该系统最为关键的一步,在现有的研究中并未被很好地实现。
两相流广泛存在于电力、环保、化工、冶金和核能等国民经济行业中,特别是在冶金、电力等行业,在炉、窑对煤粉的输送过程中,若煤粉浓度偏高,将导致燃烧不充分或引起偏火,而煤粉浓度偏低将会直接影响生产效率和产品质量,因此对生产过程的计量和安全监控具有非常重要的意义。电容层析成像(Electrical Capacitance Tomography,ECT)技术利用放置在被测管道或容器周围的传感器阵列,获得不同
长输油气管道由于腐蚀等原因产生缺陷后,在内压作用下,会在该缺陷处形成应力集中区,最终促进裂纹向纵深扩展直至管道断裂。这种“宏观缺陷”与“应力”并存的综合性缺陷,是造成在役管道突发性管道泄漏爆炸等事故的主要因素之一。因此,对管道缺陷处应力大小的评估至关重要。漏磁检测和弱磁检测是两种使用广泛的管道内检测手段,漏磁检测以其极强的稳定性,被广泛应用于在役管道检测中。弱磁检测作为一种新兴的检测手段,可以检测