基于双检测器的长期目标跟踪算法研究

来源 :南京信息工程大学 | 被引量 : 0次 | 上传用户:zjlsxz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标跟踪作为计算机视觉领域的研究热点之一,在现在社会中有着广泛的应用。虽然目前已经提出了很多优秀的算法,但是由于跟踪挑战因素与训练样本的制约,目标跟踪算法在有些方面的表现依然不够理想。本文在相关滤波算法的基础上,针对现有跟踪算法中存在的问题,做了以下工作:为了解决目标跟踪算法在面对长期遮挡后无法识别目标的问题,本文在相关滤波算法的基础上,提出一种基于双检测器系统的长期目标跟踪算法。在跟踪过程中,当跟踪器检测到的目标位置可靠性较低时,启动检测器对视频帧的当前区域进行重新检测。其中检测器由支持向量机检测器和孪生网络检测器组合而成,前者用来对当前区域快速检测,若没有检测到可靠目标,再启动孪生网络检测器进行深度搜索,最大化节约时间成本,通过两者的协同工作实现目标重检测。为了应对长期跟踪过程中容易发生目标漂移的现象,本文加入了自适应空间正则化项,可以有效抑制背景信息,增加模型鲁棒性。同时采用交替方向乘子法优化目标函数,可以更快速地求出最优解。实验表明,该算法在OTB数据集上达到了预期的结果,特别是在进行长视频序列的跟踪时,跟踪效果提升比较明显。为了解决目标移出视野后可能从其它任意地方再次进入容易导致目标跟踪丢失的问题,提出一种基于出视野检测器的目标跟踪算法。在跟踪过程中,若目标移出视野,则启动出视野检测器;该检测器通过对图片边缘进行实时的监测,并采用最大响应值和奇异值矩阵余弦相关性大小判断当前监测结果中有没有目标进入,直到找到较为可信的目标才退出检测器,并继续跟踪。为了训练出更为可靠的滤波器,提出一种改进的平均峰值相关能量作为当前跟踪结果的评判标准,若跟踪效果较好,则更新模型。最后通过训练两个相关滤波器分别进行目标尺度估计和位置估计,提高算法跟踪精度。实验表明,本章算法能够取得较为理想的跟踪效果,可以有效应对目标出视野的情况,而且在面对其他挑战因素时也有较好的表现。
其他文献
近年来,物联网(Internet of Things,Io T)技术发展迅速,其应用领域已经扩展到智能家居、智能医疗、农场监测和智慧交通等方面。由于无线通信环境的开放性,安全与隐私问题是物联网发展的关键因素。认证方案是实现物联网安全的第一道防线,但是单一认证方案容易造成传感器节点认证的延迟、网络资源占用问题,而群组认证方案能够提高网关对节点的认证效率,适合节点数目繁多的物联网环境。此外,若节点以真
信息隐藏是保证网络通信数据安全的重要手段之一,发送方可以通过密钥和特定算法将秘密信息嵌入到载体中,再由接收方通过密钥和特定算法提取出秘密信息。其中,图像因其易获取性和多样性,成为目前使用最为广泛的隐藏载体之一。信息隐藏技术不仅能够保证秘密信息本身的安全,还能保证载密图像进行可靠的传输,因而受到国内外学者的广泛关注及深入研究。传统自适应图像隐写算法对于待改变像素位置选择大多依赖人为经验设计,需要耗费
深度神经网络在图像分类、目标识别等任务中已经取得了显著效果,然而训练集(源域)和测试集(目标域)的数据分布不一致会导致模型的性能大幅下降。领域自适应在解决训练数据与测试数据分布不同方面具有重要的现实意义。本文重点研究在目标域无标签的情况下提取领域不变特征,提高模型对于目标域的分类准确率。现有的域适应方法忽略了目标样本的分类信息,在特征提取过程中生成器往往在分类边界产生有分歧的特征从而影响了模型分类
心理学研究表明图像刺激会唤起人类的不同情感响应,图像情感分类任务旨在运用机器学习模型自动预测观测者看到图像时的情感反映,构建图像情感自动预测模型在社交网络、互动广告推广等场景中具有重要的应用价值。现有研究表明相比于整幅图像,图像的某些局部区域会更易引起人类情感响应,而注意力机制则可以有效学习图像中与任务关联的关键区域。为此,本论文提出了联合视觉显著性的图像情感分类网络模型。具体工作包括两个方面:(
随着社会的快速发展,微信、淘宝、微博等社交媒体用户数数以亿计,通过社交媒体可以发表心情、感想和对各类事件的看法等,并由此产生了大量的社交文本数据。通过对社交文本中的情感信息进行情感倾向挖掘,可以很直观的反映出用户个人的情感倾向和社会舆论问题。在政府舆论监督、企业管理决策、个人情感管理等方面都发挥着重要的作用。目前,针对传统文本情感倾向的分析研究已经比较成熟,但社交短文本的情感分析研究依然还比较落后
深度学习在给计算机视觉领域带来革新的同时,也对社会安全产生着威胁。尤其是近年来由人脸交换技术制作的伪造人脸视频,不仅侵犯了个人隐私还影响了社会安全。目前大量的研究开始专注于检测这类伪造人脸视频,但在检测模型的设计阶段普遍缺乏针对动态瑕疵、纹理瑕疵等伪造人脸特殊性的考虑,导致现有模型难以有效地融合人脸视频的空间与时间特征。另外,缺乏足够的约束会导致模型学习到冗余信息,进而使伪造检测任务上特征的表达精
射频识别技术(Radio Frequency Identification,RFID)已先后在多个领域内成功地应用,给人们带来了诸多的便利。而且随着物联网热潮的兴起,深入到人们日常的生活工作出行中,人们也越来越离不开射频识别等技术。然而,基于射频识别技术的系统工作在开放信道中,往往面临着窃听、重放、去同步等多种类型的安全威胁,在交易或使用过程容易出现隐私信息泄露、财产损失等问题,这将会阻碍物联网技
随着深度学习的广泛应用,通过变脸、换脸或生成对抗网络(Generative Adversarial Network,GAN)等方式生成的虚假人脸在网络中不断传播。因此,研究有效的人脸取证技术变得尤为重要。针对生成人脸检测,当前其研究主要关注整幅人脸图像均为生成的。但在一些现实场景中,一幅生成人脸图像中只是小部分局部区域是生成的,甚至很小部分,其余绝大部分区域都是自然的,例如人脸图像复原、眼镜去除、
数字图像数量的急速增长促使各团体组织和个人,将图像存储和计算处理外包给云服务器。而无防御地上传明文图像到云服务器会带来隐私泄露风险,图像加密又会阻碍数据的有效使用。现有的加密图像检索技术使用户承担了大量计算任务,如特征提取、特征加密、索引建立等,因而研究减轻用户负担的检索方案成为了本论文的重点。为此,本论文提出基于局部二值模式(Local Binary Pattern,简称LBP)的加密图像检索方
近年来,三维点云分析在计算机视觉、机器人以及自动驾驶等许多领域得到了广泛关注。传统的点云分析方法通过人为定义的规则或手工设计的特征提取点云的特征表示。这类方法依赖于启发式的先验知识,因此不能很好地处理复杂的点云场景。随着深度学习技术的蓬勃发展,越来越多的研究人员将这一技术应用到点云分析中,并在各种点云分析任务中取得了显著效果。然而,点云具有不规则性、无序性以及稀疏性等特性,这使得如何高效地提取点云