基于自注意力和人体姿态的遮挡行人重识别研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:dza1987
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人重识别任务主要是给定一张行人图像,在一个大型的图片库中去匹配到该行人的另一张图像。近些年来不断涌出的基于深度网络的行人重识别算法在很多大型数据集上都持续刷新记录。由于现实情况下可能会存在各种遮挡物体,很多用于解决行人重识别任务的模型并不能很好地适用于存在很多遮挡的数据。因此,本文研究了在遮挡情况下的行人重识别,根据对遮挡数据的不同处理,将分为局部行人重识别和遮挡行人重识别两个子任务分别去研究。局部行人重识别中的查询图片是将遮挡部位裁剪掉后得到的部分行人图片,在这个任务中,主要有两个难点,第一个是缺乏大型的可以用来进行深度学习的数据集,第二个是如果直接将部分行人与完整行人计算距离,会导致没有对齐的问题。本文首先利用数据增广的方式去解决数据匮乏的问题,然后提出了一个与遮挡数据类型相关的损失函数让网络识别不同的部分行人图像,在测试的时候,网络针对不同的局部行人图像会预测一个裁剪类型标签,根据这个裁剪类型标签,对待匹配的图片库中的图像做相应的裁剪,送入网络中提取特征,再与查询图像计算距离,这样可以减少查询图像与待匹配图片库中图像的非共有区域给识别过程带来影响,很好地对齐了部分行人图像与完整行人图像。本文提出的模型在两个局部行人数据集上均取得了最好的结果。针对遮挡行人重识别问题,本文提出的模型融入了人体姿态信息。由于遮挡物体的存在,在匹配过程中,很容易计算一张图片的遮挡部位与另一张图片的人体区域部位的距离,这样引入的干扰会对重识别造成很大的影响。本文将人体关键点的信息融入到基础网络提取到的特征图中,通过一系列池化操作将特征分为局部分支与全局分支,在测试的时候,根据姿态信息包含的关键点位置对行人的遮挡部位进行判断,选择出同时可见的部位特征进行距离计算,忽略非共有部位的特征,减少遮挡部位的影响。本文提出的应用于遮挡行人重识别任务的模型在两个遮挡数据集上均取得了最好的结果。
其他文献
作为一种重要的机器学习方法,聚类算法在许多数据分类领域得到了广泛的应用,人们可以利用聚类算法完成数据挖掘、图形模式识别、图像分割等工作,并取得了不错的成绩。然而,由于聚类算法无监督学习的特点,对聚类结果的质量进行评估就成了一项重要的研究内容。与此同时,许多聚类算法必须在开始运行之前设置目标数据集的类簇个数,但是在通常情况下,这个数字往往难以事先获知。围绕上述两个问题,本文从簇间分离度的衡量方法入手
超密集网络(Ultra Dense Network,UDN)中,被赋予计算功能的小基站由于计算能力受限容易过载,从而影响用户服务质量。另一方面,UDN大量部署小基站扩展系统容量的同时也导致了网络的致密化,数量频繁且不必要的小区切换将会产生额外网络能耗。以上存在的两大网络资源管理问题制约UDN的发展,值得深入研究。在移动边缘计算(Mobile Edge Computing,MEC)中,往往以消极的方
在大规模机器通信(massive machine type communication,m MTC)场景中,基站接收到耦合在一起的信号,如何高效准确的从耦合数据中恢复用户的传输数据成为了难题。由于m MTC中潜在的稀疏特性,压缩感知(Compressed Sensing,CS)技术可以用来联合检测上行免调度NOMA系统中的用户数据和活跃性。目前,基于CS的贪婪类算法因其复杂度低、重构精度高等优势,
大规模MIMO(Massive Multiple-input Multiple-output,Massive MIMO)技术在发射器和接收器中使用多天线阵列可以数倍地提高网络连接的容量,增加信号的收发路径和频谱效率。Massive MIMO带来优势的同时也引发了一系列的问题,由于天线数目变多,导致信道增益矩阵的维度变大。因此,对基站端进行信号检测的算法提出了更高的要求,目标是实现低复杂度且高性能的
近年来随着信息收集设备技术的进步和普及,现实世界中的数据收集难度大大降低。但是数据半结构化甚至无结构化特点易导致样本的维度达到几万甚至几十万维,需要特征选择等算法来解决所带来的维度灾难问题。然而传统的特征选择方法更倾向于选取具有鉴别性的特征,忽略了数据内在的平衡性,无法得到正确结果。因此在数据挖掘和机器学习中,急需行而有效的算法从原始数据特征集中选择相关的特征。在许多真实的数据挖掘应用中,如无线传
为了支撑上层自动驾驶功能,一辆自动驾驶汽车通常安装大量的传感器来获取道路状况,并安装众多应用程序来保障其正常运行。然而,传统的车内网络缺少细粒度的认证单元和各类加密单元,很多应用程序可以过度访问自动驾驶车辆上的敏感数据,造成车辆的隐私泄露。此外,车载相机系统易受到光线影响,在极端环境下感知的准确性有限;针对这一问题,一些学者提出将车辆自组织网络与自动驾驶技术结合,提高自动避障性能,然而保障消息的安
采用主动有源装置如雷达等设备来估计目标的位置属于有源定位的范围,有源定位的一个缺点是很容易受到反辐射打击或电子干扰,使得系统的安全得不到保障,而无源定位技术的出现很好的解决了这个问题。无源定位技术相对于有源定位的主要区别在于其自身不需要发射信号,它是一种直接利用目标发射或反射的信号来获取目标位置的技术,其基本原理是利用多个位置明确的接收站共同接收目标发射或反射的信号,从中提取出能用来获取目标位置参
随着互联网的飞速发展,人们可以从互联网上获得的信息也与日俱增。而信息的激增也会带来信息过载的问题,人们虽然可以更容易地找到自己所需要的信息,但对自己而言无用的信息也随之激增。为了解决信息过载问题给用户带来的困扰,推荐系统应运而生。在推荐系统技术中,协同过滤算法是使用最为广泛的算法。但协同过滤算法发展至今仍需解决诸如数据稀疏性、冷启动等众多问题。本文针对协同过滤算法的缺陷和现有方法的不足进行深入研究
在面对恶劣环境时,单导航系统性能表现不佳,定位精度有限。随着卫星导航系统的发展与完善,相比单一导航系统,组合导航系统以其可以提供更多的可见卫星和提高定位精度受到更多的关注。同时,北斗三号系统的最新建成为组合导航系统的发展提供新动力。然而在组合系统选星场景下,冗余卫星信号的增加却加大了卫星选择的时间和计算成本。因此,本文为改善选星问题,提出基于差分进化的选星算法,利用差分进化的快速搜索能力达到快速选
现实生活中存在着各式各样的文本(印刷体或是手写体),比如书籍、支票、广告牌、考试卷,而如何自动地识别图像中的文本具有很大的应用价值和研究价值。图像中的文本信息对于其他计算机视觉任务,如图片检索、无人驾驶、场景理解、即时翻译等有着很大的帮助。因此,自然场景中的文本检测和识别引起了学术界和工业界大量关注。越来越多的纸质文档通过拍照成像进行识别,且很多文档中手写和印刷体文本混合。因此,本论文除了研究场景