基于深度学习的行人再识别方法研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:kuangtuzhm11
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人再识别(ReID),是利用图像处理技术旨在给定需要查询行人的情况下,在数据库中检索指定行人的图像。目前的用于训练行人再识别模型的数据集,来自于仅限的固定采集装置,样本样式风格的多样性匮乏。同时,因为跨域行人再识别技术由于源域与目标域样本差异较大,导致在一个域训练的行人再识别模型直接在另一个域上测验效果时,性能明显不能满足预期。鉴于上述情况存在的疑难,本文运用基于深度学习的ReID的方法开展研究。主要运用深度学习中的相关算法及理论技术,对行人再识别以及跨域行人再识别开展研究。首先,提出一种跨域图像风格迁移的ReID方法。此方法使用改良的循环生成对抗网络结构,能够使得来自不同数据集的不同摄像机捕捉到的图像数据进行样式风格迁移,解决现有的跨域行人再识别技术中源域与目标域样本差异较大的问题,提升跨域行人再识别的测验效果。其次,提出了一种基于正负样本训练的单域图像样式风格迁移的ReID方法。该方法同样使用改良的循环生成对抗网络框架,能够使得同一个数据集内的不同摄像机捕捉到的图像数据进行样式风格迁移,可以通过较低成本来提升单域图像样本风格的多样性。此方法把样式风格迁移后的数据作为负样本,样式风格迁移前的数据作为正样本,将正负样本同时送入模型训练,并且在控制正负样本输入比例的同时,通过不同的损失函数来优化正负样本的损失,进而提升模型的泛化能力。本文在学术和实际应用的贡献如下:1、为了解决ReID技术存在的单域内样本样式风格缺乏多样性,以及源域和目标域之间样本差异较大的问题。本文通过对循环生成对抗网络进行改良,能够直接把不成对的图像数据送入模型进行训练。该框架使源域图像在结合另外一个域的图像风格后,其相似性与目标域行人图像数据的相似性更接近,样本多样性比未转换前获得了增强,减小了域间样本的差异,并且使单域内的不同摄像机捕捉到的图像数据进行样式风格迁移,能够通过较低成本使单域内样本风格的多样性获得提升。2、为了解决跨域ReID技术存在源域与目标域样本差异较大,导致在一个域训练的模型直接在另一个域上测验时,性能明显下降的问题。本文采用一种跨域图像风格迁移的行人再识别方法来增加样本多样性,它缩小了目标域与源域样本间的差异。具体来说,通过运用改良的循环生成对抗网络框架,源域图像在结合另外一个域的图像风格后,其相似性与目标域数据的相似性更接近,样本多样性比未转换前获得了增强,减小了域间样本的差异,使得模型具备更好的泛化性能。测验结果显示,通过对Market-1501、Duke MTMC-re ID和MSMT17数据集两两互相实行风格迁移后,再通过残差网络提取全局特征,跨域再识别准确率显著提升。同时,模型在不结合目标域数据集样式风格或者在目标数据集较少的情况下仍能达到较好的再识别效果,优于当下测验较好的其他跨域行人再识别方法。3、为了解决单域内ReID样本样式风格缺乏多样性的难题,本文运用改良的循环生成对抗网络框架,使单域内的不同摄像机捕捉到的图像数据进行样式风格迁移,能够通过较低成本使得样本样式风格的多样性获得提升。为提升模型的泛化性能,设计了一种新的正负样本联合训练机制。首先,设计了一个基于残差网络的行人再识别框架,把样式风格迁移后的样本作为负样本,样式风格迁移前的样本作为正样本,将正负样本按照不同比例同时送入模型展开训练。进一步,为了防止过拟合并且考虑错误标签位置的损失,采用了标签平滑正则化。同时,为了更多地关注困难的、易错分的样本,实现对负样本的损失优化,采用了焦点损失函数。通过降低成本并结合正负样本融合训练机制,行人再识别效果较好。在Market-1501数据集和Duke MTMC-re ID数据集上分别显著提升1.51%和2.07%。综上所述,本文运用深度学习技术,从域间样本差异以及单域内样本多样性的视角对行人再识别任务开展研究实验和分析。这些技术可以应用在机器人视觉等相关领域。
其他文献
近年来,在各种工程和生物应用的推动下,垂直圆管内外壁的粘性流体覆膜成为了研究热点,尤其在管壁保护层的涂覆,光纤、导线电缆表面的覆膜等方面受到了广泛的应用。目前已有的对流体薄膜厚度的测量方法多数为接触式测量,然而接触式测量结果的可靠性和测量精度等级不高。本文为了深入研究圆管内壁覆膜动力学特性,设计了一套非接触式测量圆管内壁覆膜的实验装置,以及开发了一款数字化提取覆膜过程与瞬时流态的图像处理GUI界面
孔加工作为机械加工的基本工艺之一,在机械制造过程及加工工艺中具有无可替代的重要地位,其中小深孔加工是孔加工中重要分支,也是孔加工技术的难点。在小深孔加工过程中,钻头需要在封闭的环境中进行钻削,该加工技术是涉及断裂力学、热力学、材料力学等诸多理论的复杂动态变形过程,难以建立该过程的精确数学模型,从而导致经典的控制方法很难控制复杂多变的钻削状态,因此研究小深孔钻削过程的状态检测方法及自适应控制策略具有
无线电波信号穿过电子密度不规则体时,无线电波信号的相位、强度和偏振方式等发生不规则变化,即电离层闪烁。电离层闪烁现象严重威胁着卫星通信、导航定位、雷达监测等无线电系统性能。全球导航卫星系统(Global Navigation Satellite System,简称GNSS)广泛应用于社会生产生活中,人们对GNSS的依赖日益增长。因此,GNSS电离层闪烁预报成为了空间天气研究的热点。低纬地区GNSS
社交网络的快速发展促进了信息分享的广泛发生,为用户带来便利的同时,也产生了严重的隐私泄露问题。除传统的差分隐私、k匿名等隐私保护技术之外,使用新兴人工智能技术,借助于智能体高效实现隐私保护,也成为了信息安全领域的研究热点。其中,基于智能体的隐私协商可以协助社交网络用户在信息分享前建立隐私保护共识,具有一定的隐私泄露预先防护作用。可追责是行为或后果的责任主体可被追究的属性,是透明、可解释人工智能应用
随着影像组学和计算机辅助诊断等医学影像技术的不断发展与应用,医学图像中一些关键的解剖点的位置的确定对于后续的建模和分析的过程有着重大的意义。目前在医学图像分析的研究中,解剖点的检测大多依赖医生手动进行标记,这种手动的检测方式不仅浪费了医生宝贵的时间和精力而且检测结果的准确性会受到医生的工作状态、临床经验等一些主观因素的影响。因此医学图像解剖点自动检测的研究对现代医学的发展与进步有重要意义。本文针对
人类和动物可以持续地积累和巩固从先前观察到的任务中获取的知识,并通过不断地学习,解决新的问题或任务。然而,对于机器学习系统来说,这样的持续学习能力是重大难点之一,因为不断地从非平稳数据分布中获取可用信息通常会导致灾难性遗忘。近年来随着深度学习的发展,许多克服灾难性遗忘的方法相继涌现,但持续学习仍然是人工智能领域长期面临的挑战。针对持续学习领域中依然存在的一些问题,本文结合贝叶斯优化和变分推理,提出
随机采样是采样理论中一个非常重要的研究内容,其在学习理论、图像处理等方面发挥着重要的作用。混合范数Lebesgue空间对不同变量具有分离可积性,可以有效地模拟和度量实际生活中广泛存在的时变信号。本文主要对混合范数空间中平移不变信号的随机采样问题展开研究,重点研究信号的采样稳定性。注意到采样装置的物理特性,采样得到的样本值往往不是信号在采样集上的准确值,而是信号在采样位置处的局部平均。卷积采样作为一
随着光纤到户(Fiber to the Home,FTTH)传输技术的快速发展,高速光通信系统具有功耗低、集成密度高、带宽大、设备成熟以及抗电磁干扰能力强等诸多优势。光学分束器等无源器件作为FTTH的重要组成部分,被广泛应用于光通信系统以实现信息的高效快速传输。在无源光网络技术不断发展的同时,对光学分束器的传输性能和集成度等方面的要求也逐渐提高,低损耗且小尺寸的光功率分束器成为当前的研究重点。本文
光在三能级系统中的耦合是一个非常实用且不断发展的研究领域,在激励光源的作用下,控制两个不同跃迁通道间的相干,能够实现电磁感应透明(Electromagnetically Induced Transparency)、受激拉曼绝热通道(Stimulated Raman Adiabatic Passage)等光耦合调控效应,这在光通信领域具有非常大的应用潜力。但由于量子系统相关条件的限制,对其中能量耦合
作为在传热领域中占据一席之地的热管而言,脉动热管被认为是超高热流密度功耗的工况中最具前景的散热元器件之一,被广泛应用于电子散热设备当中。随着纳米技术的成熟,纳米流体也成为了热能这一传统领域的创新性研究。但在实际应用工程中,许多热能装置不可抗拒的受到各种外部环境的影响,其中振动这一因素占比相当大,而基于实际应用的振动工况而言的实验探究较为稀缺,不同振动工况对脉动热管的运行以及传热特性的影响规律也未被