【摘 要】
:
车辆重识别技术也被称为车辆跨镜头追踪技术,其主要目的是从不同摄像头拍摄到的大量道路监控视频中检索属于特定车辆的全部图像。该技术需直接从车辆的视觉外观中提取到有判别性的特征,但是跨摄像头进行图像匹配时车辆图像往往来自于不同的视角,而在不同的视角下车辆的外观变化很大,因此跨视角匹配已经成为车辆重识别任务中一个重要的挑战:一方面,多个不同视角下同一车辆外观差异性大,导致车辆有着显著的类内差异;另一方面,
【基金项目】
:
国家自然科学基金“面上”项目:面向复杂场景的无监督迁移学习行人再识别方法研究(K19A300120);
论文部分内容阅读
车辆重识别技术也被称为车辆跨镜头追踪技术,其主要目的是从不同摄像头拍摄到的大量道路监控视频中检索属于特定车辆的全部图像。该技术需直接从车辆的视觉外观中提取到有判别性的特征,但是跨摄像头进行图像匹配时车辆图像往往来自于不同的视角,而在不同的视角下车辆的外观变化很大,因此跨视角匹配已经成为车辆重识别任务中一个重要的挑战:一方面,多个不同视角下同一车辆外观差异性大,导致车辆有着显著的类内差异;另一方面,同样的视角下,不同的车辆可能有相似的外观又导致车辆有微小的类间差异。这就要求车辆重识别模型提取的特征应同时具有很好的类间辨别性和对剧烈视角变化的鲁棒性。针对跨视角车辆重识别任务面临的挑战,本文提出了以下两种用于跨视角车辆重识别的方法:(1)基于视角相关超球面学习的跨视角车辆重识别算法首先,为了解决类间相似度大的问题,本模型中通过2-范数正则化将特征映射到超球面上以使其更具辨别性并使用超球面交叉熵损失函数和超球面相似度三元组损失函数来监督模型训练,同时进一步设计了一种有效的三元组损失中的样本选择方法以提升效果。其次为了建模车辆语义视角信息,论文收集并标注了一个车辆语义视角数据集以应对训练数据缺乏的问题,并训练了一个车辆语义视角的分类器以建模视角信息。最后,本文通过结合预测的语义视角概率和超球面特征嵌入方法,提取视角相关的超球面特征并设计了跨视角正交化限制,用于降低不同视角之间特征的相关性,以及一种基于注意力机制的全局池化方法,用于辅助模型提取更有效的特征。(2)基于多中心度量学习的跨视角车辆重识别方法由于有监督学习获取车辆视角信息的方法有很大程度上依赖于数据标注,因此本文中采用了一种无需视角相关标签的无监督方法建模视角信息。首先,本方法采用了一种类内多中心的结构来建模车辆内部的隐含的多个不同视角,其次设计了类内度量损失函数和跨视角中心限制以及类间度量损失函数和跨车辆中心限制,以解决在该特征空间中的类间跨视角匹配的问题和跨车辆匹配问题。最后本方法将两者结合在一起设计了多中心度量学习损失函数,通过联合优化使模型能有效提取类内与类间信息,获得多视角环境下鲁棒的特征。本文中针对车辆重识别中的跨视角匹配问题分别提出了有监督和无监督的两种算法以建模车辆视角信息。实验结果表明,本文提出的方法切实有效,提高了车辆重识别模型的匹配性能。
其他文献
无人驾驶技术与云计算、人工智能等技术的深度融合,为智能交通领域的发展带来深刻的变化。无人驾驶的核心技术主要包括环境感知、定位与建图、规划与决策和智能控制等,而高精度地图是L4级及以上无人驾驶的核心技术。虽然国内外学者针对高精地图生成方法的研究取得丰硕的成果,但其过程仍存在自动化程度低、更新速度慢的问题。针对这一现状,论文针对基于3D点云的高精地图的环境图层自动生成问题,采用基于深度学习的点云语义分
近年来伴随着C-V2X(Cellular Vehicle to Everything)等车联网技术的快速发展,自动驾驶和智能驾驶等智能交通业务需求不断增加,催生了一系列延迟敏感型、计算密集型的车联网智能应用。云计算架构因为日渐拥塞的回程链路和距离用户过远导致的服务响应延迟而难以满足智能交通要求的高可靠低时延。移动边缘计算(Mobile Edge Computing,MEC)应运而生为新的技术应用范
随着信息技术迅速发展以及网络服务的普及,数据规模实现井喷式发展,社会逐步进入了信息化的大数据时代。作为解决信息过载的重要方法,推荐系统得到了迅速地发展,同时也在人类生产、生活的各个方面发挥着重要的作用。多行为推荐系统作为推荐系统的一个分支,虽然起步较晚,但是由于多行为数据的丰富性及应用场景的广泛性,近些年来多行为推荐系统也得到了社会各界人士的青睐。目前多行为推荐系统在如何合理利用行为之间多等级偏好
计算机断层成像(Computed Tomography,CT)因为具有无损、高分辨、没有重叠影像等诸多优点,被广泛应用于安检、医疗和工业等领域。通常,传统CT系统需要完全角度投影数据来进行图像重建。然而,由于实际条件的限制,有时无法获得完全角度投影数据,由此引出了有限角度投影数据CT图像重建问题。理论上,有限角图像重建问题是一个不适定的问题,且这种不适定性会随着缺失角度的增加而变得更加严重。因此,
随着科学技术的快速发展,海量数据充斥着人们的生活,信息过载问题日益严重。推荐系统逐渐成为人们获取个性化信息的有力工具,帮助人们在海量信息中获取有用信息,并且已经成功应用到各行各业。基于协同过滤的推荐方法通过利用用户和项目的行为数据来学习用户和项目的特征表示,逐渐成为主流的推荐方法。但是现实世界中用户-项目评分矩阵具有高度稀疏而且分布不均匀的特点,当推荐系统仅考虑用户和项目之间的评分矩阵信息时,其性
随着云计算、大数据、物联网等技术的飞速发展,互联网应用的种类层出不穷,引发了数据规模的爆炸式增长,也带来了严重的信息过载问题。作为解决“信息过载”的重要手段之一,推荐系统已经得到广泛应用。但是传统的推荐系统存在冷启动、用户-项目评分矩阵的极度稀疏性等问题。除了推荐系统的评分信息外,用户对项目的评论信息也包含了丰富的用户兴趣和项目特征信息,有助于更准确地学习用户和项目表示。近年来,将评论融入推荐模型
按照课程标准的要求,就核心内容来说,统编《道德与法治》九年级教材主要涉及国情部分。因为这一部分与初中学生的实际生活有一定距离,且涉及较多比较抽象的概念和政策,有不少教师在教学时往往觉得无从下手。有的教师则以保证科学性为由,采取照本宣科的教学方式,将本应生动活泼的道德与法治课变成了学生非常排斥的"训教与口号"课。如
在城市轨道交通飞速发展的今天,要保证列车安全运行,关键不仅在于对轨道交通系统中基础设施病害的及时检修,相关核心工作人员如列车司机的专业性和机动性也尤为重要。司机能否在列车到站、出发、关门等重要节点做出正确手势是衡量司机工作态度和质量的重要标准。不正确的手势判断将直接威胁列车运行安全,因此对司机手势动作的监控识别十分重要。然而目前该工作主要依赖人工完成,不仅效率低下,而且造成人力资源浪费。因此需基于
随着深度学习技术的发展,目标检测技术的检测精度和速度不断被刷新。目前目标检测技术已被应用于生活的各个场景中,如:智能监控、智慧交通和无人驾驶等。然而目标的时空尺度变化仍然是检测中的难点,因此本文从多尺度特征的角度对这些问题展开了研究,利用空间多尺度特征研究了小目标难以检测的问题,在此基础上又研究了检测算法轻量化的问题,最后利用时间多尺度特征对视频目标检测中帧间信息的有效利用进行了研究。本文的具体研
疲劳识别技术可应用于疲劳驾驶预警、空中交通管制员疲劳监测、重型器械操作员疲劳提醒等领域,以规避疲劳作业潜在的巨大安全隐患。针对现有疲劳识别方法欠缺考虑疲劳个体差异性及依赖于实验室数据的不足,本文研究了真实场景下基于自适应阈值眨眼检测及Xgboost的疲劳状态识别问题。有效的特征提取技术是实现可靠、有效的疲劳状态识别的前提。作为提取眼部疲劳特征的关键技术,现有眨眼检测方法存在较少考虑眨眼个体差异性导