【摘 要】
:
行人重识别是视频监控系统中的重要任务,旨在从跨区域的监控摄像头采集到的图像中检索出特定行人的所有图像或视频,实现目标行人重识别,并应用于安防建设、行人追踪和轨迹分析等相关任务中。由于巨大的研究和应用价值,行人重识别成为近年的研究热点。但摄像头分辨率和安装角度、行人行走姿势及光照差异等复杂因素,给行人重识别带来了挑战。本文基于深度特征嵌入对行人重识别进行研究,分别讨论了在可见光图像场景与在可见光和红
论文部分内容阅读
行人重识别是视频监控系统中的重要任务,旨在从跨区域的监控摄像头采集到的图像中检索出特定行人的所有图像或视频,实现目标行人重识别,并应用于安防建设、行人追踪和轨迹分析等相关任务中。由于巨大的研究和应用价值,行人重识别成为近年的研究热点。但摄像头分辨率和安装角度、行人行走姿势及光照差异等复杂因素,给行人重识别带来了挑战。本文基于深度特征嵌入对行人重识别进行研究,分别讨论了在可见光图像场景与在可见光和红外图像场景下的行人重识别方法。主要研究及贡献如下:(1)提出了一种基于多尺度特征融合的可见光-可见光行人重识别方法(Omni-Scale Feature Aggregation method,OSFA)。由于行人在行走过程中出现遮挡、姿态变化、角度等现象,采用卷积神经网络构建一个基于全尺度特征聚合的模型来学习判别性的行人特征。训练过程中,模型分别提取行人的判别性局部特征和全局特征用于目标行人的重识别。针对可见光-可见光行人重识别中存在的类内距离大于类间距离的情况,结合多个损失来缩小跨摄像头下同一行人的类内特征距离。在可见光行人重识别数据集上,本方法充分学习到行人的表征信息并表现出较好的重识别效果。(2)提出了一种基于分层共享特征网络的可见光-红外行人重识别方法(Hierarchical Cross-modal shared Feature Network,HCFN)。本方法使用卷积神经网络在可见光图像和红外图像数据集上进行训练,网络分为模态内特征提取模块和跨模态图交互模块两部分。在模态内特征提取模块中提出层次注意力结构,帮助网络学习可见光和红外图像的模态内判别性特征。跨模态图交互模块能够拉近不同模态中同一身份的行人图像,减少可见光和红外图像由于属性差异导致的模态鸿沟问题,监督网络学习身份相关但模态无关的行人表示。在可见光-红外行人重识别数据集上进行的大量实验表明了本方法的先进性和各组成部分的有效性。
其他文献
随着疫情在全球范围内爆发,线上对外汉语教学获得长足发展,对外汉字教学也越来越受到人们的重视。目前,海外华裔儿童是线上学习汉语的主力军之一,汉字一直是其学习汉语的难点,汉字偏误问题一直普遍存在。在笔者实习过程中,巴拿马华裔儿童的汉字偏误问题十分突出。因此,如何纠正华裔儿童汉字书写中的偏误、提高他们汉字书写水平和能力值得深入研究。笔者以巴拿马孔子学堂的华裔儿童为例,搜集学生近一年来的课堂练习和书面作业
“产出导向法”(POA)强调目的语产出在第二语言学习中的重要作用,采取以输出为驱动的教学起点,调动语言学习者的学习积极性,提升其课堂参与度。中文口语课堂的教学目标是培养学习者在真实、具体的中文口语交际情景或交际场景中运用中文进行倾听、理解和表达的能力。同时,作为主要的语言技能课之一,口语课要求学习者在课上多说多练,在反复练习中巩固所学中文知识,提高中文表达的流畅性与准确性。随着在线课堂教学在国际中
国家形象是一国实力水平和现实影响力的综合体现,在疫情大背景下对外汉语教学在对于帮助外国人了解真实中国形象上发挥着无可替代的作用,阅读是对外汉语学习中的重要技能之一,对外汉语教学新态势让阅读在汉语教学应用中日益受到关注。因此,分级阅读理念推广下汉语分级读物的地位也越来越显著,从具有代表性的汉语分级读物入手,以读物里的中国形象作为研究切入点,这对于分级读物的编写、教学里中国形象的呈现、对外汉语阅读教学
情绪与人们的认知、决策和生活状态息息相关,其产生涉及到大脑中不同脑区的信息交互。研究情绪的神经机制和情绪识别方法,一方面可以帮助计算机具有理解人类情绪的能力,使得当前的人机交互更加智能;另一方面,可以应用于抑郁症等精神类疾病的辅助诊断和治疗等。然而,基于脑电信号(EEG)的情绪识别是一项复杂的任务,难以通过单一维度的特征来获得较好的情绪识别效果,因此需要提取最能够表征情绪状态的特征并采用合适的融合
小细胞肺癌(Small cell lung cancer,SCLC)是一种常见的高风险的肿瘤疾病,其死亡率高、发病率高,严重危害患者的身体健康,约占肺癌总数的15%-20%。SCLC具有侵袭性较高,快速生长、早期转移、耐药性强等特点。临床诊断中,现有SCLC的定位及分割多依赖于医生通过计算机断层扫描技术(Computed tomography,CT)诊断,需要较高的人工成本。临床治疗发现,多数病人
随着无线电子技术与网络通讯技术的进步与发展,无线传感器网络通信技术已然成为当今世界一项必不可少的新兴技术,相关问题的研究受到越来越多研究者的关注。然而,在实际应用中,多数系统会出现未知扰动,同时受制于系统的传输能力和通信链路故障等因素,测量信息在传输过程中很容易丢失,从而造成估计器估计性能的下降。针对无线传感器网络中含丢包和未知输入的状态估计问题,本文提出了两种不同情况下的含未知输入与丢包现象的分
目的:本研究旨在探讨白介素17(IL-17)及白介素6(IL-6)与胆囊结石形成的作用及相关性。方法:回顾性的分析新疆维吾尔自治区人民医院2019年12月至2022年1月明确诊断为胆囊结石并进行胆囊切除术的234例患者和与之相匹配的363例对照组的病历资料,分析白介素17(IL-17)及白介素6(IL-6)与临床病理特征之间的关系。结果:比较两组临床资料,结果显示胆囊结石患者的WBC、NEU、D-
随着时代的发展和市场的需求,网络汉语教学的发展已成为语言教学中的一项重要内容,因此对口语教学中网络直播平台应用的研究显得非常重要。但在汉语中级口语教学中,网络直播平台的应用还处于探索阶段,尚未形成较为完善的教学模式。基于此,本文在总结前人成果的基础上,以钉钉网络直播平台为例,对汉语中级口语课中网络直播平台的应用情况进行了研究,主要研究内容如下:第一章为绪论。论文重点介绍了选题缘由与研究意义,选题的
在互联网时代的发展中,多智能体系统已经成为被广泛研究的课题。正系统是一种特殊的动力学系统,并在许多领域中得到了广泛的应用。输入-状态稳定性理论在现代非线性控制理论发展中具有重要的地位,特别是在非线性系统的稳定性理论中。在现实生活中,多智能体系统存在干扰的现象虽然是很普遍的,但缺乏针对出现干扰现象时的正多智能体系统的状态一致性研究,于是本文针对非线性正多智能体系统,深入研究了在状态反馈与脉冲控制下的
随着计算机视觉和互联网技术的不断发展,Logo检测技术在商业宣传、商标侵权检测和城市智能化交通等实际生活中的应用越来越广泛。在商业宣传领域,挖掘图片中的Logo信息进行品牌追踪,并通过分析用户对品牌的偏好进行个性化推荐,可以对品牌宣传起到巨大推动作用;在商标侵权检测领域,通过对Logo图像进行智能检索及识别,可以判定所申请的商标是否存在侵权情况,对产品Logo检测以判定产品是否为虚假产品,为知识产