基于卷积神经网络的行人重识别算法研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:j19871010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人重识别(Person Re-identification)主要关注跨视域的人物身份识别问题,在安防、智能机器人和新零售等领域具有广泛的应用前景。行人外观变化、图像分辨率和场景环境等因素使该任务极具挑战,而基于传统人工设计特征的行人重识别方法已经难以满足应用需求,本文结合卷积神经网络提取特征的优势,从全局特征表达、局部特征表达和场景行人搜索角度对行人重识别问题开展研究,有效地提升了行人特征表达的判别性,具有积极的科学意义。为了提取更鲁棒的行人全局特征并充分利用样本的监督信息,本文提出了一种改进的三元组网络模型和递进式的两阶段训练策略。首先,应用改进的Softmax损失函数指导卷积神经网络学习基于球面约束的特征嵌入空间,其能够提升类间样本的区分能力;然后,为了更好地区分异类间较相似的样本和同类间差异较大的样本,结合基于余弦距离度量和批量硬样本采样策略的三元组损失函数对模型的参数进行精调,进一步提升行人特征的判别性。本文所提出方法充分考虑了多分类损失函数和距离度量损失函数的优势,通过设计的递进式训练策略实现了较好的模型训练效果。在Market-1501和DukeMTMC-reID数据集的实验结果表明,本文所提出的算法能够有效提升行人重识别性能。考虑到监控场景的复杂性,对所捕获图像仅仅进行全局性的行人特征表达,难以使模型有效应对部分遮挡及复杂的姿态变化。从全局特征和局部特征联合表达的角度出发,本文设计了一种多分支卷积神经网络(Multi-branch Convolution Neural Network,MB-CNN),基于局部区域卷积的基本模型(Part-based Convolutional Baseline,PCB)进行扩展,引入了新的全局特征提取分支,并基于精调的局部区域采样(Refined Part Pooling,RPP)的诱导学习策略改善硬分割中各条纹区域内局部特征信息的不一致性(Within-part Inconsistency)。同时,通过引入三元组约束的距离度量学习方法,使多分支卷积神经网络重新学习更具判别性的特征嵌入层,从而改善多分类在行人重识别问题中的性能退化问题。实验结果验证了本文所提出方法的有效性,MB-CNN模型在Market-1501数据集上实现了 82.3%的mAP识别率。行人搜索问题是将行人检测算法和行人重识别算法结合到一个深度学习模型中,从而在场景图像中实现行人匹配和身份识别。针对大规模分类的少样本学习问题和联合训练中不同任务之间的特征粒度问题,本文提出了改进的行人搜索网络模型(Improved Person Search,IPS),该模型通过引入新的行人重识别分支,降低了模型过拟合风险,并提升了行人重识别分支的细粒度特征表达能力。为了更好地权衡行人检测和行人重识别任务之间的特征学习粒度问题,本文引入了平衡因子,能够将OIM损失函数与原有的Faster-RCNN损失函数进行更有效的加权,从而帮助模型在多任务联合训练中取得更好的表现。最后,本文设计了一种预训练策略,通过为行人搜索网络的行人重识别分支提供初始化的权重参数,有效地提升了模型的收敛速度和泛化性能。在相关数据集上的实验结果表明,与行人搜索基础模型相比,本文提出的IPS模型实现了约3%的Rank-1排序匹配性能提升。
其他文献
现代高炉是目前热利用率和生产效率最高的炼铁设备,在未来相当长时间内仍有很强的生命力。由于炼铁成本和能耗约占钢铁企业的70%,且高炉大、中修费用昂贵。因此,在服役期内高炉实现安全、长寿、高效是世界炼铁工作者的重要课题和钢铁企业追求的目标。本文以酒钢高炉多年的生产实践和经验、数据为基础,从高炉设计、筑炉、操作、护炉技术等方面进行了全面分析,并通过2013年1、2号高炉大修改造的应用和实践,总结提出了酒
随着新零售发展,越来越多的品牌商和平台商开始布局线下门店和其线上渠道,意在打通线上与线下渠道销售的界限,吸引了国内外学术界的目光。新零售背景下供应链服务质量控制是新零售下供应链运营管理中一项重要内容,线下门店和线上渠道的双边服务质量对市场需求有着重要影响,同时服务质量控制引起的质量控制成本严重制约着供应链整体效益的提高。如何结合新零售下供应链实际的运营管理特点对供应链服务质量控制问题进行全面科学的
21世纪是一个国际化的知识经济时代,决定了我国高等学校英语专业人才的培养目标和规格:这些人才应具有扎实的基本功、宽广的知识面、一定的相关专业知识、较强的能力和较高的素质。也就是要在打好扎实的英语语言基本功和牢固掌握英语专业知识的前提下,拓宽人文学科知识和科技知识,掌握与毕业后所从事的工作有关的专业基础知识,注重培养获取知识的能力、独立思考的能力的创新的能力,提高思想道德素质、文化素质和心理素质。自
随着消费者对产品情感体验的重视,“情感化设计”成为研究热点,其实施的关键在于准确获得用户对已有产品的感性评价数据,从而改进产品设计。传统的产品感性评价数据获得方法,主要通过问卷调查,结合语义差异法感知用户产品意象,包括意象词的筛选,数据的统计分析处理等,这一过程的每一步都是十分繁琐、耗时的,并且得到的是一个平均的数据,并未考虑用户个人的情感偏好。本文借鉴感性工学和模糊数学相关理论,提出了 一种基于
出口厚度精度是衡量冷连轧带钢产品最重要的质量指标之一,因此提高带钢出口厚度预测精度是很多学者关注的热点,目前神经网络已经运用到这个领域,本文试图进一步使用深度学习的方法来提高带钢出口厚度的预测精度.1.首先介绍了BP神经网络,DNN模型和RNN模型在网络结构,训练方式等方面的区别,其次对轧钢数据进行归一化,将所有变量映射到[0,1]区间.最后使用python语言编程实现三个模型,比较三种模型的实验
随着互联网金融的快速发展,P2P网络借贷作为互联网金融的一部分,凭借其便利性和高效性得到越来越多的用户关注。而在网贷业务快速扩张的同时也暴露出一系列问题,尤其是借款人违约率高带来的坏账问题,这将直接造成平台与出借人资金损失。本文基于P2P网络借贷平台存在的风险和导致借款人违约性因素,运用实际借款人交易数据进行违约预测模型构建,通过降低借款人违约风险,增强平台对违约用户的识别能力,进而控制高坏账率,
增材制造作为新兴的制造技术,应用领域不断扩展,成为先进制造领域发展最快的技术方向之一;增材制造产业的发展为现代制造业的培育壮大以及传统制造业的转型升级提供了宝贵契机。本文在分析全球增材制造技术发展态势与产业发展动态的基础上,全面梳理了我国增材制造技术与产业的发展态势,剖析了我国增材制造产业面临的共性技术研究及基础器件能力不足、面向国际市场的专利布局滞后、产业规模与产业集群建设有待深化等问题。着眼增
作为现代语言学的一门新兴学科,批评性话语分析是一门关注社会问题的跨学科性研究。于20世纪80年代在英国兴起,多用于研究官方话语和个人话语。其中,最常见的是对新闻媒体的话语进行分析,以揭示新闻媒体如何通过话语来对新闻受众产生影响,探索话语、意识形态和权力间的关系。目前,国内对新闻报道的研究已涵盖了社会、经济、政治和军事等各个领域。其中,对大国关系的研究多侧重于揭示中美关系,或西方国家同中国的关系,而
消费者的价值已经得到了企业界的广泛关注,其在价值共创中的重要性也得到了实业界和学术界的认同。在“互联网+”的背景下,虚拟品牌社区作为消费者和企业链接的一个重要方式,成为了顾企价值共创的基础平台。目前企业对于虚拟品牌社区的应用已有初步的成效,但仍有很多企业并没有真正意识到虚拟品牌社区的作用,将其作为形同虚设的平台,当然还有一些企业很想利用虚拟品牌社区抓住机遇,但还不太清楚如何发挥其价值。本文通过研究
药品,是一种特殊商品。对于药品的定义,可参考《中华人民共和国药品管理法》第102条本法下列用语的含义是:药品,是指用于预防、治疗、诊断人的疾病,有目的地调节人的生理机能并规定有适应症或者功能主治、用法和用量的物质,包括中药材、中药饮片、中成药、化学原料药及其制剂、抗生素、生化药品、放射性药品、血清、疫苗、血液制品和诊断药品等。由于药品与每个人的生活十分密切,因此人们尤其注重药品的质量。这就需要药品