基于机器视觉的行人再识别算法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:lilei1984lilei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人再识别是近几年计算机视觉领域比较火热的研究课题,深度学习行人再识别的研究也有了很大的进展。然而由于行人不对齐以及行人的外观变化等因素会影响行人特征的提取进而影响再识别的效果,为该领域带来了巨大挑战。提取行人局部特征是目前常用的一种解决办法,即将行人按照一定的分割方法分为若干个局部区域,训练或测试时分别对各个区域进行特征提取最后将各个区域的特征连接起来作为最终行人特征。另外一种方法是在得到初始排序序列之后,在初始序列基础上进行一定的操作,将排名靠后的正确行人拉回序列的前端进而提升识别的精度,该方法被称为行人重排序。本文将局部特征提取以及行人重排序作为两个研究点提出创新性的解决方法,具体如下:(1)提出基于局部预测对齐(Part Prediction Alignment,PPA)的行人再识别模型用于提取具有较强辨别力的行人局部特征。对于一张行人图像来说,无论分割的局部区域个数为多少,其各个区域的ID预测分布应该是一致的。因此本文将研究点落在ID预测分布对齐上,使整张图像的ID预测分布接近于真实的分布进而促进网络提取更具辨别力的行人特征用于再识别;采用教师-学生网络提取行人的全局-局部特征。全局特征及局部特征有其各自的优势,局部特征包含行人的空间结构信息而忽略了行人的整体表象,全局特征与之相反。若能够将两者的优势相结合便能获取更具辨别力的行人特征。因此,采用教师-学生网络训练方法,将全局网络作为教师网络指导局部特征网络的学习使得所提取的特征既包含有全局信息又包含有局部信息。(2)提出基于扩展K近邻的重排序算法。常用的重排序方法是将初始排序中的一级近邻图像用于距离的重新计算,既然一级近邻中包含有原始图像的信息,那么相应的二级近邻中也一定包含原始行人的特征信息。因此,设计基于扩展近邻的重排序距离(Expanded Neighborhoods Distance,END),将初始排序序列中的二级近邻图像与一级近邻图像一同用于重排序过程,并遵循就近相似性原则剔除可能带来错误信息的行人。最后将所提出的END距离与杰卡德距离进行加权求和获得最终的距离用于重排序。所提出的PPA模型能够提取具有较强辨别力的行人局部特征并达到较好的识别效果。其中在DukeMTMC-ReID数据集上,平均查询精度mAP有7.2%的提升,Rank1有4.3%的提升。在Market1501数据集上的Rank1精度达到了92.3%,并且PPA的过程不需要姿态估计器以及额外数据集的参与,在不增加网络复杂度的情况下达到识别效果的提升。采用教师-学生网络提取全局-局部特征用于再识别能够让识别效果在PPA的基础上有进一步的提升。据了解,扩展K近邻重排序方法能够应用在目前所有的行人再识别模型中对模型的初始排序结果进行优化达到效果的提升。
其他文献
远程会话作为一项车内非驾驶任务,在手动驾驶相关研究中主要作为驾驶员分心和驾驶安全相关议题的切入点。随着自主智能和车联网技术的发展,使有条件的自动驾驶成为可能。这也为驾驶员在自动驾驶下从事更多与驾驶无关的非驾驶任务创造了机会,即驾驶员可以脱离驾驶任务并从事远程会话任务,但由于在某些特殊情况下,自动驾驶仍需驾驶员接管驾驶。这样便存在非驾驶任务中断和恢复的情况,动态驾驶下的任务切换是随之产生的研究热点。
学位
随着机器人技术的快速发展,除了工业环境外,机器人越来越多地被应用于医院、学校和购物中心等注重社交互动的场景[1]。这类主要与人类进行交流和互动的机器人被称为社交机器人,社交机器人本质上是一种人工智能系统,它们遵循与其角色相关的社交行为和规则与人类互动。为了维持其智能属性,大多数社交机器人都配备了各式各样的信息传感器来收集用户和环境数据。社交机器人的信息收集能力毫无疑问会引起与之共处同一物理环境下的
学位
随着人工智能技术的发展和服务机器人的繁荣,教育机器人已经步入了新的发展阶段,不仅拥有充实的知识库和智能交互技术,还能表达丰富的情感,为学生提供了良好的学习体验和更自然的交流方式。本文通过文献分析论述了教育机器人的研究现状、基本内涵和研究趋势,并分析了机器人情感的概念、机器人表达情感的方式和影响机器人情感表达的因素,提出教育机器人情感表达的研究是未来的重要发展方向,具有重要的研究意义。设计师通过模仿
学位
求解时变方程与不等式的问题在实际的工程领域中时有出现。随着前人的研究,神经动力学系统在求解线性和非线性方程领域在飞速发展。神经网络被提出用于求解时变西尔维斯特方程。受到这个工作的启发,本文在此基础上提出了一类零化神经网络(Zeroing neural network,ZNN)来求解时变不等式问题,而且通过在基础模型上不断改进,从最开始的全局收敛到有限时间收敛、容噪收敛和预定义时间收敛等方面优化了模
学位
氨是一种清洁、绿色、新型的潜在能源,具有能量密度高、燃烧热值高以及存储成本低等优势。传统工业合成氨的方法Haber-Bosch工艺需要高温、高压的反应条件,消耗大量的能量和产生大量的CO2。而低温等离子体可减小此反应进程的活化能,起到降低反应条件的作用,使其在常温常压下进行。因此,低温等离子体技术具有较大的应用潜力在催化合成氨领域。目前对于填充式介质阻挡放电(Packed Bed Dielectr
学位
智能电能表作为我国智能电网建设中的终端设备,其性能是否可靠直接关系到电网计量的准确性。我国是一个多气候多环境的国家,不同地理位置经纬跨度大,由此造成了在不同环境下同种智能电能表的不同性能表现。针对典型环境应力下智能电能表故障率数据中样本信息量少、不易挖掘等问题,本文建立一种基于贝叶斯权重肖维纳K最近邻(Weight Chauvenet K-nearest-neighbor,WCK)层次威布尔艾林模
学位
当前,自闭症患病率在全球范围内持续增加,我国每68名孩子中约有一名自闭症患者。然而,自闭症的发病机制尚无定论,有关发病机制的研究主要集中于心理学、神经生物学以及生态学领域,其中生态学角度的自闭症观认为环境因素与自闭症之间存在着重要的联系。现阶段,我国有关自闭症人群的空间环境设计研究尚处于起步阶段,相关的空间环境设计研究主要集中于满足自闭症儿童的空间需求,研究的空间类型也局限于康复机构与康复花园。因
学位
三维人体姿态估计是指在给定图像或视频的情况下对人体关节点的三维位置进行估计,是计算机视觉中一个非常活跃的研究领域。研究成果在人机交互、智能监控、运动表现分析和虚拟现实等多个领域有着重要的应用价值。得益于大规模的数据集和复杂的深度学习网络架构,现有的三维人体姿态估计方法取得了不错的成果。但是,还远远未达到理想的效果,尤其是在现实场景中使用过程中会产生许多问题。所以,三维人体姿态估计仍然是一个未解决的
学位
随着社会的发展,环境污染和生态失衡等问题也日益显现,在如今倡导绿色化学的背景下,以更为绿色温和的条件实现化学转化成为了化学家们所关注的重点。氧气作为自然界中广泛存在的天然氧化剂,具有安全、绿色、经济等特点,并且空气中的氧能通过植物的光合作用不断地得到补充,这使得氧气成为了自然界不可多得的可再生资源。自氧化反应在近些年得到了广泛的关注,理论上氧气可以和活泼金属试剂、酚、硫酚、醛、重氮盐等多种能够发生
学位
爆炸性的恶意软件变体对网络安全构成了重大威胁,研究人员必须探索更高效的方法来识别大量恶意软件的恶意意图和攻击模式。恶意软件家族中很多变体都是基于代码重用技术和混淆技术生成的,新生成的变体仍具有与原始恶意软件相同的功能和特征。因此恶意软件家族分类有助于高效分析海量变体。基于传统机器学习的恶意软件分类方法要求分析人员具备领域知识,还会带来手工构建高阶特征的高代价以及主观因素对特征选择的影响等问题,具有
学位