【摘 要】
:
行人检索的目的是在行人视频或图像中筛选出带有特定属性的行人。由于深度学习的迅猛发展,行人检索算法在过去的十年间取得了重大突破。基于深度学习的行人检索算法在刑侦破案、智能监控等领域中得到了广泛的应用。本文立足于深度学习在行人检索算法中的研究,主要工作如下:(1)提出了一种基于异构模型的Mutual Mean Teaching算法用于无监督行人重识别。针对Mutual Mean Teaching算法的
论文部分内容阅读
行人检索的目的是在行人视频或图像中筛选出带有特定属性的行人。由于深度学习的迅猛发展,行人检索算法在过去的十年间取得了重大突破。基于深度学习的行人检索算法在刑侦破案、智能监控等领域中得到了广泛的应用。本文立足于深度学习在行人检索算法中的研究,主要工作如下:(1)提出了一种基于异构模型的Mutual Mean Teaching算法用于无监督行人重识别。针对Mutual Mean Teaching算法的同构模型限制这一问题进行了有效的拓展,引入了新的特征融合机制,提升了原有算法的性能,并使得该算法能推广到异构模型的情形。实验表明:新的特征融合机制在同构模型的训练中取得了性能上的提升,而异构模型的性能表现则受限于较弱模型。(2)提出了一种基于元学习的行人属性识别概率集成算法。该算法利用多个基本分类器,通过元学习器的不断迭代更新得到合适的权重参数,从而将多个基本分类器的预测结果加以合理利用,达到提升性能的目的。实验表明:所提出的集成算法在性能上取得了较大的提升,超越了目前行人属性识别领域一些经典算法。(3)研究了不同集成算法对行人属性识别模型的影响。针对行人属性识别任务,选用了三种集成算法:等概集成、非等概集成、特征集成,并通过大量行人属性识别实验验证不同集成算法的效果,得出以下结论:非等概集成的性能表现随着弱学习器的增多而提升,且综合性能表现优于其他两种集成方式。
其他文献
小开放阅读框(small Open Reading Frame,sORF)是长度小于100个氨基酸的DNA序列,是目前蛋白质科学的研究重点。由于sORF序列长度短,表达水平低,研究人员往往在基因组注释中忽略了sORF。随着测序技术的快速发展,人们发现越来越多的sORF也能够编码蛋白质,且普遍存在于基因组的各个区域,蛋白质编码sORF逐渐成为生物学领域的一个研究热点,也为基因组注释提出了挑战。在此背
随着智慧城市与平安城市建设的持续推进,城市级公安视频专网中联网摄像头的数量规模通常会接近或超过百万,智慧监控的要求已经从传统的“看得见、看得清”向具有人工智能特征的“看得懂”的监控层次进行转变。针对当前城市级公安视频专网如此巨大规模的摄像头和公安实战要求,仅依靠人工对视频专网系统中每个摄像头的质量进行检测评估已变得不太现实,开展城市级规模摄像头的科学视频质量管理已经成为智慧安防的研究热点之一。本文
量子随机行走是经典随机行走的量子推广,也是元胞自动机的量子版本。经典的随机行走可用于设计复杂问题的经典算法。量子行走指数加速增加了空间搜索和图连通性等算法的运算能力。量子行走在数学、物理、生物学、医学、计算机科学和工程等领域得到了广泛应用。在过去的十年里,量子行走已经成为了一个通用的计算模型。另一方面,量子行走可以模拟安德森局域化、拓扑相等诸多物理系统的动力学行为,为新奇物理现象的模拟提供了广阔的
随着通信与信息技术的发展以及人们对于体验要求的提升,以音频、视频和触觉信号集成为特征的新兴多模态服务将成为5G和后5G时代的杀手级应用。为了支持多模态服务,跨模态通信应运而生。然而,将跨模态通信应用于触觉为主的多模态服务时,仍然面临一些技术挑战。一方面,触觉信号对干扰非常敏感,在传输过程中容易损坏甚至丢失。另一方面,当真实的触觉信息难以收集时,需要生成虚拟触觉信号。为了克服这一困境,本文提出了一种
量子度量学也被称作量子参数估计,是最有应用前景的量子技术之一。该研究领域旨在利用量子资源对未知参数进行估计,从而实现相较于采用传统方法更高精度的测量。目前,量子度量学已经被广泛用于原子钟、陀螺仪、重力仪以及引力波检测等。量子力学原理限制了参数估计的精度。线性相位估计中,利用非关联或者经典关联的光源作为探测态,由于光子涨落特性,相位精度极限为标准量子极限。当利用非经典的探测态时,比如压缩源和纠缠源,
量子对话是基于双向传输信息的思想,即通信双方可以互相发送信息。但最初的量子对话协议存在信息泄露的安全漏洞。并且,与其它量子通信方式类似,在实际实验设备中,量子对话也可能会受到非理想实验设备的攻击。为了抵御所有可能对测量设备的窃听攻击,研究人员引入了测量设备无关的量子对话(MDI-QD)方案。但是在现有的方案中,通信的效率相对较低。除此之外,通信双方之间的参考系对齐是量子通信中的必要条件。但在实际环
石墨烯是一种具有光谱吸收范围宽、载流子迁移率高和响应速度快等优异性能的新型零带隙半金属二维材料,在电子信息、材料、微纳加工、能源、生物医学等领域具有重要的应用前景,被认为是未来革命性的材料。然而,石墨烯零带隙能带结构,使其光吸收能力相对较弱(在较宽波长范围内吸收率仅为2.3%),并且还存在增益机制小以及载流子复合速率较快等不足,从而限制了纯石墨烯在光电探测器方面的应用。而半导体量子点材料因具有吸收
古斯汉森位移(Goos-H(?)nchen shift,GH位移)是指反射光束相对于入射光的横向位移,它在传感、探测和信息传输等领域中有着广泛的应用。作为一种二维材料,单层石墨烯因其独特的能带结构而具有优异的光电特性,它的高度可调的光学性质为增强和调谐GH位移提供了优良的条件,使GH位移在光学应用领域具备更大的潜力。本文利用严格耦合波分析法、传输矩阵法以及静态相位法,研究了几种含单层石墨烯的复合结
光学Tamm态(Optical Tamm states,OTS)是由固体物理中的Tamm态类比而来的,广泛存在于一维光子晶体异质结和金属-光子晶体结构中。通过在金属-介质-金属(Metal-Dielectric-Metal,MDM)波导中引入金属-光子晶体和金属-布拉格光栅结构,也能够实现OTS以及类光学Tamm态的激发。基于MDM波导结构中的OTS或类光学Tamm态,完成了如下微纳光子器件的设计
人脸表情识别技术通过识别输出给定静态图像或动态视频序列中的表情分类来确定人的心理状态,从而实现计算机对人类表情的识别理解,这从根本上改变人与计算机的关系,使得计算机能够为人类提供更高级的服务。传统方法中使用的手工设计提取的特征通常缺乏对光照、姿态等因素的泛化建模能力,可能在一些实验室小数据集上的效果不错,但现实场景中的应用效果较差。而深度神经网络具有非凡的特征提取能力和高维度数据处理能力,因此目前