基于机器学习的排序优化及其在行人再识别中的应用研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:shaomingfang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,计算机视觉中的行人再识别问题受到了研究者的重点关注,已成为一个新兴的研究领域。目前,行人再识别技术存在许多挑战,特别是重排序或后排序优化问题。行人再识别问题的目标是当其出现在其它相机中时,对其进行再识别。这类视觉系统主要用于人流密集场所的监控,如机场、银行和购物中心等。受遮挡、光照变化、相机视角、相机/目标运动、背景变化等的复杂因素影响,对行人进行准确、鲁棒的再识别存在巨大的挑战。行人再识别的研究主要集中在两个方面:1)产生鲁棒的特征表示或特征描述子;2)建立高效的信息相似性度量机制。大多数方法基于提取的差异特征计算查询图像和图像库之间的相似度,然后再进行排序。此类相似性无法表示图像之间复杂和高层的关系,因此会导致次优的匹配结果,尤其是在秩1排序中,该类方法性能较差。现有的再识别方法在某些特定场景中表现良好,但在秩1排序中的性能仍有待提高。同时,由于需要人为调整,该类视觉系统易用性较差。对此,本文提出排序优化和优先排序方法进行行人再识别。本文提出了两种解决方法:第一种是基于图像预排序分类的行人再识别方法,第二种是基于后排序优先级的行人再识别方法,是本文研究的重点。此外,本文还给出了后排序优化方法的设计和评估细节。本文的主要工作和贡献如下:1)针对行人再识别中大型图像数据库图像查询时间代价大的问题,本文提出基于色彩类别进行预排序分类,创建了六种色彩类别。为产生签名,本研究使用了显著稠密颜色特征,并基于SIFT特征和凸包检测实现目标提取,将行人图像分割为三个水平条以提取特征,然后基于增量线性判别分析进行训练,同时采用最大相关和最小冗余技术减小计算量。2)针对后排序优化问题,本研究提出两种改善基线法结果的方法,分别为基于超图的后排序优化和基于多特征融合的重排序算法。基于图的方法已被证实可有效应用于计算机视觉领域,特别是图像检索和识别问题。但此类方法无法表达样本之间的高层关系,因此本研究采用比基于图的方法更有效的超图方法,并提出了一个基于超图的学习策略,不仅提高了秩1排序的准确性,还对图像之间复杂和高层关系进行建模。该方法首先通过基线法获得初始排序列表,然后应用一种新的优化方法对排序结果进行分类。该算法计算每个图像在列表中的位置并自动查找相关信息。为发现样本之间的关系,本文使用超图进行重排序学习,使用软分配技术学习超图权重。该方法的优点为:1)降低对人工的依赖,提高了视觉系统的自动化性能;2)减少了初始排序列表,因此降低了最终的计算代价;3)对噪声具有较高的鲁棒性而且估计结果具有较高的相关性。3)针对基于单个特征行人再识别系统判别能力不足的问题,本研究提出了一种基于多特征融合的重排序框架。目前,大部分传统方法一般利用独立模式提取长特征向量对图像进行描述。本文提出从样本中提取多种特征,生成混合向量并以此构造联合特征向量,利用曼哈顿距离度量图像对之间的相似性。基于联合特征向量和距离度量方式,本文提出基于树的重排序算法。因此,通过结合不同类型特征的优势,得到了更好的重排序结果。此外,该方法的另一优点是可以对内存进行有效管理。4)本文算法降低了计算代价,能有效表达样本之间的高层关系,将多特征融合集成到重排序过程,实现了更好的重排序性能,提高了行人再识别和重排序的结果。在更有挑战性的VIPeR,CUHK,GRID和ETHZ等公开数据集上进行扩展实验,使用累积匹配特征CMC曲线评估算法性能,结果表明本文提出的重排序方法优于现有算法,而且本文提出的排序优化和优先排序方法可以与基线法相结合以获得较为鲁棒和准确的重排序结果。5)行人再识别后排序问题是目前的研究热点,因此本文介绍了后排序优化(POP)方法的设计和性能评估细节,详细分析了各种后排序算法,基线方法选择机制和基准数据集的选择。此外,本文讨论了设计和评估POP方法的未来研究方向。
其他文献
随着当前技术的快速发展,测绘地理信息技术在地质勘查中得到了广泛的应用,应该基于地质勘查工作的特征和要求,对测绘地理信息技术的科学应用进行思考和分析,以展现其技术价值
现今,各院校均设置艺术专业课程,加上社会大环境需求,考生趋之若鹜。但一般院校生源基础相对国家级艺术院校而言薄弱,大部分学生本来无望升学,临时动意,急功近利找捷径,经考前几个月
低密度脂蛋白和血小板及其相互作用在动脉粥样硬化形成机制中起着重要作用。不少研究表明低密度脂蛋白升高可影响血小板的功能,但是关于低密度脂蛋白对血小板功能影响的信号
《论语》在汉代初期是传书,魏晋以降,玄学盛行,但《论语》的流传与注疏反而多了起来,并在南朝宋时被官方定位经。唐代一统天下,号称崇儒,但《论语》却再次沦为五经的附庸。直
压缩感知是一种全新的信号获取和处理框架,其理论和技术的发展将对数字信号的获取方式,分析技术和处理方法等研究领域及相关应用领域产生深远的影响。目前,压缩感知正从理论
信息可视化是将繁复的数据图形化的科学,主要是通过人的视觉来理解数据。因此如何更好地可视化来帮助视觉理解数据,是一个非常重要的问题。近年来,视觉感知(Visual Perceptio
在新时期电影众多流派中,以抚慰、疗愈民众心灵创伤为己任的日本治愈系电影产生着日益重要的影响,虽然距离明确的电影类型尚有差距,但从类型化角度而言,已经形成了较为成熟的
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
民间叙事的结构主义研究充满了张力与争议。通过聚焦于与结构主义密切相关的结构与形式、共时形态与历时意义研究的争论,简要梳理了结构主义理论及其对中国民间叙事研究的影