论文部分内容阅读
近年来,计算机视觉中的行人再识别问题受到了研究者的重点关注,已成为一个新兴的研究领域。目前,行人再识别技术存在许多挑战,特别是重排序或后排序优化问题。行人再识别问题的目标是当其出现在其它相机中时,对其进行再识别。这类视觉系统主要用于人流密集场所的监控,如机场、银行和购物中心等。受遮挡、光照变化、相机视角、相机/目标运动、背景变化等的复杂因素影响,对行人进行准确、鲁棒的再识别存在巨大的挑战。行人再识别的研究主要集中在两个方面:1)产生鲁棒的特征表示或特征描述子;2)建立高效的信息相似性度量机制。大多数方法基于提取的差异特征计算查询图像和图像库之间的相似度,然后再进行排序。此类相似性无法表示图像之间复杂和高层的关系,因此会导致次优的匹配结果,尤其是在秩1排序中,该类方法性能较差。现有的再识别方法在某些特定场景中表现良好,但在秩1排序中的性能仍有待提高。同时,由于需要人为调整,该类视觉系统易用性较差。对此,本文提出排序优化和优先排序方法进行行人再识别。本文提出了两种解决方法:第一种是基于图像预排序分类的行人再识别方法,第二种是基于后排序优先级的行人再识别方法,是本文研究的重点。此外,本文还给出了后排序优化方法的设计和评估细节。本文的主要工作和贡献如下:1)针对行人再识别中大型图像数据库图像查询时间代价大的问题,本文提出基于色彩类别进行预排序分类,创建了六种色彩类别。为产生签名,本研究使用了显著稠密颜色特征,并基于SIFT特征和凸包检测实现目标提取,将行人图像分割为三个水平条以提取特征,然后基于增量线性判别分析进行训练,同时采用最大相关和最小冗余技术减小计算量。2)针对后排序优化问题,本研究提出两种改善基线法结果的方法,分别为基于超图的后排序优化和基于多特征融合的重排序算法。基于图的方法已被证实可有效应用于计算机视觉领域,特别是图像检索和识别问题。但此类方法无法表达样本之间的高层关系,因此本研究采用比基于图的方法更有效的超图方法,并提出了一个基于超图的学习策略,不仅提高了秩1排序的准确性,还对图像之间复杂和高层关系进行建模。该方法首先通过基线法获得初始排序列表,然后应用一种新的优化方法对排序结果进行分类。该算法计算每个图像在列表中的位置并自动查找相关信息。为发现样本之间的关系,本文使用超图进行重排序学习,使用软分配技术学习超图权重。该方法的优点为:1)降低对人工的依赖,提高了视觉系统的自动化性能;2)减少了初始排序列表,因此降低了最终的计算代价;3)对噪声具有较高的鲁棒性而且估计结果具有较高的相关性。3)针对基于单个特征行人再识别系统判别能力不足的问题,本研究提出了一种基于多特征融合的重排序框架。目前,大部分传统方法一般利用独立模式提取长特征向量对图像进行描述。本文提出从样本中提取多种特征,生成混合向量并以此构造联合特征向量,利用曼哈顿距离度量图像对之间的相似性。基于联合特征向量和距离度量方式,本文提出基于树的重排序算法。因此,通过结合不同类型特征的优势,得到了更好的重排序结果。此外,该方法的另一优点是可以对内存进行有效管理。4)本文算法降低了计算代价,能有效表达样本之间的高层关系,将多特征融合集成到重排序过程,实现了更好的重排序性能,提高了行人再识别和重排序的结果。在更有挑战性的VIPeR,CUHK,GRID和ETHZ等公开数据集上进行扩展实验,使用累积匹配特征CMC曲线评估算法性能,结果表明本文提出的重排序方法优于现有算法,而且本文提出的排序优化和优先排序方法可以与基线法相结合以获得较为鲁棒和准确的重排序结果。5)行人再识别后排序问题是目前的研究热点,因此本文介绍了后排序优化(POP)方法的设计和性能评估细节,详细分析了各种后排序算法,基线方法选择机制和基准数据集的选择。此外,本文讨论了设计和评估POP方法的未来研究方向。