论文部分内容阅读
基于大规模数据集的相似性搜索是计算机视觉和多媒体的一个重要分支,大数据背景下,在海量图片中进行相似性检索,对于内存空间的要求极高,并且,如何在大规模的图片中快速、精确查找所需要的信息,是亟待解决的问题。哈希技术能够以较短长度的二进制码表示图片,并且保留图片相似性,极大程度地减少计算量和存储空间,提升了搜索效率。因而,基于哈希的近似性搜索技术广泛应用于图片搜索领域。在多标记多示例图片搜索框架中,图片由多个示例表示,并赋予多个类别标记。因为示例和标记之间无直接的对应关系,而且图片特征空间不能直接反映标记的语义信息。针对多示例多标记图片搜索的难点,本文提出基于语义分割的图片哈希搜索算法,首先利用深度学习对图片进行基于语义分割的特征提取,然后,通过对目标函数的优化,得到最优化的距离度量,以保证示例和标记的语义一致性和标记之间的相关性。最后利用锚图哈希算法,生成示例的哈希码,以实现示例的快速近似搜索,提高图片搜索的准确度。在MSRC v2,PASCAL VOC2012数据库中,本文提出的算法和现有的多种图片哈希算法进行了图片检索性能对比,从而进一步验证了本文提出的算法在搜索精度和开销方面的优越性。