基于哈希算法的大规模图像最近邻检索算法研究

来源 :电子科技大学 | 被引量 : 10次 | 上传用户:watta515
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的广泛普及和多媒体技术的迅速发展,各行各业积累的数据急剧增加,每天互联网上大量的多媒体数据需要被处理。在大数据时代,由于数据的爆发式增加,现代信息技术基础设施不得不处理如此庞大的数据库。事实上,与存储成本相比,在大型数据库中检索相关内容是一项更具挑战性的任务。特别是在搜索多媒体数据,例如音频,图像和视频的检索,在准确率和计算成本方面,可用的解决方案和实际需求之间存在着很大的差距。大规模图像检索技术通常对于存储空间和检索时间有着特殊的要求,近年来,哈希算法作为一种代表性的最近邻检索技术,已经成为了处理大规模图像检索问题的主流算法。哈希算法旨在将图像数据转换成哈希码,从而达到减少存储空间和缩短检索时间的目的。大量的研究也证明了哈希算法的有效性。本文将集中研究哈希算法现在的挑战,并且提出相应的解决方法。在已有的非监督哈希算法的研究中,在汉明码空间中保持原始空间数据的近邻关系(或者相似性)是很多论文通用的目标。然而,目前已有的哈希算法仅考虑原始空间的整体结构如样本对(又称二元组)邻接关系,却忽略了原始数据空间中存在的局部几何结构,而这种局部几何关系对于相似性检索至关重要。本文从保存原始空间中的样本对近似关系和局部线性结构的角度,提出了一种新的哈希算法框架,在这个框架中,通过稀疏编码的方式找到原始数据空间的局部线性结构;然后构造目标函数,实现在哈希空间中保存二元组的相似性关系,重构局部线性结构,最小化哈希码的量化误差的目的。在这种新型的哈希算法模型中,本文提出学习使用非对称哈希函数模型,从而能够更好的保存样本对相似性和原始空间的局部线性邻接关系,最后生成紧凑有效的哈希码。在标准数据集上的实验也证明了本文提出的算法在所有的对比试验中达到了最好的性能。基于深度学习的哈希算法可以同时进行特征学习和哈希函数学习,从而提升了图像检索性能。本文提出了一种新型的深度非对称哈希算法,用于监督哈希算法的学习。主要的思想是利用两个不同的深度卷积网络作为非线性哈希函数,共同联合训练,使网络对应输出的哈希码能够很好的诠释语义信息中包含的相似度关系。本文定义新的目标函数来保持图像之间成对的相似性信息。三个数据集上的实验也证明了本文提出的模型在大规模图像检索方面具有最先进的性能。
其他文献
TDK株式会社集团下属子公司TDK—EPC推出电感特性的积层陶瓷线圈MLG0603S系列。该产品为了提高电感特性,对线圈电极形状进行了设计,并通过提高TDK擅长的材料技术、加工技术,实现