基于视频词组的图像高维索引结构的研究与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:gongyang12
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的迅速发展和普及,尤其是社交网站和图像共享网站的不断推广和应用,网络上的图像数量呈现快速增长趋势。如何快速、准确地从海量的图像数据中检索到用户所需要的信息,成为了一个亟待解决的重要问题。传统基于文本的图像检索方法直接利用网页中的文本信息,这些文本信息未必直接描述图像内容本身,因此准确性不高。基于内容的图像检索(Content-based image retrieval)可以有效地克服以上不足,逐渐受到学术界和工业界的重视。基于内容的图像检索首先采用一个高维的特征向量对图像进行描述,然后通过特征向量计算图像之间的相似度,按照相似度的大小返回检索结果。早期的研究更多地关注图像特征的描述能力和图像检索的准确性。随着图像数据规模的日益庞大,检索速度已成为图像检索的一大瓶颈。如何设计一个快速有效的索引结构,成为大规模图像检索的迫切需求。  一个好的索引结构应该具有两方面的特点:第一,要保证检索的准确性,能够满足用户的检索需求;第二,要保证检索的速度,能够支持大规模图像数据量的快速检索。目前常见的方法包括基于关键点特征的倒排索引,以及树形结构的索引等。其中,前一类方法能够保证较好的准确性,但这需要对图片中的每一个关键点建立索引,由于一张图像可能包含上千个关键点,因此效率较低;后一类方法的空间复杂度或者查询的时间复杂度是维数的指数次方,对于维数比较高的情况,检索的时间复杂度相对于和图片库中每一张图片都进行比较的线性复杂度几乎没有提高。近年来,一些研究工作开始通过LSH(Locality Sensitive Hashing)对图像的词袋(BoW:Bag of Words)特征建立索引。然而,这种方法需要将同一个词袋特征存放到多个哈希表中,一方面导致数据冗余,无法支持大规模数据量的检索,另一方面多个哈希表导致了检索效率的降低。而这两个问题正是索引结构走向实际应用面对的难点问题。  本文针对以上问题,提出了一种基于随机映射和高维视觉词组特征表示的图像索引结构:一方面,利用视觉词组把空间信息融入到图像的BoW特征表示中,生成一个高维的视觉特征,和传统方法相比,该特征表示更具区分性,能够更为有效地保证图像检索的准确性;另一方面,采用随机映射的方式,将图像特征映射到海明(Hamming)空间,得到一个更为简洁的二进制表示,满足在原始度量空间相近的图像在Hamming空间也较为相近,由于Hamming距离计算的高效性,本文方法能够比较大地提高检索速度。和现有基于LSH的方法相比,本文方法不需要存储多个哈希表,可以有效降低数据的存储开销,效率更高,能够支持大规模数据量的检索。
其他文献
随着图像采集设备的快速发展,通过互联网共享的图像日益增多,图像数据动辄以TB计。需要有效地管理在线和离线的图像资料库。所以区分不同类别的图像是一项重要的工作。在计算
随着计算机三维可视化技术的发展,计算机辅助的三维颅面复原技术成为研究热点。颅面复原是对未知的人类颅骨进行面貌复原的技术,该技术主要用三维可视化技术对三维数据进行数
高分辨率的海量地形数据能够反映地形表面网格的细节特征,在军事环境模拟和地质灾害(如地震、泥石流)等研究领域有着重要的分析和监测应用。因为海量地形对应于地形表面均匀
距离变换是计算图像中每个点到最近的特征点的距离,将原本无意义的孤立的特征点表示为特征点与背景点的距离关系。距离变换对图像作出了更为丰富的表达,后续方法可以根据需要
随着普适计算的发展,上下文感知作为普适计算的核心部分,越来越得到大家的关注。上下文感知研究的是如何获取上下文、上下文的表示、以及上下文的推理等,其目的是为了利用上
数字图像处理系统在大图像处理性能与数据展示效果方面具有一定的缺陷,综合考虑系统本身的GIS背景以及GIS技术面向海量数据的特性,本文拟通过引入GIS技术来弥补这些缺陷。经
随着手写文字识别技术的快速发展,阿拉伯语文字分类已日益引起研究者的关注。有两种阿拉伯语文字识别系统:联机和脱机文字识别。对于联机文字识别系统,需要使用特殊的数字化
随着Web2.0的兴起,软件开发正在转变传统的服务观念,个性化业务大量涌现。然而移动性差、硬件成本高、资源扩展性差等问题制约了第三方业务开发的发展。而云计算恰恰在实现服
随着Internet的流行和发展,人们对于Internet的依赖也越来越强,对Web应用也有了更多的需求。传统Web应用的客户端主要是用来渲染服务端返回的HTML页面,功能单一,难以满足用户的交
互联网的蓬勃发展使距离不再成为人们认识彼此、交流信息的障碍,基于地域、爱好和理想等多种元素交汇的网络社区逐渐成为人们更加方便地获取信息的手段。虚拟的网络社区延续并