大规模图像库的高维索引技术研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:L530798540
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高维数据的索引机制是大规模图像库的基于内容检索能够达到实时性要求的关键技术。面临“维度灾难”带来的影响,如何通过索引的表示、索引的组织和索引的提取提高高维图像数据的检索效率是高维索引研究的关键问题。本文主要针对索引的表示和索引的组织进行了研究,提出了一系列简单可行的索引方法。在综合研究现有高维索引技术的基础上,针对高维索引表示和组织的关键问题:索引剪枝过滤策略、高维向量近似表示和快速近似检索算法,详细讨论了目前已提出的索引方法的局限性,并设计了改进方法。高维主存索引作为高维索引的未来发展方向,引起了很多学者的关注。对高维主存索引结构的研究可以为基于磁盘的高维索引结构的研究提供新的思路,文中设计了一种新的高维主存索引结构。为了减少大规模图像数据库在检索过程中引入的误中点个数,本文在定义向量排序和活性维等概念的基础上,提出了一种新的索引快速剪枝过滤技术。该技术采用分段处理思想,实现非候选节点以序列方式和以点方式的两阶段剪枝过滤,从而快速排除所有的误中点,尽可能减少距离计算次数,实现大规模高维向量空间的快速范围查询。该技术适用于目前已提出的基于一维转换思想的高维索引结构中,如金字塔技术,可以提高这类索引机制的检索效率。对数据空间的有效划分是高维向量近似表示的前提,结合近似向量表示和一维转换两种索引构造思想,提出基于位码和距离的高维向量压缩表示形式,实现高维向量的二维表示形式。检索时采用两层过滤技术,可以显著减少检索需要访问的数据向量的个数。实验证明,这种两种索引机制相结合的方法取得了比单独的索引技术更好的性能。基于高维向量压缩表示的索引构造思想,提出一种简单有效的KNN检索算法。通过聚类将数据划分成多个子集空间,对每个聚类子集内的高维向量,利用距离和位码定义简化表示形式。KNN搜索时,在不需要计算向量距离的情况下,根据部分维的位码不相同信息的比较,即容易实现的字符串比较,将某些非候选节点迅速过滤,以此减少高维向量距离计算次数。该方法可以大大降低利用索引进行相似性检索的CPU代价,达到快速检索的目的。主存技术的不断进步,使得主存多媒体数据库的实现成为可能。研究表明,主存多媒体数据库系统性能深受处理器缓存未命中的影响,缓存感知型主存索引是提高数据检索效率的有效手段。针对SA-Tree不适用于主存存取的缺点,提出它的变体CSA-Tree。CSA-Tree利用PCA降维技术,将树的各层节点采用不同的维度表示,这样不仅提高缓存空间的利用率,还降低了CPU负载,从而提高了索引查询效率。
其他文献
有关专家指出.在一些学生的日常生活中存在着十大不良饮食习惯.给健康带来了负面影响.应引起家长和学生的重视。这十大不良饮食习惯是:
目的对尼可地尔用于微血管性心绞痛的治疗效果及安全性进行研究。方法经过对本院2017年4月至2018年4月收治的100例微血管性心绞痛患者临床资料展开回顾分析,随机分为两组各50
论述了高校体育课程应根据高校体育的功能与特点,以终身体育、健康体育及素质教育的主导思想为切入点,全方位、多层次地进行设置。
近五个小时的车程,窗外除了山还是山,我仿佛沿着一个巨大的螺旋向上爬行,离地越来越远,离天越来越近。天色已暗,淅沥沥的小雨开始飘落,窗外的景色也由绵延的青山、白族的民居转变为高山峡谷和藏式建筑,路边还不时出现用石头垒成、披挂着彩色经幡的佛塔。我忍住轻微的高原反应,一步步接近心中的香格里拉。  香格里拉在藏语中意为“心中的日月”,位于青藏高原东南边缘、三江并流之腹地,区内聚居着藏族、傈僳族、纳西族、白
期刊
<正> 小知识窄谱抗菌素指只对少数几种微生物起作用的抗菌素。广谱抗菌素指对革兰氏染色阳性和阴性的细菌都有效的一种抗菌素。半衰期在放射性衰变过程中,放射性元素的核数目
空间数据管理是地理信息科学的重要研究内容,也是空间信息系统相关厂商重点研发的部分。空间数据管理的高效与否,直接关乎空间信息系统的成败、关乎空间数据的有效利用、关乎
Internet的普及以及分布式计算、基于构件的开发和Web Services等技术的迅速发展和应用使Web应用渗透到国计民生的各个领域。Web应用的质量将直接影响人们的生活和工作。验证