海量图像检索关键技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:dongge5266
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体技术、互联网技术的快速发展,以及各种海量数据存储技术的不断涌现,简单的文字信息交流已水能满足人们日常工作、学习和交流的需求。以图像为代表的多媒体信息载体,由于其直观、方便且信息量大,能够表示比文字更加丰富的信息,在人们的日常交流和信息传递中发挥着日益重要的作用。而图像检索技术能够帮助人们实现对自己感兴趣的图像进行搜索、定位、去重等操作,近年来成为工业界、学术界研究应用的热点之一。   经过众多优秀学者、研究人员的不懈努力,图像检索技术已经取得了一定程度的进展,尤其在小规模图像数据库上的某些应用,已基本能够取得满意的效果。然而,现有的多数图像检索系统在海量图像数据库上的应用,仍难以达到令人满意的效果。为了进一步提高图像检索在海量图像数据库上的应用效果,本文针对海量图像检索核心关键技术进行较为深入的研究,本文的主要工作及创新点如下:   海量图像检索中,单一的图像特征往往难以取得较高的检索精度,考虑到海量图像检索需要对海量图像快速入库的要求,本文提出了一种融合HSV颜色直方图和LBP纹理直方图的颜色纹理直方图的表示特征,该特征能够同时表达图像中的颜色和纹理特征信息,提高了特征表示的唯一性,并且其计算复杂度低,能够满足海量图像实时入库的应用要求。实验表明,该特征与GIST特征和MPEG-7标准中提出的相关特征相比,能够取得更高的检索精度。   海量图像检索系统中,定义一个合理的距离度量往往能够弥补图像特征的不足。本文提出在传统的分数距离函数(FractionalDistanceMetric,FDM)的基础上,改进提出了一种满足三角不等式的分数距离度量(TriangleInequaltiySatisfiedFractionalDistanceMetric,TIS-FDM)。由于传统的FDM不满足三角不等式,大大限制了其在海量图像检索系统中的应用,而TIS-FDM能够从理论上证明其满足距离度量的四个约束条件,可以利用其满足三角不等式的特性在海量图像检索时,快速过滤掉大量图像,提高检索响应速度。此外,在不同数据库、不同图像特征上进行的大量实验结果表明,TIS-FDM不仅能够较FDM取得更高的检索精度,其检索精度也显著高于L1距离、欧氏距离等十种距离度量;并且检索精度随图像数据库规模增加下降不明显,更加适合海量图像检索的应用要求。   海量图像检索中,顺序检索难以满足实时性要求,本文对比分析现有的海量图像数据库索引技术,提出了一种基于k-means聚类与球面哈希的两层层次索引结构。该索引结构大大减少了图像检索时的搜索空间,并大幅降低了图像特征向量相似度的计算复杂度。对比现有的三种优秀索引技术kd-tree、LSH和谱哈希,实验结果表明,本文提出的两层层次索引结构不仅能够获得最高的检索精度,并且其检索响应时间最小,在百万规模的数据库上,平均响应时间在10毫秒左右。此外,该两层层次索引结构的检索精度甚至高于采用欧氏距离直接顺序搜索的检索精度。   参与设计并实现了数字媒体管理服务平台。该平台主要用于实现对海量多媒体资源的集中管理和检索,其核心功能包括:数字媒体资源的入库、网络集群服务器并行处理与分布式通信、多人在线协同标注、检索以及浏览。本文的主要工作应用于该平台的基于内容的图像检索引擎的设计与开发。
其他文献
随着自然环境的改变,越来越多的流行病不断出现并威胁着人类的生命健康。因此我们有必要对流行病的致病因子进行研究并对未来发病趋势进行预测。流行病预测需要大量的发病病例
随着半导体工艺的发展,现代高性能通用微处理器设计地越来越复杂,微处理器内的晶体管数目越来越多,体系结构的研究空间也越来越大,模拟器在微处理器设计中所起的作用越来越重要。
采用传统的数学方法求解试题库智能组卷问题是非常困难的,随着计算机辅助设计的快速发展和广泛应用,当前对试题库智能组卷问题的研究主要是对试题库设计和对组卷算法设计的研
随着G/S模式理论思想的发展及其在专业化、行业化地理信息系统中的逐步应用,使得这一空间信息领域创新性的理论思想逐渐走向成熟。近年来,这一创新性理论结合空间信息领域的特
当前,随着信息化的飞速发展和信息技术的广泛应用,信息系统已成为人类社会不可或缺的重要组成部分。人们在享受信息化带来的巨大利益的同时,也面临着由此带来的不可忽视的安全威
云计算采用创新的计算模式,通过互联网为客户提供强大的计算能力和多样的信息服务。云计算的商业模式使计算和服务可以取用自由、按量付费。云计算融合了虚拟化、自动化和标
伴随着空间位置技术的广泛应用,空间数据挖掘成为数据挖掘中最有前景的研究方向之一,而空间co-location模式挖掘是发现一组频繁出现的空间对象的集合,是空间数据挖掘中重要的
板料成形计算机辅助工程(CAE)是一个以基于有限元计算的板料成形数值模拟技术为 核心,融合CAD(计算机辅助设计)、CG(计算机图形学)、CAM(计算机辅助制造)等各类技术于一体的
从2008年至今,云计算一直是个热词。同时另一个概念“云存储”也应运而生。云存储的概念一经提出,就得到了工业界和学术界的广泛关注。什么是云存储,业内很难有一个权威的定
学位