论文部分内容阅读
随着计算机、互联网、图像处理技术的飞速发展,出现了越来越多的数字图像。怎样从这些巨大的数字图像资源中,快速有效地得到想要的图像数据越来越成为一个急需解决的问题。因为这个原因,近年来基于内容的图像检索技术已经成为一个研究热点。基于内容的图像检索技术的研究主要集中在三个方向上,分别是颜色、形状和纹理。颜色是基于内容的图像检索中应用最为广泛的特征,因此本文主要对基于颜色特征的图像检索模型进行研究。国内外对基于颜色特征的图像检索模型的研究取得了一系列的成果。TomBoyle提出了基于流行色的图像检索模型;Kankanhalli和Mehtre提出了基于聚类的颜色匹配检索模型;Pass等人提出了使用最大熵方法分析颜色空间信息的检索模型;Stricker等提出了使用模糊区域,计算颜色距的检索模型;Colombo等人基于颜色空间的一致性,提出了颜色一致性检索模型。Cinque等人利用色彩聚类方法将图像的整体直方图分解成局部的区域直方图,提出了基于局部区域的检索模型。这些基于颜色特征的图像检索模型在量化方法上存在不足,量化后的颜色不能很好的表现图像的颜色特征。另外,许多算法没有考虑颜色的空间分布特征,导致检索出完全不相关的图像。针对以上问题,本文提出了一个基于不均匀量化、连通区域特征提取和矩形信息排序的图像检索模型。图像检索模型主要有三个创新点,如下所示:(1)模型在量化阶段,针对HSV颜色空间的特点,提出了一种不均匀的量化方法,将H量化为6级,S和V分别量化为3级,HSV颜色空间被量化为54个量化级。不均匀的量化方法在保存图像大部分信息的基础上,使量化级数减少到54级,为后续特征提取阶段做了准备。由于量化级数较少,特征提取的速度就较快,从而使查询速度也增快。(2)特征提取阶段,提出了使用连通区域计算图像的直方图。计算图像的连通区域面积,在图像的连通区域上使用了颜色直方图对图像信息进行统计,并使用连通区域的直方图计算图像的相似度。连通区域使图像更好的反应了局部信息,减少了全局直方图相同但是局部完全不相同的图像出现的几率。(3)对于检索出的中间结果,使用了矩形信息对图像进行重新排序,使相似度高的图像位于检索结果的前面。主要思想是:分别计算出结果集和候选集,使用矩形信息去掉结果集中相似度比较小的图像,用候选集中相似度比较大的图像来代替,从而提高查询的精度。经对比实验表明,本文提出的模型有效地提高了图像检索的查全率和查准率。