论文部分内容阅读
近几年,随着互联网、移动互联网及相关技术的飞速发展,数字图像的数量呈现爆炸式增长,从一堆图像中检索出目标图像的需求也变得愈加迫切。图像数量的剧增造成最直接的影响就是图像检索的任务变得艰巨。因此,如何快速准确的从图像数据库中检索出目标图像成为研究热点。最早的图像检索系统是基于关键词的检索,通过用户输入的关键词与图像的上下文(例如标题、人工标注)进行匹配。这些系统普遍存在文本信息缺少、图像和文本的含义不一致等问题。为了解决这几个难题,基于内容的图像检索系统被提出。CBIR(Content-Based Image Retrieval)可以自动从图像中提取底层特征(例如颜色、纹理、形状等)。此外在计算机视觉、模式识别和数据挖掘等领域,研究人员经常会遇到高维的特征向量,它们中间存在着很多相互关联或冗余的信息,甚至还有噪声。这些数据不仅明显提高了时间和空间方面的处理要求,还可能产生拟合过度、效率低和性能差等学习任务的副作用。实际上只有部分特征维度是重要的、有辨识度的。特征选择技术就是一种解决上述问题的方法,根据一定的评价标准选择最相关的特征子集,不仅降低了特征维度,而且提高了特征的辨识度。针对上述问题,本文重点研究了基于内容的图像检索中的综合特征提取、特征融合以及用户相关性反馈的技术。在特征提取方面,我们通过改进得到了一种性能更优的特征提取算法CoCD(Contrast and Color Distribution)。原有的特征提取算法CoLD(Contrast and Luminance Distribution)主要描述了图像的纹理特征与亮度特征。为了获取图像中更多的有效信息,我们引入在HSV颜色空间的颜色分布来代替原有的亮度分布,研究了对比度分布和颜色分布的重要度,调整了二者在相似性度量过程中的权重。实验结果说明通过统计抽样来提取特征是有效的。在此基础上我们提出了一种新的基于统计抽样的特征提取算法:分块均方算法BMVA(Blocked Mean-Variance Algorithm)。用户反馈技术是CBIR系统中常用的一种用于提高系统检索性能的交互技术。根据信息传递过程中能量衰减的思想,我们提出了一种新的用户反馈技术并应用到图像检索系统中,提高了系统的检索性能。特征融合方面,结合特征选择以及信息融合的思想,我们提出了一种基于图论的非监督式特征融合算法UGFF(Unsupervised Graphtheory-based Feature Fusion),该算法可以综合多种特征提取算法,降低特征维度之间的信息冗余,抽取出一个低维的、更高辨识度的特征。以开放的Corel5K(5000幅)和Wang1K(1000幅)作为测试的图像数据库,欧氏距离、余弦距离以及有效地流排序算法EMR(Efficient Manifold Ranking)作为相似性度量和排序方法,平均查准率MAP(Mean Average Precision)作为评价标准,我们验证了本文提出的两种特征提取算法、一种相关性反馈技术以及一种基于图论的非监督式特征融合算法的性能。实验结果显示,我们提出的两种新的特征提取算法能够达到较好的检索性能,相关性反馈算法能够明显提高检索性能,基于图论的非监督式特征融合技术不仅降低了特征向量的维度而且提高了特征向量在检索系统中的辨识度。