论文部分内容阅读
关于图像检索技术的研究兴起于20世纪70年代,当时主要是基于文本的图像检索技术,90年代以后,出现了基于图像的内容语义,如颜色、纹理、布局等进行分析和检索的技术,即基于内容的图像检索(Content-based ImageRetrieval)技术。图像检索技术的本质是对图像进行分类和识别。由于图像分类的复杂性和模糊性,目前还没有针对图像分类的完全、明确、统一的分类体系。但是在许多领域,针对具体应用、具体特征的图像的分类研究却很多。常见的研究领域有:医学、军事公安、航空航天技术等。 本文研究对自然景物类图像进行分类,针对自然景物类图像颜色较为丰富的特征,将图像底层视觉特征的提取作为主要的研究目标。基于通用性的考虑,研究了MPEG-7标准技术,基于MPEG-7中各种颜色描述符的思想,研究针对图像内容的视觉特征,主要是颜色特征进行提取的方法。此外,图像分类问题中,样本相似程度的度量是关键。图编辑距离是一种定义在图上的距离描述方法。它能够集中体现空间关系对图像分类的影响。通过定义合适的图编辑操作代价,构造基于图编辑距离的图核,并最终实现了自然景物类图像的分类。概括而言,本文的创新点如下: (1)基于主色的思想,提出了基于颜色直方图的主色特征提取,以及基于MPEG-7主颜色描述符的特征提取。详细阐述了颜色特征提取的方法、表示形式、相似度的计算等方面,并对实验效果进行了分析。 (2)对图像进行自动分割,描述图像区域的空间关系特征。融合颜色及空间特征,基于图编辑距离,定义适合本文应用的编辑操作及相应代价函数,构造图核,通过支撑向量机进行分类。 (3)设计和实现了基于主色特征提取的自然景物图像分类系统。 通过该实验系统,验证本文提出的各种方法的有效性。实验证明,本文提出的基于MPEG-7主颜色描述符的特征提取方法及基于此的图编辑距离代价定义,都比较合理。最终图像的识别结果能够达到近90%,较之其他算法有较大的改进。