论文部分内容阅读
【摘 要】如何实现图像的快速浏览和查询使得基于内容图像检索的应用受到了很大限制。针对这一问题,本文提出在检索之前,先对图像库进行基于内容自组织的结构划分,给出了一种新的确定模糊权值的定义。实验结果表明,该算法能够大大缩短检索的时间。
【关键词】基于内容的图像检索 模糊c均值(FCM) 自组织结构划分 聚类
一、引言
九十年代早期,由于大规模图像数据库的出现,由手工进行图像标注基于文本的图像检索所带来的问题变得十分明显,为了克服这一困难,研究者们提出了基于内容的图像检索(Content-Based Image Retrieval, CBIR)对图像内容进行机器自动分析,直接根据图像内容特征信息建立索引,并且通过图像特征向量间的近似度量进行图像相似性匹配,从而实现图像的检索。
伴随着时代的发展,科技的进步,图像的资源越来越丰富,图像库中的图像往往也是海量的,这就给人们使用图像库带来了不便,那么我们如何从海量的图像库中能够方便的找到自己想要的图像呢?本文提出了对图像库进行基于内容自组织的结构划分,使无序的图像库变成有一定的规律,现在基于内容的图像检索技术还主要是靠图像的底层特征(如颜色、纹理、形状、空间关系等)来进行的。本文中应用模糊c均值聚类来对图像库进行分类的。模糊c均值聚类关键的就是模糊权值的确定,常用的算法是利用特征向量间的距离计算模糊权值,但是当某一向量与两个质心距离相等时,则不论两个类别的分布情况如何,模糊权均相等不能得到准确的分类,为了解决这一问题,更好的反映聚类的分布,本文给出了一种新的确定模糊权值的定义。图像库经过基于内容相似性的划分后,使图像在图像库中存放的位置有了一定的规律,如果这时再查找自己想要的图像,就不必对图像库进行逐幅查找了,而只要找到跟示例图像距离最近的类的中心,然后在该类中进行查找就可以了,最后把检索结果输出给用户。
本文在第二部分给出了基于内容自组织检索系统的框图,第三部分详细介绍了改进的模糊C均值聚类算法,最后是实验结果和结论。
二、系统框图
目前,基于内容的图像检索是通过计算示例图像与图像库中图像之间的视觉特征的相似度来完成的,而且所提取的特征大都可以表示成向量的形式,即可以把图像表示为向量形式,所以可以把它们看作是特征空间中的点,而检索的过程实质上就是寻找特征空间中离查询向量最近的那些点所对应的图像。
对图像库中的图像进行基于内容的自组织结构划分实际上就是对特征空间中的点进行划分,即模式识别中的数据聚类问题。
三、改进的模糊c均值(FCM)算法
模糊聚类是无监督模式识别的一个重要分支,在模式分类、图像处理和模糊规则提取等众多的领域中获得了广泛的应用。在众多的聚类算法中,模糊c均值(FCM)算法是最重要也是最为人们熟悉的方法之一。
该算法实质上是通过对目标函数的迭代优化实现集合划分,它可以表示出各个象素属于不同类别的程度,与此对应的硬c均值聚类算法则将每个象素都直接和唯一的划分到某个类别中去。本文中采取聚类算法的基本思想是:若Q为图像库中的图像数目,N为特征向量维数,则整个图像库可表示为Q个N维特征向量。首先,选取K个类中心,将库内图像与每个类中心求欧氏距离,然后按最小距离原则分配给相应的类中心,这样每个类别中平均包含Q/K幅图像。聚类算法如下:
(一)初始聚类数K与初始类中心的确定
1.初始聚类数:
根据经验理论和实验数据,很容易得到初始聚类数
2.初始聚类中心:
首先从图像的特征数据库中选取距离最远的两个特征向量作为第一、二初始类中心,假设已经确定了k个初始类中心,则第k+1个初始类中心是与前k个类中心距离累加和最大的特征向量,如此得到K个初始类中心。
3.样本初步分配
初始模糊权取(0-1)之间的随机数。然后将其进行规一化
根据初始模糊权 将库内样本与各初始聚类中心进行比较,归入距离最近的类中心。
4.样本合并
若兩初始聚类中心间距离小于阈值T,两样本中心合并。
count[k]:每类中所包含图像个数。
5、更新聚类中心
将各类成员的质心作为新聚类中心。
(二)图像样本隶属度的权值确定
从上面的分析可以看出常用的FCM算法采用特征向量间的距离计算模糊权值(如式3.3),如果图像与聚类中心之间距离越远,那么该图像属于这一类的隶属程度就会越小,但当某一向量与两个质心距离相等时,则不论两个类别的分布情况如何,模糊权均相等不能得到准确的分类。下面就这一问题本文进行了深入的研究,给出了一种新的确定模糊权值的定义。
定义1:给定图像序列,其中Q是图像库中图像的数目,初始聚类中心序列,其中K是初始聚类的数目,则图像属于第k类的模糊权值定义为:
(三)样本分配
经过迭代后,新的聚类中心已经确定。然后再根据(4)把图像归入距离最近的聚类中心。
(四)聚类的融合
若两聚类间的距离小于阈值,同时分别属于类的样本比例均超过,则对两聚类进行融合处理。
1.首先找出距离最近的两聚类中心。如果聚类数为K,则距离对个数
4.计算各聚类中心之间距离的平均值
(15)
5.如,同时满足 ,则两类进行融合处理。
四、实验结果及结论
图像库中的图像经过聚类后,内容相似的图像被分到同一类中,这样在检索的时候,只需比较示例图像与各个类中心的距离,而不需要示例图像与图像库中的每一幅图像进行比较,大大缩减了搜索的空间,减少了初步检索的时间,实验结果表明,该过程使基于内容的图像检索过程更加合理,更加适应人们在实际中的需要。
参考文献:
[1]章毓晋.基于内容的视觉信息检索. 科学出版社, 2003年5月,第1版.
[2]庄越挺,潘云鹤,吴飞.网上多媒体信息分析与检索. 清华大学出版社, 2002.
[3]张建东, 苏鸿根. 基于内容的图像检索关键技术研究. 计算机工程, Vol.30, No 14,2004,7:119-121.
[4] Colombo C, Bimbo A, Castelli V, and Bergman L D. Visible image retrieval. In: Image Databases---Search and Retrieval of Digital Imagery, 2002, Inc. Ch.2, 11-33.
[5]高新波.模糊聚类分析及其应用. 西安电子科技大学出版社, 2004年1月, 第1版
作者简介:
赵建敏(1978.11-)硕士研究生学历,2006年毕业于吉林大学通信工程学院,主要从事图像与视频信号的识别与检索系统的研究,发表论文数篇,参与发明专利一项。
【关键词】基于内容的图像检索 模糊c均值(FCM) 自组织结构划分 聚类
一、引言
九十年代早期,由于大规模图像数据库的出现,由手工进行图像标注基于文本的图像检索所带来的问题变得十分明显,为了克服这一困难,研究者们提出了基于内容的图像检索(Content-Based Image Retrieval, CBIR)对图像内容进行机器自动分析,直接根据图像内容特征信息建立索引,并且通过图像特征向量间的近似度量进行图像相似性匹配,从而实现图像的检索。
伴随着时代的发展,科技的进步,图像的资源越来越丰富,图像库中的图像往往也是海量的,这就给人们使用图像库带来了不便,那么我们如何从海量的图像库中能够方便的找到自己想要的图像呢?本文提出了对图像库进行基于内容自组织的结构划分,使无序的图像库变成有一定的规律,现在基于内容的图像检索技术还主要是靠图像的底层特征(如颜色、纹理、形状、空间关系等)来进行的。本文中应用模糊c均值聚类来对图像库进行分类的。模糊c均值聚类关键的就是模糊权值的确定,常用的算法是利用特征向量间的距离计算模糊权值,但是当某一向量与两个质心距离相等时,则不论两个类别的分布情况如何,模糊权均相等不能得到准确的分类,为了解决这一问题,更好的反映聚类的分布,本文给出了一种新的确定模糊权值的定义。图像库经过基于内容相似性的划分后,使图像在图像库中存放的位置有了一定的规律,如果这时再查找自己想要的图像,就不必对图像库进行逐幅查找了,而只要找到跟示例图像距离最近的类的中心,然后在该类中进行查找就可以了,最后把检索结果输出给用户。
本文在第二部分给出了基于内容自组织检索系统的框图,第三部分详细介绍了改进的模糊C均值聚类算法,最后是实验结果和结论。
二、系统框图
目前,基于内容的图像检索是通过计算示例图像与图像库中图像之间的视觉特征的相似度来完成的,而且所提取的特征大都可以表示成向量的形式,即可以把图像表示为向量形式,所以可以把它们看作是特征空间中的点,而检索的过程实质上就是寻找特征空间中离查询向量最近的那些点所对应的图像。
对图像库中的图像进行基于内容的自组织结构划分实际上就是对特征空间中的点进行划分,即模式识别中的数据聚类问题。
三、改进的模糊c均值(FCM)算法
模糊聚类是无监督模式识别的一个重要分支,在模式分类、图像处理和模糊规则提取等众多的领域中获得了广泛的应用。在众多的聚类算法中,模糊c均值(FCM)算法是最重要也是最为人们熟悉的方法之一。
该算法实质上是通过对目标函数的迭代优化实现集合划分,它可以表示出各个象素属于不同类别的程度,与此对应的硬c均值聚类算法则将每个象素都直接和唯一的划分到某个类别中去。本文中采取聚类算法的基本思想是:若Q为图像库中的图像数目,N为特征向量维数,则整个图像库可表示为Q个N维特征向量。首先,选取K个类中心,将库内图像与每个类中心求欧氏距离,然后按最小距离原则分配给相应的类中心,这样每个类别中平均包含Q/K幅图像。聚类算法如下:
(一)初始聚类数K与初始类中心的确定
1.初始聚类数:
根据经验理论和实验数据,很容易得到初始聚类数
2.初始聚类中心:
首先从图像的特征数据库中选取距离最远的两个特征向量作为第一、二初始类中心,假设已经确定了k个初始类中心,则第k+1个初始类中心是与前k个类中心距离累加和最大的特征向量,如此得到K个初始类中心。
3.样本初步分配
初始模糊权取(0-1)之间的随机数。然后将其进行规一化
根据初始模糊权 将库内样本与各初始聚类中心进行比较,归入距离最近的类中心。
4.样本合并
若兩初始聚类中心间距离小于阈值T,两样本中心合并。
count[k]:每类中所包含图像个数。
5、更新聚类中心
将各类成员的质心作为新聚类中心。
(二)图像样本隶属度的权值确定
从上面的分析可以看出常用的FCM算法采用特征向量间的距离计算模糊权值(如式3.3),如果图像与聚类中心之间距离越远,那么该图像属于这一类的隶属程度就会越小,但当某一向量与两个质心距离相等时,则不论两个类别的分布情况如何,模糊权均相等不能得到准确的分类。下面就这一问题本文进行了深入的研究,给出了一种新的确定模糊权值的定义。
定义1:给定图像序列,其中Q是图像库中图像的数目,初始聚类中心序列,其中K是初始聚类的数目,则图像属于第k类的模糊权值定义为:
(三)样本分配
经过迭代后,新的聚类中心已经确定。然后再根据(4)把图像归入距离最近的聚类中心。
(四)聚类的融合
若两聚类间的距离小于阈值,同时分别属于类的样本比例均超过,则对两聚类进行融合处理。
1.首先找出距离最近的两聚类中心。如果聚类数为K,则距离对个数
4.计算各聚类中心之间距离的平均值
(15)
5.如,同时满足 ,则两类进行融合处理。
四、实验结果及结论
图像库中的图像经过聚类后,内容相似的图像被分到同一类中,这样在检索的时候,只需比较示例图像与各个类中心的距离,而不需要示例图像与图像库中的每一幅图像进行比较,大大缩减了搜索的空间,减少了初步检索的时间,实验结果表明,该过程使基于内容的图像检索过程更加合理,更加适应人们在实际中的需要。
参考文献:
[1]章毓晋.基于内容的视觉信息检索. 科学出版社, 2003年5月,第1版.
[2]庄越挺,潘云鹤,吴飞.网上多媒体信息分析与检索. 清华大学出版社, 2002.
[3]张建东, 苏鸿根. 基于内容的图像检索关键技术研究. 计算机工程, Vol.30, No 14,2004,7:119-121.
[4] Colombo C, Bimbo A, Castelli V, and Bergman L D. Visible image retrieval. In: Image Databases---Search and Retrieval of Digital Imagery, 2002, Inc. Ch.2, 11-33.
[5]高新波.模糊聚类分析及其应用. 西安电子科技大学出版社, 2004年1月, 第1版
作者简介:
赵建敏(1978.11-)硕士研究生学历,2006年毕业于吉林大学通信工程学院,主要从事图像与视频信号的识别与检索系统的研究,发表论文数篇,参与发明专利一项。