一种新的基于内容自组织的图像检索方法

来源 :数字化用户 | 被引量 : 0次 | 上传用户：augustS

【摘要】

：

【作者】

：

赵建敏关宗安常丽东

【出处】

：

数字化用户

【发表日期】

：

2013年26期

【关键词】

：

基于内容的图像检索模糊c均值(FCM) 自组织结构划分聚类

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

　　【摘要】如何实现图像的快速浏览和查询使得基于内容图像检索的应用受到了很大限制。针对这一问题，本文提出在检索之前，先对图像库进行基于内容自组织的结构划分，给出了一种新的确定模糊权值的定义。实验结果表明，该算法能够大大缩短检索的时间。
　　【关键词】基于内容的图像检索模糊c均值（FCM）自组织结构划分聚类
　　一、引言
　　九十年代早期，由于大规模图像数据库的出现，由手工进行图像标注基于文本的图像检索所带来的问题变得十分明显，为了克服这一困难，研究者们提出了基于内容的图像检索（Content-Based Image Retrieval， CBIR）对图像内容进行机器自动分析，直接根据图像内容特征信息建立索引，并且通过图像特征向量间的近似度量进行图像相似性匹配，从而实现图像的检索。
　　伴随着时代的发展，科技的进步，图像的资源越来越丰富，图像库中的图像往往也是海量的，这就给人们使用图像库带来了不便，那么我们如何从海量的图像库中能够方便的找到自己想要的图像呢？本文提出了对图像库进行基于内容自组织的结构划分，使无序的图像库变成有一定的规律，现在基于内容的图像检索技术还主要是靠图像的底层特征（如颜色、纹理、形状、空间关系等）来进行的。本文中应用模糊c均值聚类来对图像库进行分类的。模糊c均值聚类关键的就是模糊权值的确定，常用的算法是利用特征向量间的距离计算模糊权值，但是当某一向量与两个质心距离相等时，则不论两个类别的分布情况如何，模糊权均相等不能得到准确的分类，为了解决这一问题，更好的反映聚类的分布，本文给出了一种新的确定模糊权值的定义。图像库经过基于内容相似性的划分后，使图像在图像库中存放的位置有了一定的规律，如果这时再查找自己想要的图像，就不必对图像库进行逐幅查找了，而只要找到跟示例图像距离最近的类的中心，然后在该类中进行查找就可以了，最后把检索结果输出给用户。
　　本文在第二部分给出了基于内容自组织检索系统的框图，第三部分详细介绍了改进的模糊C均值聚类算法，最后是实验结果和结论。
　　二、系统框图
　　目前，基于内容的图像检索是通过计算示例图像与图像库中图像之间的视觉特征的相似度来完成的，而且所提取的特征大都可以表示成向量的形式，即可以把图像表示为向量形式，所以可以把它们看作是特征空间中的点，而检索的过程实质上就是寻找特征空间中离查询向量最近的那些点所对应的图像。
　　对图像库中的图像进行基于内容的自组织结构划分实际上就是对特征空间中的点进行划分，即模式识别中的数据聚类问题。
　　三、改进的模糊c均值（FCM）算法
　　模糊聚类是无监督模式识别的一个重要分支，在模式分类、图像处理和模糊规则提取等众多的领域中获得了广泛的应用。在众多的聚类算法中，模糊c均值（FCM）算法是最重要也是最为人们熟悉的方法之一。
　　该算法实质上是通过对目标函数的迭代优化实现集合划分，它可以表示出各个象素属于不同类别的程度，与此对应的硬c均值聚类算法则将每个象素都直接和唯一的划分到某个类别中去。本文中采取聚类算法的基本思想是：若Q为图像库中的图像数目，N为特征向量维数，则整个图像库可表示为Q个N维特征向量。首先，选取K个类中心，将库内图像与每个类中心求欧氏距离，然后按最小距离原则分配给相应的类中心，这样每个类别中平均包含Q/K幅图像。聚类算法如下：
　　（一）初始聚类数K与初始类中心的确定
　　1.初始聚类数：
　　根据经验理论和实验数据，很容易得到初始聚类数
　　2.初始聚类中心：
　　首先从图像的特征数据库中选取距离最远的两个特征向量作为第一、二初始类中心，假设已经确定了k个初始类中心，则第k+1个初始类中心是与前k个类中心距离累加和最大的特征向量，如此得到K个初始类中心。
　　3.样本初步分配
　　初始模糊权取（0-1）之间的随机数。然后将其进行规一化
　　根据初始模糊权将库内样本与各初始聚类中心进行比较，归入距离最近的类中心。
　　4.样本合并
　　若兩初始聚类中心间距离小于阈值T，两样本中心合并。
　　count[k]：每类中所包含图像个数。
　　5、更新聚类中心
　　将各类成员的质心作为新聚类中心。
　　（二）图像样本隶属度的权值确定
　　从上面的分析可以看出常用的FCM算法采用特征向量间的距离计算模糊权值（如式3.3），如果图像与聚类中心之间距离越远，那么该图像属于这一类的隶属程度就会越小，但当某一向量与两个质心距离相等时，则不论两个类别的分布情况如何，模糊权均相等不能得到准确的分类。下面就这一问题本文进行了深入的研究，给出了一种新的确定模糊权值的定义。
　　定义1：给定图像序列，其中Q是图像库中图像的数目，初始聚类中心序列，其中K是初始聚类的数目，则图像属于第k类的模糊权值定义为：
　　（三）样本分配
　　经过迭代后，新的聚类中心已经确定。然后再根据（4）把图像归入距离最近的聚类中心。
　　（四）聚类的融合
　　若两聚类间的距离小于阈值，同时分别属于类的样本比例均超过，则对两聚类进行融合处理。
　　1.首先找出距离最近的两聚类中心。如果聚类数为K，则距离对个数
　　4.计算各聚类中心之间距离的平均值
　　（15）
　　5.如，同时满足，则两类进行融合处理。
　　四、实验结果及结论
　　图像库中的图像经过聚类后，内容相似的图像被分到同一类中，这样在检索的时候，只需比较示例图像与各个类中心的距离，而不需要示例图像与图像库中的每一幅图像进行比较，大大缩减了搜索的空间，减少了初步检索的时间，实验结果表明，该过程使基于内容的图像检索过程更加合理，更加适应人们在实际中的需要。
　　参考文献：
　　[1]章毓晋.基于内容的视觉信息检索. 科学出版社， 2003年5月，第1版.
　　[2]庄越挺，潘云鹤，吴飞.网上多媒体信息分析与检索. 清华大学出版社， 2002.
　　[3]张建东，苏鸿根. 基于内容的图像检索关键技术研究. 计算机工程， Vol.30， No 14，2004，7：119-121.
　　[4] Colombo C， Bimbo A， Castelli V， and Bergman L D. Visible image retrieval. In： Image Databases---Search and Retrieval of Digital Imagery， 2002， Inc. Ch.2， 11-33.
　　[5]高新波.模糊聚类分析及其应用. 西安电子科技大学出版社， 2004年1月，第1版
　　作者简介：
　　赵建敏（1978.11-）硕士研究生学历，2006年毕业于吉林大学通信工程学院，主要从事图像与视频信号的识别与检索系统的研究，发表论文数篇，参与发明专利一项。

其他文献

暴发性重症急性胰腺炎临床特点及治疗方法的探讨

目的认识暴发性重症急性胰腺炎(fulminant severe acute pancreatitis,FSAP)的特点,探讨其治疗方法.方法统计出现症状72 h内住院的重症胰腺炎(severe acute pancreatitis,SAP)病人209人,回顾性的整理、分析暴发性重症胰腺炎发生、发展的特点.暴发性重症急性胰腺炎定义为,出现症状72 h内发生器官衰竭的重症胰腺炎.56例病人为暴发性重症

期刊

胰腺炎多器官系统衰竭

预激综合征的外科治疗

期刊

Wolff-Parkinson-White综合征附加旁路外科切割

紫癜性肾炎患者血和肾组织P选择素的表达及意义

目的探讨粘附分子P选择素(CD62P)在紫癜性肾炎(HSPN)患者中的致病作用.方法以肾穿刺活检法取HSPN患者肾组织,采用直接免疫荧光标记单克隆抗体,常规和特殊病理染色(苏木素-伊红染色、过碘酸雪夫染色、Masson三色染色、六胺银染色),外周血采用流式细胞术的方法进行了CD62P表型的研究.结果① 32例HSPN患者肾组织中显示CD62P表达27例(84.4%),表达部位常见于肾小球系膜区、血

期刊

肾炎紫癜P选择素

新生儿淋菌性结膜炎22例

期刊

结膜炎淋菌性婴儿新生治疗

1H MRS对星形细胞瘤的诊断价值

目的探讨质子磁共振波谱(1H Magnetic Resonance Spectroscopy,1H MRS)在星形细胞肿瘤诊断及分级中的价值.方法对MRI诊断为脑星形细胞肿瘤并经病理证实的40例患者术前行1H MRS检查,每例患者均行肿瘤区和与之相对应的健侧部位的1HMRS,以作对照研究.结果40例星形细胞瘤均表现为异常的1HMRS,主要表现为氮乙酰门氡氨酸(N-acetylaspartate,N

期刊

星形细胞瘤1H磁共振波谱代谢产物

广播机房装修中的声学指标测量

摘要每年广播机构有一定的机房需要进行装修改造。我们在设计装修改造的方案前需对原有环境进行测量以为设计提供参考依据，验收中也需要有一定的声学指标来反映改造的效果。因此房间声学指标的测量对机房改造具有极其重要的作用。本文将介绍声学指标测量的概念和方法。　　关键词环境噪声隔声量混响时间时间延时分析测量　　中图分类号：TB54 文献标识码：A　　0 前言　　每年广播机构有一定的机房需要进行装修

期刊

环境噪声隔声量混响时间时间延时分析测量

利用集中网站进行WEB搜索的优化策略

【摘要】提高Web信息搜索的效率，改善搜索的性能，是信息检索领域一个重要的研究课题。本文利用爬山算法求得针对特定类别的最小集中网站集，再通过网页聚类，找到能获得最完全而准确信息的网页序列，从而提高Web搜索的速度和准确率。　　【关键词】Web信息搜索集中网站爬山算法聚类相似度　　搜索引擎（Search engine）是目前Web信息检索的主要工具，它所提供的导航服务已经成为互联网上非常重

期刊

Web信息搜索集中网站爬山算法聚类相似度

基于OpenGL的实时空情仿真可视化系统的研究与实现

【摘要】基于可视化理论，本文介绍了以OpenGL为工具开发一个空情仿真系统的具体方法，重点阐述了系统实时性的实现，三维模型的建立，实时驱动模型，视点漫游等技术的实现。　　【关键词】可视化空情仿真 OpenGL　　从近期几场高科技局部战争看，空袭作战，远程精确打击已成为现代战争的主要作战方式。做好防隐形飞机、巡航导弹、武装直升机等的打击和侦察监视是夺取未来反空袭作战胜利的关键。逼真地模拟敌攻击空

期刊

可视化空情仿真OpenGLvisualizationSimulation of Virtual DroneOpenGL

一种新的基于内容自组织的图像检索方法

其他学术论文