论文部分内容阅读
图像处理是计算机视觉和模式识别的主要方向之一,图像处理一般分为图像理解、图像分析、狭义的图像处理三个层次.而聚类是数据挖掘的重要方法,已经在图像处理的各个层次有很多应用.本文研究图像处理中的聚类方法,主要包括图像理解层次的聚类索引和图像分析层次的图像分割,并且对基于内容的多媒体信息检索系统(MIRES)①进行扩展,取得的研究成果如下:
1.提出基于多主体的分布式图像聚类方法.针对分布情况下的图像数据,提出在多主体环境(MAGE)<②>平台上,利用生长分层自组织映射(GHSOM)算法来实现分布式图像聚类索引.基于MAGE平台的分布式计算和主体间自动协调的能力,以及GHSOM算法的动态生长,自动适应数据量大小的特征,该方法能够适应分布条件下缺乏总体信息的情形,并且易于组织数据层次结构,同时也方便作为检索的接口.
2.提出基于测地线距离的自组织映射(GDBSOM)图像聚类算法.针对不同视角下的物体图像,采用流形学习算法等距映射(Isomap)的思想,用测地线距离来代替欧氏距离,提出基于测地线距离的自组织映射(GDBSOM)聚类算法.该算法基于批处理SOM原型,利用测地线距离进行相似性度量,并且选用了更为高效的初始化方式.算法GDBSOM结合了测地线距离的流形视角和SOM泛化学习能力,实验表明在满足Isomap渐进收敛定理条件下的图像聚类应用中,该方法聚类结果更接近人类的认知.
3.提出基于自组织动态网络(SODNN)聚类的图像分割方法.在图像分割方面,采用特征空间聚类方法实现分割,提出自组织动态网络(SODNN)聚类算法.该算法改进了自组织树映射(SOTM),具有自动适应数据分布特征及更为准确稳定的特点.利用该算法对颜色特征空间聚类的过程中,结合了位置信息,达到了较好的效果,实验表明算法分割结果与人工分割结果具有较好的一致性.
通过本文的研究为基于内容的图像视频检索系统MIRES提供了分布环境下图像库聚类索引生成,以及通过图像分割来获取感兴趣的目标等功能.