论文部分内容阅读
聚类是一种重要的数据分析方法,在诸如计算机视觉、信息检索、数据挖掘和模式识别等领域得到了广泛的应用。目前,作为全局最优技术的进化计算已被很多学者用于聚类问题。基于进化计算的聚类算法往往以欧氏距离作为相似性度量。虽然在全局最优化性能上,以欧氏距离作为相似性度量的进化聚类算法较基于梯度下降的K-均值算法有所提高,但它们只是对空间分布为球形或超球体的数据具有较好的性能,而对空间分布复杂的数据效果不是很好,这是基于欧氏距离的相似性度量的缺陷导致的必然结果。因此,使用一个更加合理的相似性度量,使聚类算法针对复杂分布的数据也能得到较好的聚类结果是非常重要的。本文首先提出了一种基于核的进化聚类算法。通过利用核,把输入空间的样本映射到高维特征空间,在特征空间中进行进化聚类,我们将新方法命名为核进化聚类算法。通过非线性映射能够较好地分辨、提取并放大有用的特征,从而更为准确的聚类,在经典算法效果不佳的情况下,核进化聚类算法也能够得到正确的聚类结果。针对复杂分布的数据,提出了一种基于混合测度的进化聚类算法。该方法采用了“粗聚类、细聚类”的思想,首先以欧氏距离作为相似性度量,对数据集进行粗聚类,然后,以流形距离作为相似性度量,对粗聚类后的数据集进行细聚类。实验表明,与基于欧氏距离的遗传聚类算法及K-均值算法相比,此算法对样本空间分布复杂的无监督聚类问题具有较高的正确率,具有很好的鲁棒性。将核进化聚类算法与形态学方法结合,提出一种基于分水岭与核进化聚类算法的图像分割算法。该算法首先使用改进的分水岭算法—内外标记的分水岭算法对图像进行初分割,提取区域图像特征作为聚类的输入样本;利用核函数把样本映射到特征空间,在特征空间中进行进化聚类,用聚类的方法进行区域合并,得到最终的分割结果。将新算法用于自然图像分割、纹理图像分割及SAR图像分割任务,实验表明该算法可以成功地用于多种图像分割,可以得到有较好的图像分割性能。