谱聚类算法的研究及其在图像分割的应用

来源 :华东理工大学 | 被引量 : 0次 | 上传用户:alex136629
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析是一种无监督的数据分析方法,它基于相似性将样本集划分成簇,使得属于相同簇的样本点比属于不同簇的样本点更相似。聚类分析问题是目前的研究热点,研究成果已经成功应用在模式识别、语音识别、机器学习、工业过程故障诊断、生物信息等方面。针对不同类型的数据集,对应着不同的聚类分析方法,目前有大量的聚类算法被提出,但是并没有一种通用的聚类算法适用于所有类型的数据集。  谱聚类是最近几年发展起来的一种聚类方法,由于其可以针对任意形状的数据集聚类并且取得令人满意的结果,谱聚类算法受到了越来越多学者的关注。谱聚类算法的理论依据是谱图理论,谱聚类算法通过将聚类问题转化为图的划分问题,可以避免聚类过程中收敛于局部最优解的问题,因此,谱聚类算法对比于传统的k-means、c-means算法,可以处理更加广泛的数据集,对于谱聚类算法的研究已经成为聚类问题研究的一个热点研究方向。  已经有多种经典的谱聚类算法被提出,很多针对这些经典谱聚类算法的改进算法也被提出,对于谱聚类算法的研究是一个开放性的问题,目前对于谱聚类算法的研究方向主要有:相似性计算方法的研究、最优聚类数目确定方法、特征向量选择方法、聚类评价指标选择、大数据领域应用、与其他数学方法结合问题等。本文将首先介绍经典的谱聚类算法,并详细讨论特征向量选择方法、相似性计算方法、与其他数学方法结合问题、以及在图像分割领域的应用。  本文的研究内容包括:  (1)谱聚类的特征向量与聚类关系分析  从理论上论述如何选择特征向量,引入了谱聚类算法的扰动分析理论,分别从理想情况与一般情况两个方面介绍了谱聚类的扰动分析理论,得出了两种情况之下如何从特征向量中提取聚类信息,给出了两种情况下的聚类算法,并提出基于权矩阵的谱聚类算法。将以上研究成果应用于模态划分问题以验证理论分析的有效性,提出丫基于谱聚类特征向量分析的模态划分方法,给出稳态多模态过程划分算法与动态多模态过程划分算法。最后设计实验验证提出的模态划分方法的有效性,也间接证明谱聚类特征向量分析理论的正确性。  (2)基于密度相关距离的自整定谱聚类算法  在谱聚类算法应用中,最常用的相似度矩阵计算方法是使用高斯核函数,经典的谱聚类算法如NJW算法等都使用这种方法,在一些聚类问题中,使用高斯核函数可以获得令人满意的结果,但是对于多重尺度数据集等复杂的聚类问题,使用高斯核函数计算相似性将不能得到满意结果,目前针对高斯核函数很多改进算法被提出。本文将针对高斯核函数做出改进,提出基于密度相关距离的相似度计算方法,并给出参数自整定的解决方法。新的相似性计算方法可以对参数进行自整定,避免人共选取核参数,而且对于多重尺度数据集等复杂聚类问题可以得到令人满意的聚类结果,最后设计实验验证本文提出基于密度距离的相似性计算方法的有效性。  (3)基于HMM的谱聚类图像分割算法  基于聚类分析的图像分割问题,往往需要对大规模数据集进行聚类,由于谱聚类算法需要求任意两个像素点之间的相似性,这需要消耗大量内存,所以传统的谱聚类算法在处理图像分割问题时会受到算法复杂度的制约。本文将提出一种新的图像分割框架,与HMM算法结合,首先使用HMM算法将原始图片划分为不同的组件,然后使用本文对于谱聚类算法的研究成果,将组件合并为最终的图像分割结果。重点研究了HMM预分割组件个数的确定算法,组件的合并算法。最后通过设计实验验证新的图像分割框架的有效性。
其他文献
分布式卫星系统是当前空间技术应用领域的一个重要研究方向。它的定义是:由两颗或两颗以上的卫星按一定要求分布在一种或多种轨道上,共同协调合作完成某些空间飞行任务(例如:观
随着语音识别技术的发展,在计算机辅助语言学习和考试领域的应用已经成为了一个新的方向。相比于音段层次的评估和诊断,超音段层次的任务难度更大、相关研究更少。本文主要针
进入21世纪以来,各类突发公共事件频发,给人类生产和生活带来巨大影响。突发公共事件具有危害性、不确定性、信息有限性和时间有限性等特征,不仅可能造成生命财产的巨大损失,甚至
全球钢铁行业面临不断升级的危机,某钢厂希望在原有自动化设备上建立以数据为基础的故障分析、溯源的企业数据分析网络,追求更高的效率和更低成本。本文结合钢厂对工业生产数据
隐式反馈数据具有收集成本低、容易获取和应用广泛等特点,而且能够在不影响用户体验效果的情况下获取,但也具有数据稀疏、包含噪声等缺点,解决推荐系统面临的数据稀疏问题具有重
带结构样本集上的学习包括三种规模不同的学习范式,涉及的研究对象从最微观的样本内结构一直到最宏观的全体样本上的结构。   第一种学习范式中结构存在于样本内部,即规则
目前我国正在进行供热体制改革,热计量是其中重要的组成部分。现有的热计量方法都需要流量计来计量流量,但是我国水质较差,导致人们普遍使用的机械式热量表容易产生误差或损
图像理解是计算机视觉领域的研究热点之一,通常情况下,它要求将图像中所有点标注为它所对应的景物类别。这一过程也可以看作是对图像中的所有类别景物目标的识别。当景物比较
随着计算机视觉及相关领域的发展,视觉目标跟踪展现出广泛的应用前景,因此视觉目标跟踪逐渐成为计算机视觉研究的热点之一。本文在对已有的方法以及相关技术进行分析和总结的基
无线传感网络(Wireless Sensor Networks,WSNs)具有的实时信息获取和易部署的特点使其受到了广泛关注,并在工业、医疗、军事、环境、家庭等领域得到越来越多的应用。然而,无线传