基于模糊矩阵的聚类融合

被引量 : 0次 | 上传用户:robertrobertrobert
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析是在探索性数据分析领域尤其在数据挖掘和知识发现的一种重要方法,并且被成功应用于工程,生物学,心理学,药学,市场,等其他学科中。聚类通过抽象出数据中基本结构作为个体分组或者个体分层来组织数据。本文的主要工作是不仅在理论上并且通过matlab对比实验的方法详细分析研究了聚类融合算法,更重要的是提出了一种新的非常有效的聚类算法,这种聚类方法基于聚类融合。聚类融合是一个非常强大的工具,可以大大提高非监督分类方法的健壮性以及稳定性。聚类融合的目的是弥补单个聚类算法的缺陷,因为所有单个聚类对原数据都有不同程度的依赖以及不同输入参数和初始化对算法都会产生影响。聚类融合算法的基本思想是通过运行多次聚类算法,这些算法可以是相同算法不同参数,初始值或者不同数据取样,也可以是不同算法,然后得到多次聚类的结果,一般是带有聚类标签的数据结构,聚类融合的任务是由这个数据结构产生最终的聚类分割,这一过程称为”共识函数”。聚类融合和普通聚类算法的最大不同之处在于普通聚类的对象是数据集,考虑问题的要素是数据集的性质,而聚类融合的对象是普通聚类算法产生的结果,考虑的问题摆脱了数据的分布而是如何最大化共享这些结构信息。聚类融合可以看作是对聚类算法进行的”聚类”。然而找到一个合适的共识函数是聚类融合中最大的难题,目前常用的共识函数有基于相似度矩阵,基于超图分割,相互信息,还有基于统计的方法。这些方法大部分都是利用聚类标签作为共识函数的输入,然而标签向量是硬划分聚类算法的结果,本文依据概率统计的基本原理,采用模糊聚类作为生成算法以及产生的模糊矩阵作为共识函数的输入。通过运行多次模糊聚类算法或者类似的软划分算法得到模糊矩阵,然后由数据点隶属度独立性假设,推导出数据对象的先验概念密度,建立有限混合模型,并且利用EM算法估计出数据对象属于每一个模式的数学期望。本文提出的算法具有非常优良的聚类效果。本文做了大量的计算机实验旨在证明算法在不同数据分布上的有效性。实验采用了标准UCI机器学习数据集,结果表明了算法比别的融合算法聚类正确率更高。
其他文献
在传统翻译思想中,译作与原作一直处在一种不平等的二元对立中,这是受西方形而上学传统哲学的影响。西方传统哲学的核心是二元对立。从苏格拉底、柏拉图到康德,列维-斯特劳斯
目的为了提高孕妇缺铁性贫血的治疗效果并改善围产儿结局,分析采用健脾生血颗粒治疗的价值和意义。方法在本中心2017年8月~2018年8月治疗的缺铁性贫血孕妇中随机选78例作为研
梁启超曾说:故今日之责任,不在他人,而全在我少年。少年智则国智,少年富则国富,少年强则国强……。在朝气蓬勃的海事事业中,赢得青年就赢得未来和希望。上海海事局党组在日常
社会治理创新是保证我国社会文明的基础,在社会治理创新过程中需要完善我国的劳动社会保障制度。近年来,我国劳动社会保障制度发展相对迅速,但与发达国家相比还存在一定差距,
以某大型液压挖掘机作为研究对象,其设计中采用多排螺栓组将底架和履带梁固定,利用Pro/E软件建立各部件三维模型,转换格式并导入ADAMS软件中,添加约束完成液压挖掘机虚拟样机模型
社会经济新闻属于社会新闻与经济新闻的中间领域,记者在采写中需要注重一些技巧的把握,就会做得鲜活又好看,很容易成为一份报纸或者新媒体的“看点”。
目的探讨造血生长因子治疗成人再生障碍性贫血(AA)伴严重感染的临床效果。方法选取2013年8月至2015年8月辽阳市第三人民医院收治的成人AA伴严重感染患者86例为研究对象,按随
<正>2月27日,辽源市委书记、市脱贫攻坚领导小组组长柴伟主持召开市脱贫攻坚领导小组2019年第一次会议。会议审议通过了《辽源市脱贫攻坚领导小组工作规则》《辽源市驻村干部
目的:探讨Toll样受体9(Toll-like receptor,TLR9)在UVB诱导的HaCaT细胞光老化模型中对下游信号分子的调控作用。方法:UVB光照建立HaCaT人永生化角质形成细胞光老化模型。实验
本文利用“蒙古语标准音语音声学参数数据库”和“蒙古语动态腭位参数数据库”,统计分析了蒙古语标准音[s]、[∫]、[x]等清擦音在词中的分布规律和生理、声学特点,并举例阐述