一种改进的k-means聚类算法(英文)

来源 :Journal of Southeast University(English Edition) | 被引量 : 0次 | 上传用户：qq414363439

【摘要】

：

针对k-means算法事先必须获知聚类数目以及难以确定初始中心的缺点,提出了一种改进的k-means聚类算法.首先引入轮廓系数的概念,通过计算不同K值下簇集中各对象的轮廓系数确定

【作者】

：

夏士雄李文超周勇张磊牛强

【机构】

：

中国矿业大学计算机科学与技术学院,中国矿业大学计算机科学与技术学院,中国矿业大学计算机科学与技术学院,中国矿业大学计算机科学与技术学院,中国矿业大学计算机科学与技术学院徐州221008,徐州2210

【出处】

：

Journal of Southeast University(English Edition)

【发表日期】

：

2007年03期

【关键词】

：

算法聚类 k-means算法轮廓测试数据集 k-means 数据集离群点轮廓系数初始聚类中心

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

针对k-means算法事先必须获知聚类数目以及难以确定初始中心的缺点,提出了一种改进的k-means聚类算法.首先引入轮廓系数的概念,通过计算不同K值下簇集中各对象的轮廓系数确定事先未知分类信息的数据集中所包含的最优聚类数Kopt;然后通过凝聚层次聚类的方法获得数据集的分布,确定初始聚类中心;最后利用传统的k-means方法完成聚类.理论分析表明,所提出的算法具有适度的计算复杂度.IRIS测试数据集的实验结果表明了该算法能够合理区分不同类型的簇集,且可以有效地识别离群点,聚合后的结果簇集具有较低的熵值. For k-means algorithm, we must know the number of clusters in advance and the shortcoming that it is difficult to determine the initial center. An improved k-means clustering algorithm is proposed. Firstly, the concept of contour coefficients is introduced. The contour coefficient determines the optimal cluster number Kopt contained in the data set of the unknown classification information in advance and then obtains the distribution of the data set through the method of agglomerative hierarchical clustering to determine the initial cluster center. Finally, the traditional k-means method is used to complete the poly The theoretical analysis shows that the proposed algorithm has moderate computational complexity.The experimental results of the IRIS test dataset show that the algorithm can reasonably distinguish different types of clusters and can effectively identify the outliers and the aggregated results Clusters have lower entropy values.

其他文献

综合档案馆的价值链再造

随着经济的发展和社会的不断进步,我国档案事业也不断的发展,2004年,据国家统计局统计,全国综合档案馆共有3121个,馆藏档案达到15945万卷(件),全国综合档案馆每年接待利用档

期刊

档案馆国家统计局接待利用馆藏档案档案事业传承人文化经济角色

论电子文件管理中的提前介入

正如电子计算机技术给人类文明进步带来的巨大冲击一样,电子文件作为电子计算机技术的伴生物,也给人类的记忆工程带来了深远的影响。电子文件由于其读写方式、特性以及内容与

期刊

电子计算机技术文件管理电子文件文件与档案管理观念和方法重新思考文明进步记忆工程伴生物中行纸质载体特性理念革命

档案工作者要保持良好的精神状态

党的十六届五中全会指出:“全体党员要坚定理想信念,坚持党的根本宗旨,兢兢业业地工作,坚定不移地为建设中国特色社会主义事业而奋斗”。精神是一种信念,是一种支柱。精神状

期刊

档案工作者建设中国特色社会主义党的十六届五中全会精神状态理想信念党的根本宗旨心理活动人的智慧成就事业宝贵财富素质潜能党员

建立市民道德档案推进社区和谐建设--武昌区开展市民道德档案建设工作情况回顾

按照精神,武昌区加大了推进市民道德档案的工作力度,按照“立足实际、科学规划、便于操作、适宜应用”的原则,在开展此项工作上作了一些有益的尝试.

期刊

市民道德道德档案社区档案建设武昌区试点工作科学规划工作力应用操作

迁安市上庄乡改三种三收为四种四收获成功

地处长城脚下的迁安市上庄乡农民，近年来改花生一西瓜一大豆三种三收为花生、冬瓜、西瓜、大豆四种四收，使经济效益又上一个新台阶。一般667nlz产西瓜4000ig、花生150k9、冬瓜3

期刊

三种三收上庄乡饱果率浇水追肥丰收一号粗肥喷雾防治授粉期双膜育苗期

以改革促创新以服务求发展--鄂州市档案信息化建设纪实

近两年来,鄂州市档案局顺应时势,开拓创新,以“服务立档、科技兴档、素质强档”为指导,狠抓基础工程建设,不断强化服务意识、更新服务手段、拓宽服务领域、丰富服务内容、提

期刊

改革创新拓宽服务领域鄂州市档案局基础工程建设信息化建设议事日程科技兴档服务意识服务手段服务能力服务内容不断强化素质评价国家党组

涝地梨园种旱稻可免除草

我有梨（庄河1号和金翠香）园800m2，因地势平洼易涝（夏季地下水位30~50cm，周围是水田），自1993年开始，在行间和树盘种旱稻（港复1号或C102）。建园前按3、5m×4m的株行距顺坡降把园地整成条

期刊

树盘毒土播后覆土顺坡生时实践证明

开拓奋进争创“四化”--南漳县档案工作走上发展的快车道

近几年来,南漳县档案工作坚持科学发展观,以服务“三个文明”建设为宗旨,以创新机制为重点,以依法治档为手段,以服务经济建设为主战场,与时俱进,开拓创新,努力实现“四化”:

期刊

四化南漳县档案工作坚持科学发展观服务经济建设规范化标准管理科学化服务社会化资源建设与时俱进依法治档三个文明创新机制主战场信息化快车

自然计算——人工智能的有效实施模式

对自然计算理念给出统一的框架描述,并以反馈式神经网络和群体智能算法为例加以具体论述.在所定义模型框架下,自然计算领域内算法中的相关智能体群表现出一种相对统一的智能

期刊

自然计算总体模式群体智能算法神经网络人工智能定义模型智能计算群体智能实施模式方法库

棉田棱套大麦早衰的形成及其防治

江苏沿海农区棉田棱套大麦自实行少。免耕法以来，大面积生产在很大程度上克服了常现耕种“发者不发小”的缺陷，但因其适合的栽培技术尚未系统配套，群体有“发小不发老”、生育后

期刊

次生根亩播量土壤供肥籽粒品质规范化栽培麦苗生长高产优质高效丰产试验后期早衰剑叶

一种改进的k-means聚类算法(英文)

其他学术论文