一种改进的k-means聚类算法(英文)

来源 :Journal of Southeast University(English Edition) | 被引量 : 0次 | 上传用户:qq414363439
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对k-means算法事先必须获知聚类数目以及难以确定初始中心的缺点,提出了一种改进的k-means聚类算法.首先引入轮廓系数的概念,通过计算不同K值下簇集中各对象的轮廓系数确定事先未知分类信息的数据集中所包含的最优聚类数Kopt;然后通过凝聚层次聚类的方法获得数据集的分布,确定初始聚类中心;最后利用传统的k-means方法完成聚类.理论分析表明,所提出的算法具有适度的计算复杂度.IRIS测试数据集的实验结果表明了该算法能够合理区分不同类型的簇集,且可以有效地识别离群点,聚合后的结果簇集具有较低的熵值. For k-means algorithm, we must know the number of clusters in advance and the shortcoming that it is difficult to determine the initial center. An improved k-means clustering algorithm is proposed. Firstly, the concept of contour coefficients is introduced. The contour coefficient determines the optimal cluster number Kopt contained in the data set of the unknown classification information in advance and then obtains the distribution of the data set through the method of agglomerative hierarchical clustering to determine the initial cluster center. Finally, the traditional k-means method is used to complete the poly The theoretical analysis shows that the proposed algorithm has moderate computational complexity.The experimental results of the IRIS test dataset show that the algorithm can reasonably distinguish different types of clusters and can effectively identify the outliers and the aggregated results Clusters have lower entropy values.
其他文献
随着经济的发展和社会的不断进步,我国档案事业也不断的发展,2004年,据国家统计局统计,全国综合档案馆共有3121个,馆藏档案达到15945万卷(件),全国综合档案馆每年接待利用档
正如电子计算机技术给人类文明进步带来的巨大冲击一样,电子文件作为电子计算机技术的伴生物,也给人类的记忆工程带来了深远的影响。电子文件由于其读写方式、特性以及内容与
党的十六届五中全会指出:“全体党员要坚定理想信念,坚持党的根本宗旨,兢兢业业地工作,坚定不移地为建设中国特色社会主义事业而奋斗”。精神是一种信念,是一种支柱。精神状
按照精神,武昌区加大了推进市民道德档案的工作力度,按照“立足实际、科学规划、便于操作、适宜应用”的原则,在开展此项工作上作了一些有益的尝试.
地处长城脚下的迁安市上庄乡农民,近年来改花生一西瓜一大豆三种三收为花生、冬瓜、西瓜、大豆四种四收,使经济效益又上一个新台阶。一般667nlz产西瓜4000ig、花生150k9、冬瓜3
近两年来,鄂州市档案局顺应时势,开拓创新,以“服务立档、科技兴档、素质强档”为指导,狠抓基础工程建设,不断强化服务意识、更新服务手段、拓宽服务领域、丰富服务内容、提
我有梨(庄河1号和金翠香)园800m2,因地势平洼易涝(夏季地下水位30~50cm,周围是水田),自1993年开始,在行间和树盘种旱稻(港复1号或C102)。建园前按3、5m×4m的株行距顺坡降把园地整成条
近几年来,南漳县档案工作坚持科学发展观,以服务“三个文明”建设为宗旨,以创新机制为重点,以依法治档为手段,以服务经济建设为主战场,与时俱进,开拓创新,努力实现“四化”:
对自然计算理念给出统一的框架描述,并以反馈式神经网络和群体智能算法为例加以具体论述.在所定义模型框架下,自然计算领域内算法中的相关智能体群表现出一种相对统一的智能
江苏沿海农区棉田棱套大麦自实行少。免耕法以来,大面积生产在很大程度上克服了常现耕种“发者不发小”的缺陷,但因其适合的栽培技术尚未系统配套,群体有“发小不发老”、生育后