一种有效的分类型数据聚类方法

来源 :控制与决策 | 被引量 : 0次 | 上传用户:ISE7ENAK
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
鉴于传统的K-means聚类算法只限于处理数值型数据,将K-means算法扩展到分类型数据域,提出一种分类型数据聚类方法.根据与每个分类属性的每个值相关的数据分布信息,同时结合数据的纵向与横向分布来评价数据对象与类之间的差异性,定义了一种新的距离度量.该方法能发现同一属性不同值间的内在关系,并能有效地度量对象间的差异性.用UCI中的数据集对所提算法进行验证,实验结果表明了该算法具有较好的聚类效果. In view of the fact that the traditional K-means clustering algorithm only deals with the numerical data and extends the K-means algorithm to the classified data domains, a clustering data classification method is proposed. According to each value associated with each classification attribute Data distribution information, and at the same time to evaluate the difference between data objects and classes according to the vertical and horizontal distribution of data, a new distance measure is defined, which can find the intrinsic relationship between different values ​​of the same attribute and effectively Measure the difference between objects.Using the data set in UCI to validate the proposed algorithm, the experimental results show that the algorithm has good clustering effect.
其他文献
在研究Struts框架的基础上详细探讨了Struts框架的三个主要部分之间的内在联系和采用的处理方式,并阐述了基于MVC的Web应用软件开发框架Struts的工作原理和体系结构,并通过教
人才培养是个系统工程,其培养方案中培养目标的制定目前还缺乏成熟的方法和工具。本文结合参与制定改训学员培养方案的实践,针对联合作战保障人才的培养目标制定过程,基于能
紫外光(UV)激光因波长短、能量大、加工精度高等优点,被越来越多地应用到PCB微孔制作工艺中。文章研究了UV激光加工φ200μm的盲孔,通过正交试验分析了激光功率、加工速度、激
k中心点算法仅仅用一个点去代表整个类显然是不足的,这必然会影响聚类结果的准确性。因此提出了一种关系数据的中心权重模糊聚类算法,在该算法中给每一个属于这个类的对象赋
高中美术新课程改革提出,要在文化情境中来认识美术。美术课程逐步成为学生系统文化学科课程学习中一个必不可少的思维方式的开启课程。以文入道,把美术课上升成文化课,提升
以葱胞质雄性不育系CA及其同核异质保持系CB为试材,研究了花蕾发育过程中IAA、GA3、ZR、ABA含量以及细胞色素氧化酶(COD)和ATP酶(ATPase)活性、可溶性糖、游离氨基酸和可溶性蛋白
目的探讨蓝光照射联合白蛋白治疗新生儿黄疸的临床效果。方法选取2018年1月—2018年12月医院收治的136例新生儿黄疸患儿,按随机数字表法分为A组(68例)和B组(68例),A组采取蓝
黔东南有竹类植物15属45种(含1变种1变型),泛热带分布1属,热带亚洲至热带非洲分布1属,热带亚洲分布3属,东亚分布5属,中国特有分布5属.以温带属为主.
随着经济的不断发展,人们生活水平的不断提高,人们的环境保护意识越来越强,各地加强了对环境监测站的投入,环境自动监测系统也得到了较好的推广,本文主要是对环境自动监测系
对于小学数学教学而言,'画图策略'是学生解题过程中一个非常重要的策略,画图策略可以帮助学生将抽象化的问题变得具体化、直观化,有助于学生快速理解题意,实现解决问