一种有效的分类型数据聚类方法

来源 :控制与决策 | 被引量 : 0次 | 上传用户：ISE7ENAK

【摘要】

：

鉴于传统的K-means聚类算法只限于处理数值型数据,将K-means算法扩展到分类型数据域,提出一种分类型数据聚类方法.根据与每个分类属性的每个值相关的数据分布信息,同时结合数

【作者】

：

罗可洪亮亮童小娇

【机构】

：

长沙理工大学计算机与通信工程学院,

【出处】

：

控制与决策

【发表日期】

：

2011年10期

【关键词】

：

聚类分析分类型数据差异性域值共生

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

鉴于传统的K-means聚类算法只限于处理数值型数据,将K-means算法扩展到分类型数据域,提出一种分类型数据聚类方法.根据与每个分类属性的每个值相关的数据分布信息,同时结合数据的纵向与横向分布来评价数据对象与类之间的差异性,定义了一种新的距离度量.该方法能发现同一属性不同值间的内在关系,并能有效地度量对象间的差异性.用UCI中的数据集对所提算法进行验证,实验结果表明了该算法具有较好的聚类效果. In view of the fact that the traditional K-means clustering algorithm only deals with the numerical data and extends the K-means algorithm to the classified data domains, a clustering data classification method is proposed. According to each value associated with each classification attribute Data distribution information, and at the same time to evaluate the difference between data objects and classes according to the vertical and horizontal distribution of data, a new distance measure is defined, which can find the intrinsic relationship between different values of the same attribute and effectively Measure the difference between objects.Using the data set in UCI to validate the proposed algorithm, the experimental results show that the algorithm has good clustering effect.

其他文献

基于MVC模式的Structs框架的研究与实现

在研究Struts框架的基础上详细探讨了Struts框架的三个主要部分之间的内在联系和采用的处理方式,并阐述了基于MVC的Web应用软件开发框架Struts的工作原理和体系结构,并通过教

期刊

MVCStructs框架论文信息管理系统

基于能力素质模型的联合作战保障人才培养目标设计方法研究

人才培养是个系统工程,其培养方案中培养目标的制定目前还缺乏成熟的方法和工具。本文结合参与制定改训学员培养方案的实践,针对联合作战保障人才的培养目标制定过程,基于能

期刊

能力素质模型人才培养方案联合作战保障人才

紫外光激光加工盲孔的工艺研究

紫外光（UV）激光因波长短、能量大、加工精度高等优点,被越来越多地应用到PCB微孔制作工艺中。文章研究了UV激光加工φ200μm的盲孔,通过正交试验分析了激光功率、加工速度、激

期刊

紫外光激光印制电路板正交试验盲孔

关系数据的中心权重模糊聚类算法

k中心点算法仅仅用一个点去代表整个类显然是不足的,这必然会影响聚类结果的准确性。因此提出了一种关系数据的中心权重模糊聚类算法,在该算法中给每一个属于这个类的对象赋

期刊

中心权重模糊划分关系数据非相似性

浅析艺术教育中“以文入道”教学方法——把美术鉴赏课上成趣味文化课

高中美术新课程改革提出,要在文化情境中来认识美术。美术课程逐步成为学生系统文化学科课程学习中一个必不可少的思维方式的开启课程。以文入道,把美术课上升成文化课,提升

期刊

新课程教学以文入道美术鉴赏课趣味文化课

葱胞质雄性不育花蕾生化物质含量和能量代谢酶活性的动态变化特征

以葱胞质雄性不育系CA及其同核异质保持系CB为试材,研究了花蕾发育过程中IAA、GA3、ZR、ABA含量以及细胞色素氧化酶（COD）和ATP酶（ATPase）活性、可溶性糖、游离氨基酸和可溶性蛋白

期刊

葱胞质雄性不育系内源激素营养物质含量ATP酶活性

分析蓝光照射、白蛋白治疗新生儿黄疸效果

目的探讨蓝光照射联合白蛋白治疗新生儿黄疸的临床效果。方法选取2018年1月—2018年12月医院收治的136例新生儿黄疸患儿,按随机数字表法分为A组(68例)和B组(68例),A组采取蓝

期刊

白蛋白蓝光照射胆红素新生儿黄疸生理性黄疸病理性黄疸

黔东南竹类植物区系分析

黔东南有竹类植物15属45种（含1变种1变型）,泛热带分布1属,热带亚洲至热带非洲分布1属,热带亚洲分布3属,东亚分布5属,中国特有分布5属.以温带属为主.

期刊

黔东南竹种植物区系

自动监测系统在环境监测中应用

随着经济的不断发展,人们生活水平的不断提高,人们的环境保护意识越来越强,各地加强了对环境监测站的投入,环境自动监测系统也得到了较好的推广,本文主要是对环境自动监测系

期刊

环境自动监测系统基层环境监测站

小学数学教学中运用“画图策略”解决问题的探究

对于小学数学教学而言,'画图策略'是学生解题过程中一个非常重要的策略,画图策略可以帮助学生将抽象化的问题变得具体化、直观化,有助于学生快速理解题意,实现解决问

期刊

小学数学画图策略解决问题

一种有效的分类型数据聚类方法

其他学术论文