一种优化的基于网格的聚类算法

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:dll4718133
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类是数据挖掘领域中一个重要的研究课题.与其它算法相比,基于网格的聚类算法可以高效处理低维的海量数据.然而,由于划分的单元数与数据的维数呈指数增长,因此对于维数较高的数据集,生成的单元数过多,导致算法的效率较低.本文基于CD—Tree设计了新的基于网格的聚类算法,该算法的效率远高于传统的基于网格聚类算法的效率.此外,本文设计了一种剪枝优化策略,以提高算法的效率.实验表明,与传统的聚类算法相比,基于CD-Tree的聚类算法在数据集的大小及维度的可伸缩性方面均有显著提高.
其他文献
工作流管理是计算机支持协同工作(CSCW)中的一个重要领域,工作流管理系统(WfMS)是支持用户实现在需求不断变化的应用环境中流程处理的高效中间件.本文提出了由服务层、通信层和客户
小鲵科的安吉小鲵,是1992年,杭州大学顾辉清教授与湘湖师大的楼信权教授在浙江安吉龙王山首次发现并命名的,为中国特有种。此后,在2000年,两位老师又在清凉峰(浙江面和安徽面
提出了一种基于聚类技术的多数据源记录匹配算法,该算法运用的罩盖(Canopy)聚类技术是一种专门对付大型数据的聚类方法,此算法不仅是一个与应用领域无关的算法,跟其它模型相
With the constant acceleration of globalization,cross-cultural communication has become an important part of people’ssocial activities.Spatial language is the
目的观察喜炎平注射液佐治小儿大叶性肺炎的疗效。方法2013年1月1日至2014年12月30日辽宁省彰武县妇幼保健院就诊的大叶性肺炎患儿60例,随机分为观察组32例和对照组28例。对照
"如果不幸被五步蛇咬了该怎么办?""嗯,这个好办。不是说被咬了之后可以走五步吗?那就把蛇抓住,走五步,然后再让蛇咬一口;再走五步,再让蛇咬一口……一直走到医院为止,哈哈哈
2005年8月15日,时任浙江省委书记习近平同志在浙江安吉余村考察时,首次提出"绿水青山就是金山银山"科学理念,2020年恰逢15周年。"两山"理念是习近平新时代中国特色社会主义思
目的综述中药名方加减在糖尿病及其并发症中的临床新应用。方法参阅近年来各种中医药文献进行综合整理。结论在中医辨证论治和异病同治的原则指导下,多种中药名方加减在糖尿