基于MapReduce的并行子空间聚类算法

来源 :科学技术与工程 | 被引量 : 0次 | 上传用户:Hatchet
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现有数据体量的迅速增长,超大规模中高维数据集的聚类问题变得越来越重要;而现有的子空间聚类算法大多是单机串行执行,处理此类问题效率极低。讨论了利用MapReduce对这类数据集进行并行聚类的方法,提出了基于MapReduce的抽样-忽略子空间聚类算法(sample-ignore subspace clustering using MapReduce,SISCMR)。该算法将串行聚类算法用作插件,具有很好的通用性。在人造和真实数据集上进行了大量实验,其中最大为0.2 TB的数据集在128个核心的集群中仅用
其他文献
摘要:针对各专业计算机网络课程,利用数据挖掘技术,运用Excel Idata工具对学生考试成绩进行数据挖掘和分析,以达到改进教学方法,提高教学质量的目的。对今后的计算机网络教学工作具有一定的指导意义。  关键词:数据挖掘;计算机网络;Excel;教学质量;粗糙集  中图分类号:G642 文献标识码:A 文章编号:1009-3044(2012)36-8753-03  计算机网络是高等学校有关专业的重
数据检索是数据库系统最重要的功能也是最终目的,但是用户使用GROUP BY子句、COMPUTE BY子句实现数据表的分组统计功能的时候,经常出现语法错误,并且混淆两个子句。经过研究,
在《黑龙江社会科学》创刊二十周年之际,特别邀请四位知名学者为本刊撰写纪念文章。作为一本地方社会科学院创办的期刊,在其走过的二十年风雨春秋里,始终抱着对学术的一贯执
罗素在他的摹状词理论中,从研究专名开始,即表示殊相的简单符号,而且这个符号没有进一步的符号,从而保证专名直接指向对象。然而指称对象的方式并不都是通过专名,还有摹状词,而为了
在马克思主义哲学发展史上,曾经出现了多种不同类型的马克思思想形象差异。在恩格斯那里就将马克思一生的理论探索概括为"两个伟大发现"。而经过列宁和斯大林,"马克思主义三个来
改革开放30年来,中国特色社会主义文化建设在哲学路向和发展战略上实现了重大转型。当今的文化建设在哲学路向上正朝着自由自觉和科学发展的轨道前行,发展战略上正向着建设社
中国农村改革发展的30年,也是农村制度创新和制度建设的30年。其中,家庭经营承包制、农产品价格放开、农村剩余劳动力转移、农业产业化经营、新型合作经济组织、农业支持保护制
通过对"当代中国马克思主义大众化"理解的不同观点的比较分析,可以看出,当代中国马克思主义大众化就是指从适应中国广大人民群众的需要出发,以通俗易懂的形式,使中国特色社会主
为了解决传统基于核相关滤波器(KCF)的跟踪算法难以有效处理目标尺度变化的难题,提出了一种新的融合快速准确估计目标尺度变化的核相关滤波跟踪算法。该方法首先利用目标尺度变化的连续性对目标的尺寸变化进行粗略估计,得到目标尺度变化的粗略值;然后进一步对目标尺度的更多可能变化进行精确搜索,提升目标尺度估计的准确性。在公开的复杂场景视频进行测试,比较了本文方法和原始KCF算法的实验效果,并且将本文算法和经典
我们把“使生命和历史有可能相互成全”的研究方法称为“生命化”的研究方法,这种方法强调研究主体的“生命在场”,强调对象的“历史事实在场”,强调以上两种在场基础上所达到的