基于MapReduce的分布式云计算数据挖掘方法

来源 :安阳师范学院学报 | 被引量 : 0次 | 上传用户:whpzmfwy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
MapReduce为经典的分布式计算模型,是云计算环境下开展高效数据挖掘的有力支撑。为此,基于MapReduce搭建了分布式云计算框架,以K-means聚类算法为例,探寻一种高效处理大规模数据挖掘问题的方法。在传统MapReduce计算模型基础上,为执行Map函数操作的设备增加Combiner函数,以便一次性合并Map函数输出结果,减少多次合并操作,提升K-means聚类算法数据挖掘效率。测试结果显示,此算法在不同节点运算环境下的聚类时间开销最低,并且算法运行的稳定性较强,无显著波动情况。
其他文献
医疗人工智能已广泛应用于疾病筛查、辅助诊疗、医学影像、医疗机器人等领域,其在带来高效、精准、便捷服务的同时,也引发了一些伦理问题。在概述医疗人工智能应用的基础上,
产教融合是以高校、企业与政府合作机制下交叉合作育人,是应用型人才培养需求、交叉复合型人才培养深入的体现。学分互认体系是保障实现教育形式纵向沟通、横向衔接,搭建柔性
文化育人作为高校思想政治教育工作的重要组成部分,对于提高大学生文化素养和道德品质具有积极的促进作用.文章首先提出中华优秀传统文化在高校育人体系中的重要价值,阐述了
就公路工程施工投标报价存在的风险情况进行分析,并对风险的预防及降低报价的风险进行论述,对投标报价的准确性有一定参考。