论文部分内容阅读
互联网+ 时代, 信息交流和社交方式都发生了极大的变化, 自媒体的数据产生方式让大数据时代加速到来.Hadoop 云计算实现框架是大数据管理中最优的解决方案, 使用最为广泛,效果最为明显.文中针对运用云计算和云平台Hadoop 的知识, 对现有数据挖掘技术中的关联规则进行分析, 对经典Apriori算法进行梳理并提出了一种基于MapReduce 的改进Apriori数据挖掘算法.最后, 通过Hadoop 平台进行仿真实验, 算法用Java 实现, 通过对训练数据迸行挖掘, 结果表明改进算法在处理大数据时空