论文部分内容阅读
随着智能电网的不断建设和发展,在智能终端积累了大量基础用电数据,这些数据具有海量、高频、分散等特点,如何将其转化为有价值的知识以辅助电网企业进行数据分析和决策制定是目前智能电网领域亟待解决的重要问题。数据挖掘是一种能够将大规模数据转换成知识和结论的工具,这些知识和结论能够更好地帮助企业提高决策质量。因此,可以使用数据挖掘来对电网数据进行数据处理和挖掘。不过,传统的数据挖掘算法是基于单节点进行构建,随着数据量的不断增加,其数据存储和分析处理性能都会直线下降,无法满足大规模数据的处理需求。云计算技术具有分布式存储和并行计算等能力,它通过把多台廉价的普通PC机整合成云计算集群来实现海量数据的安全存储和高效处理,具有扩展性好,处理速度快等特点。所以考虑将云计算与数据挖掘算法相结合,来解决智能电网海量数据的转换问题。本文以云计算的hadoop平台为基础,将k-means算法、Canopy算法和LWLR算法部署到MapReduce框架上,实现了这三个算法的并行化。然后将两个聚类算法结合起来做了简单应用,用于电网企业用户用电行为分析。将并行化LWLR算法应用于日负荷预测。这些实例应用得到的知识可以帮助电网制定决策。上述应用结果表明文中所用算法不仅可以实现MapReduce化,而且这些并行化的算法对电网海量数据的处理具有有效性。