论文部分内容阅读
随着电力系统的不断发展,电力系统产生的数据越来越多,给电力企业原有的数据处理系统带来了很大的挑战。近年来,云计算和大数据技术逐渐兴起,在互联网、电信、教育、政务等很多领域实现了应用,取得了很好的效果。本文研究基于云平台进行电力数据处理,主要包括两个方面的内容,一是设计并实现了一套基于云平台的电力业务处理方案,利用云平台的计算存储资源,处理海量电力数据,提高电力业务的处理效率;二是提出了一种电量消费数据(即用电记录)分类算法,区分正常用电数据和异常用电数据,为电力企业的合理决策提供支持。本文首先对电力业务进行了细致的分析,包括数据采集、数据计算、存储查询等,这些业务非常重要,要处理的数据量呈现快速增长的趋势,传统的电力业务处理方案面临很大的挑战。然后,在总结几类业务特点的基础上,提出了一套基于云平台的电力业务处理方案。该设计方案包括数据采集分发、在线处理、离线处理、存储查询、Web交互五个模块,依托云平台的存储、计算资源和大数据处理工具对电力数据进行全生命周期的处理。该设计方案可以有效应对电力数据的快速增长,完成电力业务。针对用电数据的分类问题,本文提出了一种改进的分类算法,该算法在逻辑回归的基础上引入“信息量”的概念,依照信息量的大小对用电数据的特征进行选取,信息量较大的特征作为逻辑回归的预测特征,这种方法在保证准确率的前提下,降低了分类算法的复杂度。最后,设计了三个方面的实验,分别对云平台、电力业务处理方案和数据分类算法进行测试。实验结果表明,云计算平台稳定可靠,电力业务处理方案能够在数据量高速增长的情况下完成相关电力业务,改进的数据分类算法具有良好的性能。