论文部分内容阅读
随着人类智慧的发展、科学技术的不断创新,新旧技术的更新换代,使得通信技术领域也有了一定程度的提升,这使得人们能够在日常生活中,通过不同的渠道获取各种类型的信息,同时这些信息也通过不同手段被转化为各种数字形式呈现并传递。同样的,随着技术水平的不断上升,电力服务的发展和电力市场的兴起,相关电力企业的各类数据也越来越数字和信息化。智配电网使电力行业收集的数据量从TB增长到PB。终端更频繁地收集数据,使得数据的形式更广泛,加上行业朝着智能、精益开发的趋势发展,异构数据集成,数据量的增长带来了对其快速高效处理的迫切需求。高可伸缩性以及高效,准确的负荷模式分析和处理等挑战也已然成为数据挖掘研究的前沿。因此,充分发挥机器学习中人工智能和数据挖掘算法的作用,能够及时对海量电力数据进行处理,并从中获得有价值的信息。对电力负荷大数据进行准确、高效的负荷模式识别,是支持电网安全可靠经济运行不可缺的基础工作。目前海量电力负荷数据高维特征量处理较为困难,为顺应实际应用对电力负荷模式识别效率和准确率的要求,本文提出一种基于特性指标降维和改进熵权法的电力负荷模式识别算法。首先,介绍了研究电力负荷模式识别的目的及意义,对国内外学者在有关方面的研究进行归纳,给出了电力负荷模式识别模型的流程。在当前大数据时代,智能电网背景下电力负荷数据可通过不同渠道获得,其具有多维、异构等特点。强调了对海量负荷数据进行数据处理的重要性并对几种数据处理方法进行介绍。与此同时,数据处理过后还需要进行降维处理,以减少存储空间,提高算法效率。阐述了降维技术的分类并对其原理和特点进行进一步的解释和说明。其次,电力负荷的模式识别需要负荷数据的分类标签,这一过程需要聚类算法来实现。介绍了聚类算法的思想及分类,并对几种常见的聚类算法进行了分析和说明,最终选择K均值聚类算法用于后续算例分析。为了确定最佳聚类数还需要对聚类质量进行评估。给出了几种常见的聚类评价指标,并针对所选算法对谱系聚类及K均值聚类的评价函数做进一步说明。随后,运用分类算法完成电力负荷模式的识别。介绍了分类算法的原理及分类,给出了几种常见的分类算法,并对它们的思想和特点进行归纳总结,最终选择了K近邻算法用于算例分析。最后,结合前几部分的研究,针对提出的算法进行算例验证分析。采用模拟负荷数据对K均值的负荷模式提取算法进行验证,结果表明K均值聚类算法可以有效地对电力负荷模式进行提取并得到分类标签。在此基础上,验证了K近邻算法能够对负荷模式进行识别,由此证明了算法提出的有效性。考虑到高维数据对算法产生的影响,进一步研究负荷降维的重要性。分别采用特征选择和特征提取两种方法对实测负荷数据进行降维,并将降维后的数据作为输入用于K均值聚类算法,最终与传统聚类算法进行对比,结果表明特征选择的降维方法聚类质量最好,同时算法效率最高。在前三个算例分析基础上,对提出基于特性指标降维和改进熵权法的负荷模式识别算法进行验证,电力负荷数据通过特征选择得到日负荷率、最高利用小时率、日峰谷差率、峰期负载率、平期负载率、谷期负载率等6个日负荷特性指标来完成降维,其次引入改进熵权法配置特性指标权重系数,然后采用手肘法确定最佳聚类数,通过加权欧式距离的K均值聚类方法得到分类标签,最后利用K近邻算法对标签和6个特性指标进行电力负荷模式识别,采用基于混淆矩阵的方法对所提出的模型进行评估。算例结果表明,基于特性指标降维和改进熵权法的负荷模式识别算法较传统算法模型效果好,在效率和精度上均有提高。