论文部分内容阅读
随着电网智能化和信息化水平的不断提高,从电能生产到用户用电的每个环节都积累了大量的数据。通过聚类分析模型对用户的用电数据进行处理,可以获得区域内所有用户的负荷分布情况以及特定用户的典型负荷特性,对于负荷预测、电网建设规划、营销策略制定以及能源利用效率提升等都具有理论和实际意义。
用电数据在收集过程中常因为电力设备损坏、通信线路故障等原因产生离群点,对离群点进行分析可以快速对异常情况进行定位排查,同时离群点也会对聚类分析、负荷预测等工作的结果准确性产生影响,因此离群点的检测研究是后续工作的基础。本文利用数据场理论计算数据点间的加权距离,改进了密度峰值聚类算法关键参数的计算公式,解决原始密度峰值聚类算法对局部密度变化较大的数据集聚类效果较差问题,改进后的算法无需计算截断距离,使得离群点检测结果更加客观。将改进后的密度峰值聚类算法用于用电数据的离群点检测中,实验结果表明改进后的算法简化了聚类过程,并且能够更加准确地对离群点进行划分。
负荷特性分析是电力数据挖掘的一个重要应用场景,本文在利用数据场理论对密度峰值聚类算法进行改进的基础上,继续探索密度峰值聚类算法改进策略,以适应用负荷特性分析对聚类结果准确性的要求。针对传统K近邻算法的缺点,利用Kd树优化近邻点查找过程,使用逆K近邻算法对密度峰值聚类算法中局部密度计算公式进行改进,并使用二阶段数据分配策略解决了聚类簇中存在多个密度峰值以及连锁错分的问题。在均匀分布数据集与非均匀分布数据集聚类分析实验中,改进后算法的内外部评价指标和外部评价指标均优于传统的K均值算法、模糊c均值算法、DBSCAN算法和原始密度峰值聚类算法,证明了改进算法的有效性。
将改进后的基于逆K近邻的密度峰值聚类算法用于某区域内单个工业用户的负荷特性分析,首先绘制用电数据不同层次的分量聚类决策图,之后根据决策图得出每一层分量的聚类中心,计算出用户的典型日负荷曲线。按照同样的流程对某区域内不同行业的用户典型负荷曲线进行分析,最后根据聚类分析结果对某行业所有用户的典型负荷特性进行划分,证明了该算法的实用价值。
用电数据在收集过程中常因为电力设备损坏、通信线路故障等原因产生离群点,对离群点进行分析可以快速对异常情况进行定位排查,同时离群点也会对聚类分析、负荷预测等工作的结果准确性产生影响,因此离群点的检测研究是后续工作的基础。本文利用数据场理论计算数据点间的加权距离,改进了密度峰值聚类算法关键参数的计算公式,解决原始密度峰值聚类算法对局部密度变化较大的数据集聚类效果较差问题,改进后的算法无需计算截断距离,使得离群点检测结果更加客观。将改进后的密度峰值聚类算法用于用电数据的离群点检测中,实验结果表明改进后的算法简化了聚类过程,并且能够更加准确地对离群点进行划分。
负荷特性分析是电力数据挖掘的一个重要应用场景,本文在利用数据场理论对密度峰值聚类算法进行改进的基础上,继续探索密度峰值聚类算法改进策略,以适应用负荷特性分析对聚类结果准确性的要求。针对传统K近邻算法的缺点,利用Kd树优化近邻点查找过程,使用逆K近邻算法对密度峰值聚类算法中局部密度计算公式进行改进,并使用二阶段数据分配策略解决了聚类簇中存在多个密度峰值以及连锁错分的问题。在均匀分布数据集与非均匀分布数据集聚类分析实验中,改进后算法的内外部评价指标和外部评价指标均优于传统的K均值算法、模糊c均值算法、DBSCAN算法和原始密度峰值聚类算法,证明了改进算法的有效性。
将改进后的基于逆K近邻的密度峰值聚类算法用于某区域内单个工业用户的负荷特性分析,首先绘制用电数据不同层次的分量聚类决策图,之后根据决策图得出每一层分量的聚类中心,计算出用户的典型日负荷曲线。按照同样的流程对某区域内不同行业的用户典型负荷曲线进行分析,最后根据聚类分析结果对某行业所有用户的典型负荷特性进行划分,证明了该算法的实用价值。