论文部分内容阅读
近年来,随着城乡居民生活水平显著提高,人们对于配电网供电可靠性的要求日益提高,然而电力公司只能被动应对配电网故障,这使得配电网可靠性的提升存在瓶颈。实现配电网故障预测可为电力公司提供配电网运营维护决策支持,具有重大的经济和社会效益。国内相关研究尚不深入,国外研究相对深入,但在我国应用具有很大的局限性。因此,本文研究了基于数据挖掘技术的配电网故障预测方法,针对电力公司实际需求预测了馈线的月故障等级,并提出将馈线故障预测结果应用与抢修驻点优化的方法。首先,本文全面分析馈线故障影响因素,对某市的配电网信息系统进行深入调研,提取馈线故障预测所需数据,为馈线故障预测奠定基础。针对原始数据可能存在的质量问题,开发程序包对原始数据进行清洗、变换和集成。另外提出了一种基于聚类的离群样本诊断方法,该方法引入轮廓值法确定最佳聚类数,采用粒子群优化算法优化聚类中心,可有效提升聚类效果,从而准确剔除离群样本,避免了离群样本对预测模型的不良影响。其次,本文利用数据探索分析方法剔除冗余、非强相关的故障特征变量,初步确定了故障相关特征变量集。并采用特征选择方法从故障相关特征变量集筛选出最优故障特征变量子集,从而合理确定馈线故障预测模型的输入变量,避免输入变量选择不当导致的模型预测准确率下降。再次,本文针对电力公司实际需求和模型优化要求对馈线的月故障发生的次数划分等级,提出了预测馈线月故障等级的方法。方法采用具有调节参数少、泛化误差有上限和可避免过拟合等突出优点的随机森林算法构建馈线故障预测模型,并优化了随机森林算法的分类树构建过程和关键参数。模型对馈线月故障等级的预测准确率高达92.92%。同时,通过建立基于C4.5决策树、支持向量机和人工神经网络算法的馈线故障预测模型进行比较,发现本文构建的馈线故障预测模型的预测准确率明显较高,证明了随机森林算法用于构建馈线故障预测模型的正确性和有效性。最后,论文考虑抢修到达时间等约束条件,以抢修驻点与其负责的各馈线的距离总和最小为优化目标函数,构建基于馈线故障预测结果的抢修驻点位置优化模型。针对大多数现代优化算法的参数难以选取的问题,引入对初始化参数依赖程度低的模拟植物生长算法,并在改进后用于模型的优化求解。实例表明,基于馈线故障预测结果的抢修驻点位置优化新方法相对传统方法能够有效提高抢修效率。