论文部分内容阅读
“十三五”时期,我国石油化工行业节能节水和低碳工作仍面临着严峻的挑战。能源消耗总量仍持续增长,资源利用率依然较低,节能边际效应将逐渐降低,完成指标任务尤其艰巨。集输系统作为油田生产中的重要环节更应将节能降耗放到首要位置,而在油田生产过程中积累了海量数据,大数据时代的到来为集输系统节能降耗带来了新的曙光。本文以某油田某联合站生产数据为支撑,借助Python平台,对海量数据进行预处理、聚类分析、关联分析和预测,进而提出节能降耗措施和能耗优化建议。首先对大数据分析所使用的聚类分析、关联分析和预测数据挖掘技术所有算法进行归纳总结,并结合集输系统的特点、生产数据的要求以及算法适用性对各类挖掘技术的算法进行筛选,从而得到适合于本文大数据分析的算法,并进行详细介绍。对于聚类分析选择K-means算法,对于关联分析选择Apriori算法,对于预测技术选择灰色预测和BP神经网络结合的算法。以某联合站各类设备的海量生产数据为基础,利用Python语言,结合大数据挖掘算法,编译出对应的程序来实现数据的预处理、聚类分析、关联分析和预测功能。数据的预处理包括数据的清洗和标准化,聚类分析即数据的离散化,将数据按照特定顺序和特定格式进行分类,将分类后的数据利用编译好的Apriori算法进行关联分析,得到影响设备能耗或者系统总能耗的影响因素,由此得出各类设备运行参数的设置范围进而优化系统能耗。最后,根据影响能耗的影响因子进行灰色预测和BP神经网络预测,得出未来能耗趋势,以此来对集输系统进行预警,提出节能降耗措施和建议。设计并开发了C/S结构的集输系统能耗优化分析平台,实现了数据的预处理、聚类分析、关联分析和预测功能。为油田集输能耗分析和优化提供了便利的工作环境,对油田数字化与实时信息技术的建设做出了尝试。