论文部分内容阅读
随着城市化发展和工业化规模的壮大,各种有害物质的排放导致形成了空气污染问题,严重影响着城市居民的健康和日常生活。目前在许多城市已经建立了空气质量监测站,人们也越来越关注城市空气质量,在监测的同时,人们对预测未来空气质量的高要求也有所增加。针对空气污染物数据中存在的缺失值现象以及预测模型结构单一的问题,同时考虑到气象的快速变化对空气质量产生的影响。本文主要研究短期的(每小时)空气质量指数的预测,提出一种组合缺失处理方法,并构建基于深度循环神经网络(GRU-BPNN)的空气质量指数预测模型。主要工作包括:1)通过对空气质量指数(AQI)的深入研究,本文使用的数据不再是从空气质量监测站所获得的空气污染物的浓度值,而是根据空气质量指数的定义以及计算方法,将各个污染物的浓度值通过环境标准转换为各个污染物项目的空气质量分指数(IAQI),这样的数据转换便于进行后续的数据处理。2)部分空气质量监测站在某一时间段的数据由于某种原因会导致不同程度的缺失。针对当前的数据填补过程中忽略了空气质量指数的数据特性以及数据的缺失处理方法单一的问题,本文通过对缺失数据属性和缺失时长进行分析,提出了具有针对性的空气质量分指数的组合缺失处理算法。3)在组合缺失处理算法的基础上,选择将空气质量数据生成时间序列样本作为输入的循环神经网络,并考虑气象因素对空气质量的影响,通过对空气质量指数数据与气象数据进行相关性分析,引入带有相关性系数相对较高的气象序列数据的BP神经网络对预测结果进行优化。本文构建了6种深度循环神经网络和9种单一的网络结构模型进行训练,实现对空气质量指数的预测以及对预测结果进行空气质量指数等级的准确率评估。实验结果表明:所提出的均值替换与移动平均法的组合处理方法得到了较好的效果,集成的深度循环神经网络的预测结果要优于单一网络结构模型,其中基于MA-GRU-BPNN的预测模型对空气质量指数的预测准确率最高。