论文部分内容阅读
城市空气污染是当前人们生活中关注的焦点问题之一。随着空气污染物的成因愈加复杂,空气污染物的种类也日渐增加,如何综合运用监测的海量大数据对城市空气污染浓度进行分析预测,是当前许多研究领域都在探索的关键难题。已存在的空气污染物浓度的预测方法,可以分为基于非深度学习的传统预测方法和基于深度学习的预测方法。传统的预测方法主要面向小样本数据集,部分方法仍旧采用线性的回归方法进行预测,未能考虑到空气污染物浓度非线性变化的趋势;传统的机器学习法将非线性引入的预测过程,但是由于网络层少,只能对数据进行浅层学习,不能深度挖掘数据特征的时空关联;基于深度学习预测方法能够解决传统方法中的瓶颈问题,能对大数据进行有效集成,并且其独特的网络结构能够实现对污染物数据在时空维度的联动性分析。然而,当前基于深度学习预测空气污染物的研究工作还比较少,更少有为分析时空关联问题而针对性地采用不同的神经网络集成的研究,对数据集的特征维度不足也还未有有效的处理方式,同时,空间维度上周边城市的影响力度存在不一致性,现有工作大多是默认空间的效应是相同的。针对以往的研究工作的不足,本文聚焦于对空气污染物浓度进行时空双重维度的联动性分析和预测,提出了基于反卷积网络和LSTM集成的Dev-LSTM预测模型,同时,为了解决数据集特征稀疏的问题,提出了基于反栈式自编码器和Dev-LSTM集成的SDev-LSTM预测模型,并利用高斯函数,将周边城市对目标城市的空间影响的不一致性纳入预测体系,本文的主要工作包括:1)在Dev-LSTM模型中,首先给出了问题的定义和模型的框架;其次,给出了集成模型的反卷积网络和LSTM的具体结构,并详细说明反卷积网络提取空间维度特征关联的方式和LSTM提取时间维度关联的方式;最后,定义模型训练时的损失函数,并详细说明了模型的训练步骤和微调的过程;2)在SDev-LSTM模型中,首先给出了问题的定义和模型的框架;其次,利用高斯函数计算周边城市的影响力度并纳入预测体系,再给出反栈式自编码器的具体结构,并详细说明反栈式自编码器进行数据维度扩充的原理及其预训练的方式;最后,说明了反栈式自编码器同Dev-LSTM模型集成SDev-LSTM模型的方法和训练、微调的过程;3)仿真实验表明,基于神经网络集成的Dev-LSTM和SDev-LSTM预测模型的性能优于经典的模型,在空气污染物预测方面具有更高的应用价值;同时,分析了Dev-LSTM和SDev-LSTM预测模型可以适用于不同的情况,从而进一步区分了两个模型的性能。