论文部分内容阅读
现在PM2.5已经为我们所熟知,它的危害是很广泛的,其中最主要的危害体现在下面两个方面。其中一方面是PM2.5这种物质能够进入人体的肺部、呼吸系统甚至心血管系统内,进而对人体的身体健康进行破坏。另一方面就是导致现在常见的雾霾天气的重要因素是PM2.5的存在,而出现的这种天气状况给人们的社会生活带来了非常恶劣的影响。所以对北京地区细颗粒物进行深入的研究是非常有意义的。本文以北京市PM2.5及其前体污染物数据和同期气象数据为基础,通过特征提取分析研究了北京地区细颗粒物的分布特征以及不同的气象条件对它的质量浓度的影响。随后,将多元统计方法中的主成分分析方法应用于PM2.5污染研究过程中,建立了北京市PM2.5重度污染预报模型。本论文的主要研究内容如下:1、通过统计分析研究期间北京市PM2.5及其同期气象数据,从污染超标情况、日分布和季节分布等方面来了解北京地区的细颗粒物的情况,并利用特征提取分析了北京市PM2.5与相对湿度、风速、日照时数以及当地风场的相互影响关系。研究结果发现,2009年至2013年期间年均污染水平均在100μg.m3左右,秋冬季PM2.5污染水平明显高于春夏季节,日分布呈现早晚双峰现象。在高湿、静风的天气条件下,颗粒物易聚积,从而造成雾霾天气的形成,降低了日照时数。2、本文结合文献调研和数据条件等实际情况,确定了SO2、NO2、CO、O3、PM10、PM2.5、相对湿度、气温、气压和风速共10个变量作为北京市PM2.5重度污染预报模型建立所需要的基础变量。随后,对数据进行预处理:采用线性插补法对PM2.5及其前体污染物数据中的缺失值进行补充,而对于气象数据中的缺失值,在线性插补的基础上还采用基于回归的最大期望值算法来补充。3、以主成分分析和交叉验证为基础,本文提出了基于SPE统计量控制限异常数据识别的多级循环递进方法,对训练数据中异常数据进行了有效去除,保障了训练数据的有效性,并根据所获得的有效数据集建立了北京市PM2.5重度污染预报模型,使模型的准确预报率大幅提高。所建立的统计预报模型计算过程清晰,相较于复杂的数值预报模型而言,方便简单且预报准确率较高。模型最终确定的最佳主元个数为5,对应模型的主元累积方差贡献率为98%左右,正确预报率可达90%以上。此异常数据识别和PCA训练方法在目前的文献资料中未见报道。