论文部分内容阅读
改革开放以来,中国经济迅猛发展,能源消耗增速也十分惊人。与之相对应,我国的生态环境不断恶化,其中空气污染问题尤其突出。研究表明,空气污染会对公共安全和健康产生不利影响。作为引发雾霾问题和影响人体健康的主要污染物,中国的细颗粒物(PM2.5)污染已经引起了科研工作者的密切关注。长期PM2.5时空变化规律可以为空气质量演化评估、疾病负担和主要工业区的排放趋势提供科学支撑,但是中国从2012年才逐渐实现对PM2.5的地面监控,在此之前的PM2.5污染状况尚未可知。因此,如何获取长期PM2.5浓度数据成为一项重要研究课题。由于卫星数据的缺失,基于AOD的PM2.5反演方法难以获取2000年以前的PM2.5数据,本研究基于PM2.5与能见度等气象因素之间内在的物理关系构建反演模型,主要包括参数回归模型和机器学习模型。通过逐步回归选取的解释变量包括能见度、温度、相对湿度、站点气压、风速和最大阵风风速。对气象站点建立半径为40km的圆形缓冲区实现PM2.5站点与气象站点的空间匹配,共有207个气象站点的缓冲区内存在PM2.5站点。模型10折交叉验证结果表明机器学习模型出现了一定程度的过拟合,支持向量回归、随机森林和人工神经网络的验证精度明显高于训练精度。而参数回归模型未表现出过度拟合,其中对数回归模型的表现最为理想,在训练集上,其R~2和RMSE分别为0.72和20.14μg/8)~3,在验证集上,其R~2和RMSE分别为0.69和21.04μg/8)~3。本研究通过增加训练样本的方式解决机器学习模型的过拟合问题,对属于同一省级(直辖市)行政区划的站点进行建模,结果表明训练样本数量的增加能够在一定程度上解决模型的过拟合问题,但就训练时间和拟合效果而言仍然不及对数回归模型。因此,本文利用对数回归逐站点建立模型反演了中国207个气象站点1980-2016年间的PM2.5浓度。本研究进一步分析了PM2.5的时空模式以及其与社会经济因素之间的关系。其结果如下:(1)1980-2016年期间,207个站点PM2.5浓度的平均水平为42.45μg/8)~3,标准差为18.89μg/8)~3;东经110-120度,北纬40度附近站点的平均PM2.5浓度相较其它站点更高;在所有分区中,北部的PM2.5污染最为严重,京津冀是PM2.5平均水平最高的城市群;(2)1980-2005年期间,站点PM2.5浓度的平均中心向东南方向逐渐移动,而2005年之后,其中心又表现出向西北方向移动的趋势;在研究期间内,PM2.5标准差椭圆的长短半轴均表现出缩减的趋势,标准差椭圆指向的变化分为四个阶段:顺时针-逆时针-逆时针-顺时针;(3)绝大部分站点(146/207)PM2.5浓度在1980-2016年期间表现为上升趋势,中国PM2.5浓度上升速率为0.277μg/(8)~3?year);南方的PM2.5浓度在此期间上升更快,中部在各分区中PM2.5浓度上升得最快,长江三角洲在各城市群中PM2.5上升得最迅速;(4)人口密度、非农业人口、区域生产总值、年用电量、工业生产总值、第一产业产值、第三产业产值和建成区面积均与PM2.5浓度表现出显著的相关性;而在不同分区中,这些因子与PM2.5浓度之间的具体关系存在差异。