论文部分内容阅读
2013年环保部公布各城市PM2.5浓度数据以来,雾霾、空气污染问题受到越来越多的关注,同时积累了大量的空气质量数据。空气中污染物有多种,其中主要关注的是PM2.5。而气象是一种重要的空气质量影响因素,多种气象条件往往同时出现,对空气质量共同产生作用,气象对空气质量的影响是多方面的。由于数据量的急剧增多,传统统计方法受到限制。通过使用数据挖掘的方法,可以从大型数据集中发现数据特征,为进一步深入研究提供基础。本文以福州市2014-2018年数据为例,试图从数据驱动的数据挖掘出发,发现数据中的规律,然后从气象与空气污染物整体、重点两个层面研究气象因素对空气质量的影响能力。主要工作有:首先利用关联规则分析方法挖掘、筛选气象条件与污染物浓度之间的强关联规则,这些规则可以反映福州市气象条件、空气质量指标之间的关联关系,可用于发现空气质量的主要气象影响因素;整体关系探索采用典型相关分析方法,分析气象整体对污染物整体浓度变化的解释能力;重点关注PM2.5浓度,拟合PM2.5浓度与气象条件、其他污染物浓度回归函数,比较参数回归方法和非参数回归方法的效果。主要结论有:大多数关联规则中较高的温度、较低的PM2.5浓度、较低的风速存在强的关联关系,说明温度对空气质量影响明显;典型相关分析发现气象条件整体可以解释空气污染物浓度整体变化方差的30%。可以解释NO2变化的56.8%,CO的28.9%,O3的7.8%,PM10的15.7%,PM2.5的47.7%;非参数回归效果更优,即非参数回归能更好地解释变量间的复杂关系。