论文部分内容阅读
现代城市是人口高度聚集的地区,人口是城市中最具活力和创新的要素。伴随着城市精细化管理的需要,掌握详细的人口空间分布情况成为城市进行科学有效管理的基础条件。重庆市是位于我国西部地区的特大城市,凭借良好的区位和政策优势,其发展潜力吸引了众多人口快速聚集,这也为城市快速发展提供了强大动力。但人口职住不平衡与交通拥堵等问题让城市的可持续发展面临挑战。因此,对城市人口分布的系统监测可为特大城市的精细化管理提供基础且可信的参考。基于多尺度的人口空间化数据在满足不同社会领域对于人口数据的需要时发挥着重要作用。在城市规划领域,高分辨率的人口分布数据有利于分析公共设施的人群覆盖范围,促进公共资源的优化配置。另外,突发自然灾害或者流行疾病时,政府部门可以针对受灾地区和感染区域的人口分布状况采取不同的营救和应急处理措施,接着对灾后人员和经济损失进行评估。在生态环境保护方面,不同格网分辨率的人口分布数据对于研究多尺度的生态系统有较大影响。因此,本研究致力于探索一套实用可靠且适用于重庆市的多尺度人口空间化建模方法。现有的人口数据多经由政府统计部门进行发布,以行政区划为基础的人口数据在行政单元内部呈现出整体性,无法体现其人口分布的异质性。因此,需要提取影响人口分布的因素建立模型,对统计型的人口数据进行降尺度处理,得到不同空间尺度上格网人口数量。以往的研究多通过空间插值或者多元回归的方法建立模型,最终的人口数据产品较为粗糙。随着数据来源的丰富和建模技术的创新,人口空间化研究取得突出进展。传统的遥感数据包括土地利用数据、夜间灯光数据和地形数据,加之新型的互联网和移动设备使用后产生的用户数据,使得人口建模的数据来源更加丰富,能更加敏锐地反映出人口分布的差异。随机森林方法是应用于人口空间化建模过程中的最新方法,具有建模精度高,预测能力强的优点。机器学习的方法有助于研究人员进一步探索建模因子影响人口分布的内在机制,为制定合适的人口管理政策提供科学理论支撑。地理现象具有较强的尺度效应,人口空间分布状况也因格网尺度不同会有较大差异。目前人口空间化过程中的多尺度研究较少,因此该研究方向值得进一步探索与突破。本文在总结前人的研究基础上,结合重庆市现实情况,以重庆市中心城区为研究区域,以建立多尺度城市人口空间化方法为目标,利用随机森林回归和多源数据融合的方法,对该地区2018年的街道和乡镇级别的人口统计数据进行尺度下推的人口空间化方法研究。本研究主要使用了多源地理空间数据,包括13类地图兴趣点数据、珞珈一号夜间灯光遥感数据、居住矢量图斑数据、城市道路数据、数字地形数据和真实街道人口调查数据。本研究首先将上述数据进行预处理,统一成栅格数据以便进行多源数据融合,之后将其放入到随机森林回归模型中,训练得出多尺度的人口分布权重图层,并最终获得了重庆市中心城区居住用地上常住人口分布数据集。本研究通过与部分真实的社区人口数量对比,主要利用误差分析和决定系数两种评价指标来度量人口预测精度,并以此选出最佳建模尺度。最后,通过三种重要程度分析方法和各个因子的部分依赖分析图,对建模因子影响人口分布的过程进行了详细解释分析。主要研究成果有以下两点:(1)首先以30m格网尺度为例,提取街道尺度上的变量均值作为建模因子,将街道的人口密度取对数后作为因变量,之后输入到随机森林回归人口预测模型中,并对随机森林的决策树数量和参与建模因子数量进行参数调整,获得最佳精度的人口分布权重估算模型,之后将权重图层与街道普查总人口图层相乘,最终输出重庆市中心城区30m格网尺度人口数据。依据此方法,我们得到了50m、100m、200m、300m、400m、500m、600m、700m、800m、900m、1000m格网大小的人口分布图层。之后与社区尺度的实有人口数据进行直接的结果验证和精度评价,最后发现100m空间分辨率下精度误差较小且拟合精度较高(R~2=0.59,p<0.01),因此将100m作为重庆市中心城区的最佳人口分布格网单元。(2)在完成模型训练及结果输出后,基于模型重要性程度和部分依赖分析的方法,运用特征重要性和预测结果变化值两个指标,定量分析各个影响因子在人口估算模型当中的贡献程度。一方面,在整体层面,运用不同的计算方法比较所有变量的重要性程度;另一方面,通过单一变量的影响细节分析,对参与建模的各个变量进行深入分析。通过分析我们发现:地图兴趣点中的生活服务设施点、餐饮设施点、居民点、教育培训设施点对于人口分布的贡献水平较高,而夜间灯光对于精细人口分布影响程度较小,自然因子高程和坡度对人口分布的重要性较微弱。当逐一分析各变量对于人口分布的重要程度时,人口密度会随着地图兴趣点密度增加而提高,但提高到一定水平后,人口密度会趋于平稳状态。夜间灯光数据对于人口预测值变化影响较小,呈现出先上升后下降的趋势。距离最近道路的距离、高程和坡度因子与人口密度呈现负向相关关系。本文提出了基于随机森林回归模型的多尺度城市人口空间化方法,可以得到较为直观和准确的人口分布数据,丰富了多尺度人口格网数据的创建与适宜尺度的选择方法,同时本研究创新探究出基于机器学习方法的变量解释分析方法,为定量分析人口分布影响因素提供了一定思路借鉴。由于建模数据来源的局限性,本文的研究主要关注静态人口空间化建模。考虑到城市人口具有较强的流动性,未来的研究可考虑加入时间尺度,利用更加丰富的时空数据源,动态分析人口空间分布变化状况。之后还可将随机森林与其他智能模型进行对比分析,探索出更加高效实用的人口空间化方法。