基于随机森林算法的城市人口多尺度空间化研究

来源 :西南大学 | 被引量 : 0次 | 上传用户:frigate999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现代城市是人口高度聚集的地区,人口是城市中最具活力和创新的要素。伴随着城市精细化管理的需要,掌握详细的人口空间分布情况成为城市进行科学有效管理的基础条件。重庆市是位于我国西部地区的特大城市,凭借良好的区位和政策优势,其发展潜力吸引了众多人口快速聚集,这也为城市快速发展提供了强大动力。但人口职住不平衡与交通拥堵等问题让城市的可持续发展面临挑战。因此,对城市人口分布的系统监测可为特大城市的精细化管理提供基础且可信的参考。基于多尺度的人口空间化数据在满足不同社会领域对于人口数据的需要时发挥着重要作用。在城市规划领域,高分辨率的人口分布数据有利于分析公共设施的人群覆盖范围,促进公共资源的优化配置。另外,突发自然灾害或者流行疾病时,政府部门可以针对受灾地区和感染区域的人口分布状况采取不同的营救和应急处理措施,接着对灾后人员和经济损失进行评估。在生态环境保护方面,不同格网分辨率的人口分布数据对于研究多尺度的生态系统有较大影响。因此,本研究致力于探索一套实用可靠且适用于重庆市的多尺度人口空间化建模方法。现有的人口数据多经由政府统计部门进行发布,以行政区划为基础的人口数据在行政单元内部呈现出整体性,无法体现其人口分布的异质性。因此,需要提取影响人口分布的因素建立模型,对统计型的人口数据进行降尺度处理,得到不同空间尺度上格网人口数量。以往的研究多通过空间插值或者多元回归的方法建立模型,最终的人口数据产品较为粗糙。随着数据来源的丰富和建模技术的创新,人口空间化研究取得突出进展。传统的遥感数据包括土地利用数据、夜间灯光数据和地形数据,加之新型的互联网和移动设备使用后产生的用户数据,使得人口建模的数据来源更加丰富,能更加敏锐地反映出人口分布的差异。随机森林方法是应用于人口空间化建模过程中的最新方法,具有建模精度高,预测能力强的优点。机器学习的方法有助于研究人员进一步探索建模因子影响人口分布的内在机制,为制定合适的人口管理政策提供科学理论支撑。地理现象具有较强的尺度效应,人口空间分布状况也因格网尺度不同会有较大差异。目前人口空间化过程中的多尺度研究较少,因此该研究方向值得进一步探索与突破。本文在总结前人的研究基础上,结合重庆市现实情况,以重庆市中心城区为研究区域,以建立多尺度城市人口空间化方法为目标,利用随机森林回归和多源数据融合的方法,对该地区2018年的街道和乡镇级别的人口统计数据进行尺度下推的人口空间化方法研究。本研究主要使用了多源地理空间数据,包括13类地图兴趣点数据、珞珈一号夜间灯光遥感数据、居住矢量图斑数据、城市道路数据、数字地形数据和真实街道人口调查数据。本研究首先将上述数据进行预处理,统一成栅格数据以便进行多源数据融合,之后将其放入到随机森林回归模型中,训练得出多尺度的人口分布权重图层,并最终获得了重庆市中心城区居住用地上常住人口分布数据集。本研究通过与部分真实的社区人口数量对比,主要利用误差分析和决定系数两种评价指标来度量人口预测精度,并以此选出最佳建模尺度。最后,通过三种重要程度分析方法和各个因子的部分依赖分析图,对建模因子影响人口分布的过程进行了详细解释分析。主要研究成果有以下两点:(1)首先以30m格网尺度为例,提取街道尺度上的变量均值作为建模因子,将街道的人口密度取对数后作为因变量,之后输入到随机森林回归人口预测模型中,并对随机森林的决策树数量和参与建模因子数量进行参数调整,获得最佳精度的人口分布权重估算模型,之后将权重图层与街道普查总人口图层相乘,最终输出重庆市中心城区30m格网尺度人口数据。依据此方法,我们得到了50m、100m、200m、300m、400m、500m、600m、700m、800m、900m、1000m格网大小的人口分布图层。之后与社区尺度的实有人口数据进行直接的结果验证和精度评价,最后发现100m空间分辨率下精度误差较小且拟合精度较高(R~2=0.59,p<0.01),因此将100m作为重庆市中心城区的最佳人口分布格网单元。(2)在完成模型训练及结果输出后,基于模型重要性程度和部分依赖分析的方法,运用特征重要性和预测结果变化值两个指标,定量分析各个影响因子在人口估算模型当中的贡献程度。一方面,在整体层面,运用不同的计算方法比较所有变量的重要性程度;另一方面,通过单一变量的影响细节分析,对参与建模的各个变量进行深入分析。通过分析我们发现:地图兴趣点中的生活服务设施点、餐饮设施点、居民点、教育培训设施点对于人口分布的贡献水平较高,而夜间灯光对于精细人口分布影响程度较小,自然因子高程和坡度对人口分布的重要性较微弱。当逐一分析各变量对于人口分布的重要程度时,人口密度会随着地图兴趣点密度增加而提高,但提高到一定水平后,人口密度会趋于平稳状态。夜间灯光数据对于人口预测值变化影响较小,呈现出先上升后下降的趋势。距离最近道路的距离、高程和坡度因子与人口密度呈现负向相关关系。本文提出了基于随机森林回归模型的多尺度城市人口空间化方法,可以得到较为直观和准确的人口分布数据,丰富了多尺度人口格网数据的创建与适宜尺度的选择方法,同时本研究创新探究出基于机器学习方法的变量解释分析方法,为定量分析人口分布影响因素提供了一定思路借鉴。由于建模数据来源的局限性,本文的研究主要关注静态人口空间化建模。考虑到城市人口具有较强的流动性,未来的研究可考虑加入时间尺度,利用更加丰富的时空数据源,动态分析人口空间分布变化状况。之后还可将随机森林与其他智能模型进行对比分析,探索出更加高效实用的人口空间化方法。
其他文献
碳氮循环在农田生态系统营养物质循环中扮演着关键角色,同时碳氮循环也是地球化学循环的重要组成部分。土壤有机碳和土壤有机氮对作物生长发育及维持良好的土壤生态环境具有重要作用,然而土壤有机碳组分含量和有机氮组分含量易受到土壤类型、耕作管理模式和施肥方式等多种因素的影响,以及影响碳氮循环相关酶活性和相关基因丰度的微生物学机制尚不清楚。因此,本研究依托长期定位试验,以重庆地区典型的紫色土土壤为研究对象,对比
铜(Cu)、锌(Zn)、铁(Fe)、锰(Mn)、硼(B)是植物必需的微量营养元素,供给不足或过多,都会影响植物的正常生长发育,进而影响农作物的产量和品质。土壤中微量元素的含量分布受到多种环境因子的综合影响,清晰掌握其含量分布特征及影响因素对于微量元素肥料的施用具有重要意义。本文根据近年来在重庆市采集的479个耕地土壤剖面,分析土壤有效铜、锌、铁、锰、硼在不同土壤层次(0-20cm、20-40cm、
硝化作用是氮(N)素循环的重要环节。硝化作用的底物和最终产物都是微生物和农作物生长的重要来源,又可以通过反硝化过程或者厌氧氨氧化过程造成氮气(N2)挥发或者硝态氮的淋洗方式而导致损失。所以研究硝化作用过程对提高土壤的氮肥利用率及降低氮素损失具有重要作用。经典硝化作用是由氨氧化微生物(Ammonia-oxidizing archaea,AOA和Ammonia-oxidizing bacteria,A
三峡库区支流水体富营养化逐年恶化,对库区及长江下游人民生产发展、饮用水安全以及生态环境的可持续都造成极大影响,现有研究表明,点源污染如企业排污点、城市排水口等受到较好的控制,而农业面源污染逐渐成为库区水环境富营养化严重的罪魁祸首,如何科学防治库区农业非点源成为学术研究的热点。2003年三峡大坝全线建成,蓄水后水体的流速变缓,自净能力降低,如若不采取措施,会加剧库区的水质污染,从而制约区域经济和社会
目前许多果园仍然采用清耕管理模式,导致果园土壤有机碳含量较低,影响果实产量和品质,如何提高果园土壤有机碳含量,已成为急需解决的问题。绿肥作为清洁的有机肥源,能够向土壤输送丰富的有机碳源,起到培肥地力,固碳减排的作用。但绿肥作物覆盖时间、初始土壤有机碳含量、绿肥类型和果园地形条件等因素对土壤有机碳含量的影响仍不清楚;绿肥对土壤温室气体排放以及果园系统有机碳组分的变化特征的影响尚不明确。为此,本文首先
县城,作为全县的政治、经济、文化中心,对全县发展的重要性不言而喻,其地址的变迁对全县乃至周边地区都是一件大事。本文以新中国时期(1949年10月1日至2019年10月1日)迁址的县城作为研究对象,查阅相关文献,梳理史料,得出相应的结论。首先,理清新中国时期县城迁址的事实:新中国成立后的70年间,总共有401个县级政区迁址县城,各个地区、各个时期皆有之。空间分布上除西南地区分布较多以外,其余地区数值
伊朗国家形成之初,多民族的现实一直存在于其历史发展之中,并对其国家进程产生深刻的影响,妥善处理少数民族问题成为伊朗统治得以维系的重要因素之一,也成为伊朗构建多民族统一国家的重要渠道之一,在19世纪之前多位统治者的努力下,伊朗的统一国家意识逐渐形成。到19世纪末20世纪初,伊朗社会面临巨大的国际国内变革,在巴列维王朝两代君主,以及伊朗伊斯兰共和国治下,伊朗的少数民族的身份逐渐从民族分离主义因素转换变
水土流失及不合理施肥造成的面源污染是三峡库区目前需紧迫解决的生态环境问题之一。三峡库区的空间位置、社会经济情况、人口分布等问题使农业面源污染的治理更加困难,水土流失导致的养分流失是面源污染的重要组成部分,其主要的流失途径为径流和泥沙携带。目前国内外关于次降雨过程中不同土地利用下径流与泥沙氮流失关系的研究主要集中于人工模拟降雨试验、径流小区观测试验以及数字模拟等方法对单一土地利用类型氮素流失途径展开
紫色土坡耕地主要分布在四川盆地丘陵和四周山区,是西南地区农业主体区域,也是长江流域的重要侵蚀地带。紫色土是一类具有较多优势和潜力的土壤资源,其风化成土速率快、土壤矿物质含量高,但土体较薄、质地松软、孔隙度大、入渗能力高、物理风化强烈。因此,紫色土坡耕地侵蚀性退化严重,已成为我国水土流失最为严重的地类之一。紫色土坡耕地人为扰动最为频繁且具有周期性、高强度的特点,坡耕地生产过程对土壤理化性质影响强烈,
中国是水产品消费大国,同时也是水产品的生产大国,我国拥有历史悠久水产养殖业,在生态保护和产业转型的新形势下,传统养殖业逐步向绿色高效的方向发展。工厂化养殖是一种集约化的养殖模式,具有环保、节水,高效等特点,符合新时代农业发展要求。推动工厂化养殖的进步离不开自动化养殖设备的研发,近年来出现了很多替代人工操作的现代化设备,如投饲机,水质在线监测设备,定时吸污装置等;在生态保护邻域尤其是濒危水生野生动物