论文部分内容阅读
人口空间化研究是地理空间科学研究的重要内容,是现代城市向智能城市转型的必由之路。人口普查数据一般以行政单位进行公开,如区县、街道等,这种形式的人口数据无法直观反映区域内部人类分布,难以体现区域内人口分布的细节和地理空间异质性。人口空间化以国家公开的人口普查数据为基础,结合海量、多样的对人口分布有着重要影响的地理空间数据为支撑,通过一定的技术方法对人口在区域内实际分布状况进行估算,从而刻画现实世界中人口的分布,将人口普查数据以更加精确的空间尺度重新表达。通过对人口统计数据的空间化,可以准确把握区域内人口分布形态,实现城市的精细化管理。本文以长沙市为研究区域,结合POI(Point of Interest,兴趣点)、DEM(Digital Elevation Model,数字高程模型)、夜间灯光和土地利用等多源地理空间数据为人口空间化支撑数据,通过建立随机森林模型实现了长沙市人口普查数据的空间化,同时在文中详细解释了人口估算模型的原理,验证了模型精度,并基于模型的特征重要性讨论了各个人口影响因子之间的非线性关系。绘制了100m×100m的长沙市人口空间分布图,模拟了长沙市人口在现实世界中的分布,为湖南省全域人口可视化研究提供了基础数据。最后利用空间自相关分析对长沙市人口分布形态和规律进行了分析和讨论。主要研究成果分为以下三个方面:(1)长沙市人口分布特征:长沙市人口空间分布格局呈“一心—两副—多方向延伸”形态,人口主要集聚于中部地区,周围地区人口密度相对较低,“核心—边缘”特征明显。长沙市人口分布影响最大的因子是经济活动,其代表是POI数据和夜间灯光数据。(2)海量地理空间数据在人口空间化应用方面:随着地理信息技术的不断发展和完善,现阶段完全开源数据十分丰富,凭借开源数据足以支撑人口空间化的全部工作。此外,传统地理空间数据与海量、多源的新型地理空间数据相结合对人口空间化过程使地理空间信息研究步入新时代,使地理空间信息研究更加丰富和科学。在人口空间化过程中属性数据所产生误差对人口估算模型影响最大,最需受到关注和控制。(3)地理格网和随机森林结合的方式在人口空间化过程中有着独特的优势:利用地理信息技术对整个研究区域建立格网方便、高效、快捷,通过地理坐标为唯一标识来链接所有的数据,易于整合多源数据,可以方便快速的构建人口估算模型。随机森林模型用于人口空间化效果较好,计算速度快,能达到较好的离散效果,尤其是在特征分异较为明显的区域表现最佳。同时地理格网比行政单元的人口普查数据更加接近实际人口分布,有利于进行城市和人口管理。