基于并行计算的林地落界数据划分策略研究

来源 :北京林业大学 | 被引量 : 0次 | 上传用户:FX553152445
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
林地是我国重要的自然资源,是森林生态系统保持稳定的重要基础。林地落界数据是林地分布现状的体现,记录着林地的时空变化,其可为林地资源的保护与规划提供重要的数据依据。为了充分掌握林地分布情况,国家开展了全国林地“一张图”的建设,使得每块林地都有了标记,其是林业有史以来数据最全面的一张图,可广泛应用于森林防火、病虫害防治、林地规划等方面,推进林地管理走向精准化。全国林地“一张图”总揽全国林地资源格局,共有林地落界小班6800多万条。面对如此大规模的林地落界数据,传统的管理手段已经不能满足需求,而并行计算是解决这种计算密集型与数据密集型问题有效手段。并行计算的前提是对林地落界数据进行数据划分,但对空间数据划分策略的研究却比较少,现有的空间数据划分方法存在各种各样的问题,不能满足海量林地落界数据的划分要求。数据划分粒度缺少定量化的研究,而数据划分粒度过粗或过细都会影响查询效率。本文针对这些这些问题,提出了基于并行计算的林地落界数据划分策略研究,对林地落界数据的划分方法与划分粒度进行研究。最后构建林地落界数据并行查询系统,使用辽宁省林地落界数据进行并行查询实验,验证了数据划分粒度模型的正确性并得出以查询效率最优为前提的最佳划分粒度。本文的研究内容主要如下所示:(1)林地落界数据并行查询分析。通过分析林地落界数据特点及查询应用特点,并行计算的特点以及并行计算的适用场景,构建林地落界数据并行查询模型。(2)林地落界数据划分粒度模型。通过分析并行计算时间的构成及执行过程中的各部分的时间消耗,构建数据划分粒度与并行执行时间的关系模型,模型描述了数据划分粒度与并行执行时间的相互关系。(3)数据划分方法研究。通过分析已有的数据划分方法的不足,提出适用于海量林地落界数据划分的基于动态网格与Hilbert空间填充曲线的数据划分方法,该方法能够按照需求对空间数据进行快速划分,满足数据划分的静态负载均衡原则。(4)实验与性能分析。为了进行并行查询实验,本文构建了林地落界数据的并行查询系统,分析并行查询测试流程,确定测试记录的时间。实验分为属性查询与空间查询实验,根据实验结果分析表明,数据划分与查询时间的关系满足本文提出的数据划分粒度模型,通过多次实验得出了林地落界数据的最佳划分粒度。本文的创新点如下:(1)提出适用于海量空间数据划分的划分方法,数据划分方法结合动态网格与Hilbert空间填充曲线,划分方法既兼顾划分数据的空间聚集性又兼顾算法执行效率,并能使得划分数据块数据量保持一致。(2)对数据划分粒度进行定量化研究。对数据划分原理、数据划分粒度与并行计算执行时间进行分析,通过并行查询实验,定量化得出林地落界数据的最佳划分粒度。
其他文献