分布式环境下数字地形分析并行化算法研究

来源 :中国地质大学 | 被引量 : 0次 | 上传用户:oncecao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现代社会的信息呈爆炸式增长,在大数据的背景下,近些年来快速发展的云计算凭借其海量的数据处理能力和高效率的计算能力,得到了IT界的广泛关注。目前在IT界使用最多也是最广泛的就是Hadoop以及Spark分布式集群,Hadoop分布式文件系统(Hadoop Distributed File System,HDFS)成本低,拥有高可靠性和可扩展性,非常适合海量数据的存储;Spark则是基于内存计算,整合机器学习、流处理、图计算和数据分析等功能,为大规模数据处理提供了一站式的解决方案。同时空间数据获取技术的不断更新,DEM数据量呈指数增长,基于数字高程模型(Digital Elevation Model,DEM)的数字地形分析方法面临着新的机遇和挑战,对数字地形分析并行计算的需求日益迫切,数字地形分析的并行技术正逐渐成为数字地形分析新的发展方向。本文将数字地形分析与HDFS和Spark结合,对基于Spark的分布式环境的数字地形分析并行化算法进行了部分研究,主要研究内容如下:(1)分析国内外学者对并行数字地形分析的处理过程,包括并行数字地形分析的主要采用的数据划分方案、数据存储方案以及并行算法的研究;介绍包括数字地形分析概念以及Hadoop和Spark理论与背景,将并行数字地形分析算法分为局部以及全局数字地形分析并行算法两类,并分别选取代表性算法实施。选取山地分类算法作为代表性算法完成对局部数字地形分析并行算法的设计与实现,给出基于HDFS的瓦片划分与压缩存储的设计思路;完成对山地分类并行算法的设计与实现,对整个数据划分与存储以及并行化算法的性能进行了简要的分析与评估。(2)选取可视域分析算法作为代表性算法完成对全局数字地形分析并行算法的设计与实现。针对可视域分析的算法特点,借鉴了顾及负载均衡的DEM数据等栅格量划分方法完成数据划分;完成基于Spark的可视域分析的并行算法的设计与具体实现,对可视域分析并行算法的性能做简要的分析。(3)为山地分类并行算法和可视域分析并行算法设计对比实验。山地分类算法包括单机版本与并行版本的时间对比、是否采用压缩瓦片的划分方式的对比,可视域分析算法则包括了单机与并行版本的对比、可视域分析结果的精确性对比、不同计算节点个数计算时间对比。通过实验证明本文设计的分布式环境下数字地形分析并行算法的合理性和高效性。
其他文献
<正>“它山”是大画 家张仃先生的号。据 说,以“它山”为号 不仅是因为画家的故 乡辽西有一座叫做 “它山”的山,以山 名为号表达了对故乡 的眷恋,还因为画家
近年来,城市的新区建立和发展一直都是城市规划统筹的重中之重。为了更好地实现"数字中国"示范区这一远大目标,滨海新城依托中国东南大数据产业园这一强大背景,改变过去单一
本文针对上下游企业间的依存关系,基于节点企业的状态信息,研究供应链风险感知问题,构建描述节点企业状态信息的指标体系。通过对企业状态与供应链风险关系的研究,阐述基于节
<正>乡村四月天【宋】翁卷绿遍山原白满川,子规声里雨如烟。乡村四月闲人少,才了蚕桑又插田。最美乡村四月天乡村的四月,是美丽的。山坡是绿的,原野是绿的,绿的树,绿的草,绿
研究目的1.收集TA2自发乳腺癌小鼠,观察其成瘤特点。2.探讨Wnt家族成员中Wnt1、Wnt10b、Wnt5a及Wnt5b在TA2小鼠乳腺癌发生过程中表达变化规律。3.在高转移TA2小鼠自发乳腺癌
【正】 黄庭坚是著名的禅门居士,他与丛林的广泛交游早已受到研究者的关注,但是他与当时一些不甚知名的下层禅僧的交往却很少为人所知,本文旨在通过对黄庭坚传世名迹《华严疏
《古文苑》可能是南宋金石学家王厚之编纂的一部诗文选本,其价值大致有四点:1.辑佚价值;2.史料价值;3.校勘价值;4.编纂价值。
目的探讨石氏温经强腰汤(制川乌、制草乌、威灵仙等)治疗寒湿痹阻型腰椎间盘突出症的疗效。方法抽取在本院治疗的腰椎间盘突出症患者98例作为研究对象,随机将患者分为研究组
目的评估浙江省托幼机构卫生消毒管理现状,发现薄弱环节,为提高消毒质量提供依据。方法通过现场调查或电子邮件方式对171家托幼机构进行问卷调查,用Epidata 3.1和SPSS 19.0软
<正>本文在介绍轨道预报方法的基础上,重点对两种轨道预报模型SGP4/SDP4的预报方法进行了误差分析,得到在一个月之内的预报距离误差,并对误差原因进行分析。数据选择近地点在
会议