云计算环境下基于优先级与可靠度的Hadoop作业调度研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:zhaomohans
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,云计算因其高性能、高可靠、可扩展等特点在海量数据计算中得到了广泛应用。在信息技术飞速发展的条件下,海量数据处理成为计算机科学领域的新挑战。MapReduce作为一种新兴的分布式计算模型,它的主要特点在于封装开发传统并行分布式程序的细节,实现业务逻辑程序的编写与分布式实现细节的分离。Hadoop作为MapReduce计算模型的开源实现,得到了各界的广泛关注,Hadoop调度算法主要克服的是集群资源利用率,用户作业的运行时间等难题。云环境下Hadoop作业调度的研究给学术界和工业界带来了新的挑战。改进和提高作业调度能力,对提高Hadoop的性能和资源利用率具有重要意义。首先,介绍了云计算的概念以及体系结构,对开源平台Hadoop中的MapReduce编程模型和分布式文件系统HDFS (Hadoop Distributed File System)进行了深入研究,详细分析了Hadoop作业运行时机制以及现有的调度算法。其次,针对基于优先级的加权轮转调度算法没有考虑系统负载水平,同时不能充分利用异构集群中计算节点的处理能力的问题,提出了一种改进的优先级调度算法(Priority Based Multi Scale, PBMC), PBMC算法对集群中的计算节点的计算能力进行判断,并按照计算能力的不同进行排序,考虑系统整体的负载水平,在保证系统整体负载处于合理状态时,将优先级较高作业中的任务分配给计算能力好的节点。实验结果表明PBMC算法充分考虑了集群中节点性能的不同,减少了集群作业的完成时间,进一步提高了集群资源的利用率。最后,通过对云计算的开源平台Hadoop调度算法进行深入研究,针对用户提交服务的随机性、趋同性以及云计算系统的可靠性和集群资源的利用率的问题,利用排队模型建立云计算系统模型,采用集群中节点负载值来划分计算节点的可靠度。在对节点可靠性分类的基础上,提出了一种基于计算节点可靠度的Hadoop作业调度算法(Job Scheduling Based on Node Reliability, JSBNR)。JSBNR提出了一种计算节点可靠度评估模型,进而推出节点与任务的匹配方法。通过实验表明JSBNR提高了集群的可靠性以及资源的利用率,同时,具有良好的可扩展性能。
其他文献
视频内目标跟踪作为计算机视觉领域中的基本问题之一,已经广泛地应用在人们生活的各个领域。影响视频目标跟踪的因素有很多,比如光照、遮挡或者运动状态的变化等,因此开发一种高
大爆炸算法(Big Bang-Big Crunch, BB-BC),是由土耳其伊斯坦布尔科技大学的Osman K. Erol*和Ibrahim Eksin于2006年提出的一种新的群体智能优化算法,该算法思想来源于了宇宙
云计算作为海量数据处理的新型计算模式被提出之后,其发展极为迅速。它将大量的计算机通过网络连接构成一个集群,用户通过集群的一台PC机就能够获得整个集群内所有的资源,如
随着智能移动终端设备在普通大众生活中的普及,以移动终端为平台的环境星遥感数据共享受到越来越多的关注。环境星遥感产品数据由遥感算法和遥感影像数据经过遥感产品生产过程产生,在传统的遥感数据共享方式中,这一动态生产过程发生在用户提交共享请求之前,这种方式带来的问题是用户请求共享的产品数据缺少自主选择性及获得的产品数据类型有限。针对该问题,论文采用遥感数据处理系统作为遥感产品数据生产的支撑平台,提出一种数
水资源是生命赖以生存和社会经济建设的必要条件,在当前水资源利用过程中存在的问题有:(1)水资源短缺是水资源管理中面临的首要问题,明确缺水地区的缺水类型,有利于针对不同短缺
现在在全世界范围掀起了一股股IT浪潮,例如云计算和物联网的兴起、移动通信服务进入了4G时代、大数据时代的到来等。这些IT革命使人类的工作生活更加便捷和轻松。特别是大数
随着信息技术的发展和政府工作方式创新的理性选择,电子政务应运而生,并成为联系政府和公众的一个重要窗口。我国电子政务虽然取得了一定的成绩,但仍然存在诸多问题。特别是目前
Hash函数是信息安全中最重要的技术之一,广泛应用于数字签名,数据完整性,消息认证等领域。而随着最经典的Hash函数如MD5、SHA-1在2005年被王小云教授等成功破解后,研究者们正在寻
在网络和信息技术飞速发展的背景下,智能家居成为了一个新的IT浪潮与研究热点。  目前,市场上主流的智能家居实现方式是在家庭范围内以有线或无线的方式来控制家庭居室内的电
云计算作为一种新型的商业计算模式,向用户提供可配置的、共享基础资源的计算模型,使用户获取服务的方式、手段和花费发生了巨大变化。虚拟化技术作为云计算的关键技术,因其