Hadoop平台下作业调度算法的研究与优化

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:zhehong220
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Hadoop是云计算的分布式开源实现平台,在海量数据处理方面有着高容量、低成本、高容错等特点,是运行在大型集群上的并行处理系统。Hadoop平台的核心技术作业调度算法是对用户作业进行资源的分配和调度执行的程序。作业调度算法选择是否合适直接关系到用户业执行的效率。用户在很多时候都会使用Hadoop自带的调度算法,但原有作业调度算法在批处理的在线查询和分析应用中存在小作业调度不合理的现象,因此对Hadoop平台作业调度算法的研究和优化十分必要。本文研究的主要内容如下:(1)分析Hadoop作业调度算法在国内外的研究现状,分析Hadoop中MapReduce作、业调度的原理,作业调度的理论基础以及Hadoop自带算法的调度流程和优缺点。(2)研究引入排队论的MMS算法的原理和优缺点,针对现有Hadoop作业调度算法在处理小作业方面的欠缺提出一种基于小作业优先的M/G/1作业调度算法。算法引入排队论的M/G/1模型,当作业提交到排队队列,首先根据作业长短进行优先级排序。根据M/G/1作业调度算法模型计算出系统作业平均等待时间,当某时间段出现一定量的小作业时,将小作业重新排到队列前段优先计算。(3)在搭建Hadoop集群进行实验,验证了基于小作业优先的作业调度算法可完成作业的调度执行,并且减少了作业的整体的等待时间。实验数据经过多次执行取均值的方法得到。通过与先进先出算法和公平调度作业调度算法的对比实验可以得到,基于小作业优先的作业调度算法可以更快的适应小作业靠后的情况,及时调整顺序,缩短了整个作业的完成时间,提高了系统的利用率和负载能力。
其他文献
随着现代科技的快速发展,人们对无线通讯业务的要求不断提高,有限的频带资源逐渐难以满足各种日益增长的无线通信业务需求,未来无线通信系统将在高传输速率、高可靠性以及多
随着信息时代的到来,视频编解码技术蓬勃发展,为人们提供了更多更好的视觉体验。视频技术是多媒体应用最核心的技术,直接影响着多媒体服务的质量。视频技术的发展,推动了一系
三维视频作为一种新兴的多媒体形式,能够提供给观看者一种身临其境的视觉体验,并且允许观看者在一定角度内自由选择观看视角。多视点视频加深度(MVD)是当前三维视频的主要数
生物特征识别是指利用人体固有的生理特征或者行为特征来进行身份鉴定的技术。与传统的身份认证技术相比,生物特征识别技术具有独特的优势,因此越来越受到研究者们的重视。人
协作多址接入技术作为近年来研究的热点,引起了人们越来越大的兴趣。协作通信节点之间可以相互合作,形成一个虚拟的MIMO系统,充分利用MIMO系统可以提供分集增益和复用增益的优势
离散多音调制(DMT)是一种先进的多载波调制技术,较传统的单载波调制具有包括抗频率选择性衰落、抗符号间干扰等诸多优点。采用流模式传输的xDSL系统广泛应用了DMT技术,基于突
无线自组织网络无需固定的基础网络设施或中央系统的管理,由移动主机通过无线连接自动形成网络。同时,人们对交互式群组通信的业务需求日益增长,因此,在无线自组织网络中需要
数字图像已成为当今社会信息传播的有效媒介,被广泛应用于新闻媒体、法律案件等场合。但日益普及的图像编辑处理软件使图像篡改不再困难,致使图像造假事件不断曝光于各大网络