云计算环境中多MapReduce作业动态资源分配方法的研究

来源 :东北大学 | 被引量 : 3次 | 上传用户:cheng8023jiajia
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着云计算技术的普及和流行,Hadoop系统成为更多用户处理大批量数据的选择。在Hadoop系统中,资源管理问题一直是该领域的研究热点问题之一。有效的资源管理,通过对资源的合理分配,不仅能够有效缩短系统的平均响应时间,提高用户的满意度,更能保证和改善系统的执行能力和交互能力,而且还能提高资源的利用率。本文在深入研究Hadoop系统的资源调度算法的基础上,针对目前Hadoop系统在资源调度方面存在的使用静态地配置Slot资源而难以有效适应MapReduce作业个性化资源需求的问题,提出了一个多MapReduce作业动态资源分配方法,该方法将多MapReduce作业初始资源分配和动态重分配相结合,能够动态地配置分配给各个作业的资源,从而保证作业的完成时间目标,提高系统的资源利用率。首先,针对资源初始分配,建立作业的完成时间预测的数学模型,根据作业的完成时间目标和作业的初始化信息估计作业的资源需求,提出了作业对所得资源的用户满意度的概念,并以用户满意度公平,和系统的资源利用率最大化为目标,建立了初始的资源分配模型,并给出了求解资源分配模型的启发式算法,为作业进行资源初始分配。其次,针对资源动态重分配,周期性动态地捕捉作业在执行过程中的任务剩余执行时间的变化,改进作业的完成时间预测模型,预测作业对于资源的需求变化,并感知是否有用户向系统提交新作业,提出了作业资源需求变化事件的概念,并基于作业资源需求变化事件的发生,以用户满意度公平和资源利用率为目标,为作业进行动态的资源重分配。本文在以上研究的基础上,对Hadoop的资源调度器进行改进,并指定该调度器执行了3种作业,Sort、Combine和Select,通过与这3种作业在Fair调度器下的执行状况进行作业完成时间和资源利用率的对比,验证了本文提出的多MapReduce作业动态资源分配方法的有效性。
其他文献
Internet的许多应用都需要建立和管理一个会话,会话在这里的含义是在参与者之间的数据的交换。由于考虑到参与者的实际情况,这些应用的实现往往是很复杂的:参与者可能是在代理间
传统工作流管理系统的设计从提供功能齐全的工作流服务角度出发,不可避免地导致了系统架构极为庞大,系统的复杂性也随着增大。同时传统的工作流管理系统提供的功能是以集成的方
当前主流P2P网络存在着可扩展性不高,效率低下以及对电信主干网负载太大等问题,已经严重阻碍了P2P的应用和发展。目前最新的技术是基于DHT的结构化的定位模型,这种技术在一定程
随着模式识别、人工智能和机器学习等领域研究的不断深入,传统的基于模式特征向量和距离、类似度等测量的统计分类和识别方法已经不能有效解决一些复杂问题的分类和识别。研究
目前,在医疗行业中,较普遍使用的理疗设备都采用的是单机操作模式,一台控制器独立控制一台理疗设备,给医院医护人员的使用带来不便。根据开发公司的要求,开发设计既能够具备联网能
目前为止电脑围棋仍是人工智能领域中的一大难题,虽然人们不断的研究,但电脑围棋的水平仍然很低,甚至还达不到低段位职业棋手的水平。围棋是同类游戏中最有挑战性的。因此电脑围
随着嵌入式系统、IP网和移动网3G/4G的技术发展,基于嵌入式系统的电子商务将成为我们日常生活的重要组成部分,具有巨大的产业前景。目前,基于嵌入式系统的电子商务技术还刚处于
随着互联网的迅速普及和相关技术的快速发展,互联网在人们的工作和生活过程中占据着越来越重要的位置,同时网络安全问题也变得越来越严重,网络安全事件的爆发频率逐年上升,其
网格计算就是指通过高速网络把分散在各处的硬件、软件、信息资源连接成一个巨大的整体,从而使得人们能够利用地理上分散于各处的资源,完成各种大规模的、复杂的计算和数据处理
随着计算机及互联网络技术的迅速发展,网上文本的数量成指数级增长,如何帮助用户高效准确地从这些海量信息中获取有用的信息是当前迫切需要解决的问题。因此,Web文本信息检索成