支持异构集群的高能物理数据处理平台研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:lyh993
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高能物理离线数据处理作业主要分为CPU密集型和I/O密集型两种。传统计算集群采用计算资源和数据存储相分离的架构,大量的数据传输对网络I/O造成了很大压力;而运行在Hadoop之上的MapReduce框架,可以充分利用计算节点本地磁盘的存储空间及其I/O资源,提供了“计算至数据”的新型计算模式,非常适合运行I/O密集型应用。本文深入分析了高能物理数据处理模式以及Torque/Maui和Hadoop集群的特点,提出了基于Mesos的资源统一管理框架集成了上述两个异构集群,实现了支持异构集群间资源动态共享的高能物理实验数据处理系统;同时改进了Mesos中的DRF(Dominant Resource Fairness)资源分配算法,使集群资源更加公平合理的进行分配。  本研究主要内容包括:⑴深入分析了Mesos的资源分配算法DRF在高能物理数据处理环境中的缺陷,提出了一种改进的DRF资源分配算法。该算法增加了机器性能评级和作业类型匹配两个因素,改进了原算法的资源分配流程。通过在计算资源份额时引入机器性能加权机制,实现了以机器性能作为集群资源分配的新模式,替代了原算法中单纯以资源数量作为分配单元的模式,同时对用户退回的资源进行再分配,新的机制充分保证了资源分配的公平性和资源使用效率。⑵对Torque/Maui集群的架构以及高能物理数据处理作业的调度与执行过程进行深入分析,在Mesos框架下提出了一种低耦合可扩展的集成方案,设计了信息交换协议和资源、作业的调度流程,构建了完整的信息系统和运行流程,实现了异构集群Torque/Maui与Hadoop的集成。该系统通过混合运行两个集群,使计算节点本地磁盘的存储能力和I/O资源得到充分利用,显著提升了系统的存储容量和I/O性能;并且利用集群间的错峰运行共享集群资源,提高了整个集群的资源利用率。⑶使用BESⅢ实验真实的物理数据处理及分析应用对原型系统进行了验证。测试结果表明,新系统不仅能够在两个集群之间动态的分配计算资源,还可以充分利用计算节点本地磁盘空间及I/O资源,显著降低网络I/O;改进后的DRF算法能够根据高能物理不同类型作业的特点选择合适的节点分配资源,系统运行效率提高大约19%。
其他文献
如何让机器从大量感知数据中抽取高层的数据表示是人工智能领域的核心问题,理论和生物学言论强烈建议,构建这样的智能系统需要深度模型,而传统深度模型的训练不仅容易陷入局部最
数字通信和移动通信是当今全球发展最快的行业。随着Internet的迅猛发展,手机、掌中宝等无线通讯设备的普及,人们对无线上网的要求越来越强烈了,都希望无论在何时、何地,只要需要
裂缝参数的提取是FMI成像测井解释的重要环节之一.目前,从成像测井中识别裂缝主要通过人眼完成,裂缝参数的计算也是通过人工给出裂缝关键点通过计算机自动拟合来实现的.实现
随着计算机技术的发展以及用户对于存储需求的日益增长,主动存储系统成为热点研究。如何利用未来存储设备上的计算能力来支持高性能的计算和高效的存储访问成为问题的关键。本
该文试图提出一套完整的基于多Agent协商的机制来解决组合拍卖的问题.该文中详细介绍各种组合拍卖的竞价语言并分析了它们的表达能力.在OR语言的基础上,该文形式化定义了组合
Web服务是电子商务领域具有革命性的技术,它以XML,HTTP等开放的规范为基础,以SOAP,WSDL,UDDI为核心,在现有的各种异构平台的基础上构筑一个通用的平台无关、语言无关的技术层
随着网络技术的不断发展和社交媒体的流行,当前媒体社会进入到“自媒体”时代。在自媒体时代,人人都是信息的传播者以及推动事件发展的主要力量,这就使得网络信息传播速度更快,受
目前网络中急剧增加的服务以及新技术的采用,一方面满足应用的需求,但同时也增加了出现安全漏洞和网络攻击的机会,迫使不断增加和升级安全设备.安全系统遵循所谓的"木桶原理"
随着我国市场经济的发展,企业的生产模式向小批量、多品种发展,多样化和定制式的产品代替了标准产品.企业要满足客户个性化的需求,就需要大大缩短产品开发周期,而用手工方式
通过搜索引擎来查找所需要的信息,是当前人们在网上获取信息的重要手段之一。在信息检索领域,评价一个检索系统性能的优劣,不仅要看检索模型是否有效,更要考察检索系统对于不同的