论文部分内容阅读
随着科学技术的发展,Internet迅速蔓延到世界各地,成为人们信息沟通和工作协同的有效工具。其中,通过Internet连接的成千上万的计算资源、存贮资源、信息管理资源等各种数字化设备共同构成了生产、传播和使用知识的重要载体。而网格作为一种新兴的计算基础设施,将这些物理上互连的众多资源汇聚起来,实现了资源共享、协同工作和联合计算的功能,并为广大用户提供了科学、工程、金融、军事等各种综合性服务。计算网格的出现使得隶属不同用户、跨越多个地理位置的分布式异构资源的共享成为可能。而构建一种基于科学与工程计算的网格应用平台,集成异构环境下的各种计算资源、数据存储资源,将它们统一组织起来,通过系统提供的应用服务访问、数据访问和管理服务等功能,屏蔽底层资源异构性和多个管理域,为用户提供直观、一体化的文件视图和方便、规范的访问和操作方法,具有重要意义。另外,如何使用户作业高效的完成,即网格环境下任务调度,是现在研究的热点也是难点,由于网格环境的灵活多变性,为用户合理分配资源,保证资源的有效利用,满足用户共享资源的需求,则要依靠作业调度过程中所采取的调度算法,它决定着资源的使用效率和用户的满意程度。首先,本文设计构建了一种科学与工程计算应用网格平台。在系统软件平台构建中,从前台门户到后台资源,实现上下层之间的无缝连接,层与层之间具有严格的约束关系与嵌套关系,上层依附于下层,下层服务于上层。既可以呈现给用户一个切实可用的计算服务,同时对用户屏蔽底层信息,从而完整地表示出本系统软件结构的层次观念。底层采用Globus网格中间件设计并构建一个易于扩展、满足不同应用需求的异构环境系统。上层使用Gridsphere网格门户中间件和扩展Gridportlets网格组件来构建网格应用门户,实现不同计算模式科学与工程计算应用的封装,同时集成网格记账、网格监控功能,为用户提供一个灵活易用,可动态配置的网格应用环境。另外,本文以大规模科学与工程计算为背景,网格为基础环境,着力研究了网格过程中作业调度、资源分配与共享等相关问题,分别给出了满足实际需求的作业调度模型和相应的调度算法。在研究现有平台资源部署的前提下,构建DAG作业调度框架,并针对作业之间具有约束的应用调度需求,提出一种DAG调度算法思路,首先将作业进行Rank排序,然后采用分组思想进行作业分组,并调整作业执行资源以优化性能。最终实现了两个目的,一是尽量降低作业权值赋值方法对算法性能的影响,二是降低了作业Makespan。最终实现了多用户高效共享异构资源的目标。