论文部分内容阅读
网格(Gird)是大规模的网络计算系统,它联合分布于世界各地的各种计算、存储等资源,通过共享与协同,形成一个虚拟的超级计算机。一直以来,科学、工程与商业等领域对计算能力的巨大需求给网格的发展予以了强大的推动力。目前,网格已经从单纯提供科学计算能力向提供各种服务发展。 为了实现可用性好的、健壮的、高性能且可管理的网格环境,正确和有效地对网格实施监测至关重要。网格监测是对网格资源的特征和运行状态进行信息收集的行为,是对网格进行有效管理的前提条件。 目前,国际上投入于网格监测系统研究的机构和组织很多,但是得到广泛认同的研究成果并不多。面临的挑战有:监测信息表示方法在可互操作性、可扩展性方面还存在着较大的问题;网格的动态性、分布性特点使得网格环境下的节点管理研究异常复杂与困难。基于以上原因,本论文在分析了网格监测系统的设计需求及现有的网格监测技术的基础上,借鉴了GMA(Grid Monitoring Architecture)标准及已有的资源描述模型,给出了R-Net网格监测系统(RNMS)中监测信息表示与节点管理的设计方案,最终实现一个功能完备、运行稳定的网格监测系统组件。 本论文首先介绍了网格监测的概念、意义及设计需求,从而引出研究的内容与目标。接着,介绍了网格监测系统的相关技术,包括GGF(Global Grid Forum)提倡使用的GMA标准,并分析了现有网格监测软件的优缺点。在第三部分,本文对R-Net网格监测系统(RNMS)进行了结构层面的分析,并重点介绍了RNMS中生产者的内部结构,提出本研究在RNMS中涉及的功能模块。第四部分详细介绍了两种已有的网格资源描述技术,GLUE(Grid Laboratory Uniform Environment)和CIM(Common Information Model),并借鉴两者的长处,给出了RNMS中监测信息的表示方法。第五部分具体介绍了RNMS中节点管理功能的总体设计及实现方案。最后,本文指出了系统尚未解决的一些问题,并提出一些改进的建议。