论文部分内容阅读
网格计算是分布式计算的一种,随着网格应用的发展,网格技术被逐渐应用到科学研究的各个领域中。网格计算资源共享的思想与生物信息计算环境Weblab“一站式”服务的思想不谋而合,它们的结合能有效的管理计算环境内的软硬件资源,更好的为生物学家服务。本文将网格技术应用到Weblab计算环境中,重点研究其中以BLAST计算为例的生物软件包的网格资源服务化工作。
本文的主要研究对象是以 BLAST 软件工具包为代表的生物信息软件的网格服务化工作。BLAST工具包使用广泛,依赖于数据库,同时具有自己的计算特征,是生物信息软件中的典型应用,对它的研究具有普遍性。本文中网格资源服务化是指在网格环境中将BLAST工具包包装成网格服务提供计算的过程。本文设计了将BLAST软件工具包不需任何修改就可直接包装成满足WSRF标准的网格服务方案,主要问题是研究如何在网格服务中描述本地资源所能提供的计算能力。首先,通过分析BLAST软件包的特征,结合网格技术定义了网格服务所需提供的功能接口和资源属性。同时,考虑服务的可扩展性问题,设计了可扩展的结构,可方便的支持异构环境资源和高性能计算机的接入。执行服务是满足WSRF标准的网格服务,通过与计算节点本地执行环境交互,完成创建资源,提交作业,监控计算进度等任务,并将计算结果返回给用户。在原型实现中,本地环境采用PBS管理作业,执行服务将各具体执行任务提交到PBS系统中。
文章中首先介绍了Weblab和BLAST计算的问题背景,网格计算的基本概念和Weblab网格计算环境的整体结构。然后,重点研究了BLAST软件包的网格服务化工作,给出了参考设计和实现原型,并分析了它与Weblab网格计算环境中其他部分的关系。最后,给出了实验结果和性能分析,证明我们方案的可行性和有效性。
目前,整个Weblab网格计算运行环境原型已基本实现。测试结果表明,由于网格环境内消息的传输和监控等因素,使得计算性能有一定的损失,但对计算时间稍长的单个作业和大批量作业的计算,这点损失是可以接受的。在未来工作中,将进一步研究提高执行服务性能的解决方案。