论文部分内容阅读
网格信息服务是网格系统中负责管理资源信息的一系列服务集合的统称,其中包括资源描述、资源发现、资源监控和资源推荐等。随着资源规模的日益扩大,资源信息总量急剧增加,如何高效组织并共享海量的异构资源信息成为影响网格工作效率的关键因素。为了保证用户提交的资源访问请求能够快速准确地得到响应,网格领域亟需研究面向大规模资源环境的网格信息服务技术。 现有工作试图从多个方面提高网格信息服务在大规模资源环境下的工作效率,目前取得了一定的研究成果,但也存在着诸多问题。首先,网格信息服务缺少一种动态可扩展的分布式模型,中央节点的存在导致其容易出现单点失效和负载过重等问题;其次,网格信息服务在处理复杂查询请求时普遍存在效率不高和负载不均衡等问题;再次,由于缺少精确的预选策略和高效的路由机制,网格信息服务无法在分布式环境下提供资源推荐功能;最后,资源推荐性能受评分数据的稀疏程度影响较大,推荐精度无法得到保证。上述问题都严重制约着网格信息服务的工作效率,并影响网格系统的整体性能。 据此,本文面向大规模资源环境研究网格信息服务技术,具体的研究内容包括以下五个方面:首先,提出大规模资源环境下的网格信息服务模型,将网格资源环境抽象成两层覆盖网络拓扑,虚拟组织域内和域间采用不同的资源信息管理模式,保证资源查询结果的完备性和域内优先;其次,研究资源属性的多维索引技术,在此基础上提出支持复杂查询的资源描述与发现机制,在保证资源发现准确率和效率的前提下支持多维属性查询和区间查询;第三,研究K近邻的预选策略,过滤对推荐过程无效的评分数据,在此基础上提出基于分布式协同过滤的网格资源推荐机制,解决分布式环境不支持个性化推荐的问题;第四,提出基于混合协同过滤模型的网格资源推荐机制,构建基于概率统计分析的评分预测模型,解决评分稀疏性问题;最后,在东南大学校园网格平台SEUGrid的基础上,设计并开发SEUGrid信息服务系统SEU-GIS,并通过将本文的相关理论研究成果部署到系统之上,实现支持复杂查询的资源发现和资源推荐功能,针对大规模网格资源环境提供高效的信息服务,并验证本文的理论研究工作。 基于上述五个方面的创新性研究工作,本文对面向大规模资源环境的网格信息服务进行了深入研究,通过一系列仿真环境和真实网格环境的实验结果表明,本文所提出的信息服务模型和机制能够快速准确地获取资源信息,并且具有良好的可扩展性,完全能够适用于大规模资源环境。同时本文的理论研究和系统实现成果为在实际网格环境中开发部署网格信息服务提供了重要参考价值。