论文部分内容阅读
数据网格是网格环境下共享和管理存储资源和分布式数据资源的大规模、可扩展的框架结构,它适应数据密集型应用对网格环境下数据共享和处理的需要,给用户提供了透明访问远程异构数据资源的机制。实现了安全、可靠和有效的网格环境中的数据传输以及访问、复制等操作,并提供到不同存储系统的统一的接口,从而使得数据密集型的高性能计算和大量的共享数据密集型事务处理及科学研究成为可能。
副本管理策略是数据网格的一个重要技术之一,本文分析了数据网格中副本管理系统的结构和特点。由副本管理策略创建的数据副本可以降低远程访问该数据的网络延迟及带宽消耗,还可以降低网络的负载,同时能够提高数据的安全性和可靠性以及系统的容错性等。而良好的副本管理策略也是提高网格服务质量QoS的一个重要方面。
本文通过对数据网格副本管理技术的研究,针对数据网格节点数目多、资源异构、结构复杂、非集中控制等特点,提出了一些新的思想。为的是提供最大限度的稳定性,当任意结点失效时,不会造成网络的瘫痪,对用户提交的信息能够及时正确的给予应答,当网络性能改变时,也能提供正常的服务。本文分析和比较了Web Service技术和P2P技术,并将其结合应用到层次和区域式的网格体系结构模型中去,将集中式管理和分布式交互融合起来,从而便于网格信息的管理以及节点间的信息交互。在数据网格中,一个数据文件可能存在多个副本,如何根据约束条件找到该数据文件的一个或多个副本的问题,称为副本定位问题。本文为每一个节点建立索引信息,以Lucene算法为内核来实现快速准确的副本定位策略。最后结合我们提出的网格体系结构,运用相应的技术和算法,对其进行仿真模拟实验,进行性能比较并对实验结果进行进一步的分析。实验结果表明我们提出的体系结构可以改善网格的性能,以Lucene算法为内核的副本定位算法确实可以减短副本定位的时间,从而减少了数据访问延迟及带宽消耗。