论文部分内容阅读
数据网格(Data Grid)面向广域网异构环境,为用户建立分布、异构、海量数据的一体化访问、存储、传输、管理与服务架构,是实现广域网环境下数据共享和协同问题求解的有效途径。副本技术是数据网格中的关键技术,它是为了避免本地主机频繁的访问远程数据,而在本地区域创建远程数据的副本。副本技术的引入带来了诸如减少数据访问延迟、减少网络带宽的消耗、平衡服务器端的负载和提高数据的可用性等优点。但是同时,如何在广域范围内保证同一数据的多个副本的一致性,确保数据访问的有效性成为当前复制领域中亟待解决的重点和难点之一。本文的研究以保持数据网格中的海量数据的多副本一致性为目标,根据数据网格中海量数据的特点,开展对海量数据的多副本一致性的研究,主要研究体现在:(1)提出了海量数据的基于时间戳的副本一致性模型RCMTS(Replica Consistency Model based TimeStamp):RCMTS模型通过时间戳技术对副本进行管理,并通过网格区域性的高度自治特点,将副本更新分为域外更新和域内更新两种策略,提高了更新的速度;并采用基于用户视图的访问策略,保证了用户访问逻辑文件的正确性,RCMTS为数据网格系统提供了分布、高效、灵活的副本一致性管理机制;(2)提出了一种动态可扩展的副本定位方法DSRL(A Dynamic Scalable Replica Location Method):DSRL使用索引信息节点来支持对同一数据多个副本的同时高效定位,通过使用本地索引节点来支持对本地的副本查询。同时,提出了一种动态映射技术,能够根据索引节点的机器性能而分配全局副本定位信息,并支持索引信息节点的动态加入和退出。DSRL具有良好的可扩展性、可靠性和自适应性,并能提供高效的定位效率;(3)用网格模拟工具OptorSim对算法进行模拟:通过对网格模拟工具OptorSim的源代码分析,对其进行了扩充,建立了对海量数据进行一致性算法验证的环境,得到了一批有参考价值的实验数据,验证了本文提出的RCMTS模型的正确性和有效性,为其推广应用提供了有益的参考。