论文部分内容阅读
由于如今Web应用的高速发展所带来的数据规模的海量性、数据模式的多样性和不确定性,使得传统的数据管理技术在可扩展性、高效性和可靠性方面越来越不能满足应用的需求。数据服务环境做为一种新兴的数据管理模式在实际应用中更能适应应用的需求。伴随着云环境与云计算技术的日益完善和成熟,云计算作为一种正在兴起的数据服务环境已经在很多应用中取得了非常好的效果,引起了学术界和工业界的广泛重视。
这种构建在大规模机群上的数据服务环境具有良好的可扩展性和可靠性,能够充分满足管理大规模异构数据的需求。然后,尚无成熟的系统支持在数据服务环境中提供复杂的结构化查询的能力。为了实现数据服务环境中的结构化查询,索引系统是提高复杂查询服务效率的关键。同时,目前数据服务环境中的数据管理系统面对高度并发的客户端应用时需要提供一定的事务机制以保障数据一致性,传统关系数据库的索引技术不能简单的应用到数据服务环境中。
本文在调研了国内外的研究现状的情况下,提出了一种构建数据服务环境下的分布式B+树索引的设计思路,同时在索引系统上提出了一种基于有效性验证的细粒度、小网络流量的事务机制。主要工作包括:
●结合了云环境的特点,设计了一种高效、高可靠性与高扩展性的分布式索引系统框架,能够充分应用机群中机器的计算能力,提供更好的索引服务。
●在分布式B+树索引中设计并实现了一种基于乐观机制的细粒度、小网络流量的事务机制,使得面对高度并发的应用环境时,索引系统能够保证高效的系统性能
●在采用数据复制技术提供索引系统的并发性的同时,充分利用索引系统数据结构的特点,提出了一种异步的数据副本一致性维护策略,进一步降低了维护副本数据一致性的开销。
通过在模拟实验环境下的实验分析,本文中的方法能够有效得实现索引系统的功能,具有良好的扩展性,在类似系统的对比中具有较好的系统性能。