数据服务环境中分布式B+树索引的设计与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:zbz963
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于如今Web应用的高速发展所带来的数据规模的海量性、数据模式的多样性和不确定性,使得传统的数据管理技术在可扩展性、高效性和可靠性方面越来越不能满足应用的需求。数据服务环境做为一种新兴的数据管理模式在实际应用中更能适应应用的需求。伴随着云环境与云计算技术的日益完善和成熟,云计算作为一种正在兴起的数据服务环境已经在很多应用中取得了非常好的效果,引起了学术界和工业界的广泛重视。   这种构建在大规模机群上的数据服务环境具有良好的可扩展性和可靠性,能够充分满足管理大规模异构数据的需求。然后,尚无成熟的系统支持在数据服务环境中提供复杂的结构化查询的能力。为了实现数据服务环境中的结构化查询,索引系统是提高复杂查询服务效率的关键。同时,目前数据服务环境中的数据管理系统面对高度并发的客户端应用时需要提供一定的事务机制以保障数据一致性,传统关系数据库的索引技术不能简单的应用到数据服务环境中。   本文在调研了国内外的研究现状的情况下,提出了一种构建数据服务环境下的分布式B+树索引的设计思路,同时在索引系统上提出了一种基于有效性验证的细粒度、小网络流量的事务机制。主要工作包括:   ●结合了云环境的特点,设计了一种高效、高可靠性与高扩展性的分布式索引系统框架,能够充分应用机群中机器的计算能力,提供更好的索引服务。   ●在分布式B+树索引中设计并实现了一种基于乐观机制的细粒度、小网络流量的事务机制,使得面对高度并发的应用环境时,索引系统能够保证高效的系统性能   ●在采用数据复制技术提供索引系统的并发性的同时,充分利用索引系统数据结构的特点,提出了一种异步的数据副本一致性维护策略,进一步降低了维护副本数据一致性的开销。   通过在模拟实验环境下的实验分析,本文中的方法能够有效得实现索引系统的功能,具有良好的扩展性,在类似系统的对比中具有较好的系统性能。
其他文献
角点检测是一个图像处理领域的基础问题,由于具有旋转不变等特性,角点成为一种重要的图像局部特征,角点检测被广泛应用于图像配准与匹配、目标识别、运动分析、目标跟踪等领域。
现代流程工业产生了大量与生产状态相关的过程数据,其庞大的规模凸显了传统数据分析方法运算复杂度过高、分析规模受限的不足。同时,流程工业生产过程中所包含的一些复杂性,如传
随着Internet技术飞速发展,各种信息能在网络上方便、快捷地传输。多媒体比纯文本含有更多的信息量,是人们获取和保存信息的重要手段。因为视觉信息在所有感官获取信息总量中占
离散属性数据是数据挖掘中的一类重要数据,而非监督学习,是数据挖掘采用的一类关键方法。本文针对多种类型的离散数据,包括文本数据,时序离散序列数据和多维离散数据,研究若干新的
随着互联网及其相关技术的发展,多域环境下的资源共享越来越普遍。域间的资源共享给域间合作带来了便利的同时也带来了安全问题。其中两个关键安全问题是跨域访问控制和跨域信
随着手机、掌上电脑和PDA等移动设备的普及和移动通讯技术的高度发展,越来越多的人开始利用移动设备实现无线上网。使用移动设备,通过无线上网的方式,进行的商品拍卖活动称为移
外包数据库是一种新的数据库应用形态,它在管理成本、数据库可用性与可靠性等诸多方面具有传统数据库应用形态无法比拟的优势。由于信任模型发生了本质性转变,外包数据库带来了
随着互联网视频内容的不断增加,以及数字图书馆、视频点播、远程教学等大量视频媒体的应用,如何在海量视频中检索出所需要的资料显得至关重要。传统的基于文本的视频检索以及基
为了评估信用风险,研究人员做出了大量的努力,提出了各种度量和管理信用风险的方法。经典的评估模型一般将着眼点放在被评估公司自身的信息上,然而银行界获得的越来越多的共识是
随着网络技术的飞速发展和嵌入式处理器能力的不断提升,基于嵌入式Linux的网络视频监控系统逐渐成为了监控设备中的主流,因为嵌入式Linux功能强大且费用较低。但是直接移植Linu