数据传输和存储的关键技术研究

被引量 : 1次 | 上传用户:zw198518
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的蓬勃发展,互联网应对的数据量不断增长,如何组织和管理海量数据成为了互联网行业发展的关键。传统的关系型数据库在可扩展性、查询性能、并发性的灵活性上已经不能满足互联网海量数据的需求,非关系型的分布式数据库有了越来越广泛的应用。典型的非关系型的分布式数据库有:Cassandra、Hypertable、 Rodis、Tokyo Cabinet、Voldemor、MongoDB等。他们的实现方式不同,性能各有所长,但都具有良好的可扩展性和并发处理能力。虽然非关系型的数据库弱化了关系型数据库的某些功能,但也简化了数据管理策略,满足了互联网对海量数据存储的要求。论文中的研究工作以分布式数据库Hypertable为平台,设计并实现了多副本管理策略,提高了数据的可靠性。Hypertable是一个C++编写的开源key-value型数据库, Hypertable采用索引结构来管理和定位数据块,底层用分布式文件系统实现数据的持久化存储。HBase是由java编写的与Hypertable结构原理相同的数据库,但Java的内存回收机制不如C++的内存回收及时,这使Hypertable在内存管理和效率上有很大优势。本文的重点是多副本管理策略的实现,这是我在大云项目中的主要工作。相关的代码和功能模块可分为元数据子系统、备份计划子系统、备份日志子系统和数据块管理子系统四个部分。元数据系统主要用于管理和维护数据块的位置信息和结构信息,由于数据的查询和更新都需要首先得到数据块在分布式系统中的位置,所以元数据的管理十分重要。备份计划用于管理创建副本的流程,便于不同的服务器之间协调工作,加入副本策略后的数据库有多个功能需要多个服务器协作完成,这些功能模块在备份计划子系统中有详细说明。备份日志用于副本的创建和副本的同步,新建副本和更新副本时,需要对日志进行传输和回放以保证多个副本的一致性。数据块信息管理系统是服务器对本地数据块的管理和维护。这四个部分是相互协调、相辅相成的,一个用户请求往往需要这四个部分共同作用。多副本管理策略的相关工作分为多副本策略的实现和系统性能测试两部分。在多副本策略的实现部分,各个功能模块的函数接口,函数处理流程都有详细地说明,对副本数量的设置和修改方式、副本同步时间间隔也做了详细说明,副本数目一般为3。在系统性能测试这部分中,对改进后的Hypertable做了并发性测试和读写性能测试。
其他文献
<正>可持续旅游正在兴起,旅游者需求不断增长,旅游经营者正在开发新的绿色旅游产品,各国政府以及国际机构正在制定新政策,以鼓励可持续旅游的发展。然而,"可持续旅游"的真正
随着互联网络和信息技术的发展,旅游业作为信息密集型的行业正发生剧烈的变化,以Travelocity、Expedia等为代表的虚拟旅游公司及产业得到快速发展。本文通过对近期400余篇虚
基于5种不同资本形式,建立了家庭牧场可持续发展综合评价指标体系,引入熵权法客观地赋予指标权重,定量地评价了内蒙古白音锡勒牧区30个家庭牧场可持续发展现状。针对不同资本要
【正】 苏联的经济改革实际上是从赫鲁晓夫时期开始的。五十年代中期起,苏联经济改革由农业扩展到工业,由实践工作扩展到理论领域,声势颇大。但是,赫鲁晓夫时期的改革,虽然起
ITU(国际电信联盟)的统计数据表明,2012年的移动互联网用户已经攀升至15亿,而这个数字还在迅速增长。随着移动互联网行业的蓬勃发展,智能终端的市场竞争日趋白热化,智能终端
英汉两种语言对各式各样的动物赋予了各具特色的文化涵义,构成了富有特色的动物词汇隐喻。但由于民族文化背景、思维方式、地理环境、风俗习惯和宗教信仰等方面的异同,英汉动
近 2 0年来 ,民族旅游业极大地推动了民族地区社会和经济的发展。然而 ,在民族旅游业迅速发展的过程中 ,一些民族地区的自然和人文资源也受到了威胁和破坏。可持续发展是我国
目的:初步探讨过敏性鼻炎-哮喘综合征的中医证型分布情况。方法:结合作者临诊经验,从中医证型分布出发,观察了223例CARAS患者,经四诊信息收集、辨证分型归纳,初步得出CARAS证