分布式图数据库存储引擎的事务管理的设计与实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:baobaolan1007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网在各行业的深入应用,涌现了许多分析事物关联关系的新需求,由于存在大量连接操作,传统关系型数据库处理这些需求的延迟难以容忍。为高效处理海量复杂数据之间的关联操作,图数据库应运而生。由于单机能力有限,海量数据必然要求图数据库分布式化。分布式图数据库有许多应用场景,如离线分析、在线查询等。在线查询要求图数据库增量更新,分布式图数据库必须具有事务能力,这也是当前分布式系统一个热点问题。传统上,一般采用两阶段提交(2PC)实现分布式事务。其它的分布式事务解决方案,如三阶段提交等,本质上都是对2PC的优化。2PC协议假设节点可用,但当前分布式系统大多采用普通商用PC机,这个假设并不成立。如何在节点不可用的场景下,高可用的实现分布式事务是本文需要考虑的问题,本文的分布式事务方案主要参考Google提出的Percolator事务模型。本文尝试设计并实现分布式图数据库中的分布式事务功能,主要工作包括:(1)多版本并发控制:并发控制方案采用多版本并发控制(MVCC),实现了Read Snapshot的隔离级别,并优化MVCC存储模型,减少序列化次数。通过MVCC能够快速获得系统的数据快照。(2)分布式事务:设计并实现分布式事务模块,避免使用传统的两阶段提交协议,基于Percolator事务模型进行优化,减少事务执行的关键路径上数据持久化和远程过程调用的次数;简化协调者的执行逻辑,使其无状态化。使用批处理、异步提交、流水线处理等技术优化事务执行效率。(3)高可靠的容错方案:基于分布式一致性协议Raft,设计并实现Multi-Raft协议,保证数据可靠地复制至大多数节点。Multi-Raft中引入多个Raft Group,通过将分片分散存储于系统中,保证系统的负载均衡。并实现自动化调整功能,如当负载均衡被破坏时,进行分片调度、Leader切换等。在基准测试中,对系统的主要模块进行了完整的功能测试和性能测试。功能测试结果表明系统能够正确处理读写请求和事务请求、能够正确应对事务执行过程中的异常情况;性能测试结果表明读写请求和事务请求的处理性能达到了预期目标。
其他文献
随着社会发展及人口的增加,饮用水污染已成为一个重大环境问题。兰州市地处西北内陆,黄河流域上游,黄河水是兰州市最为重要的饮用水源。近年来,随着流域经济的迅速发展,水资
这是一本叫做《老子〈道德经〉解释》的书(王凯著,人民出版社2012年12月第1版)。可别小看了这"解释",它却集哲学、历史、文化、训诂等丰富内容,成为学习古代典籍的"小百科"。伟大的
目的:回顾性观察克氏针引导的镜外环锯技术(transforaminal kirs-wire guiding external trephination under endoscopy,ET技术)和传统TESSYS技术(Transforaminal endoscopic
酝酿多时的深圳二次土改,从去年5月开锣至今,总算露出庐山真面目。上周五,深圳推出《关于优化空间资源配置促进产业转型升级的意见》,还有诸如闲置土地处理、工业楼宇转让、产业配套住房管理等6个附属文件(简称“1 6”)。这些文件重点其实就说了一件事:深圳辖区内原农村集体经济组织继受单位(现已全部转变为村股份公司),其合法工业用地可申请进入市场流通。  就这么一件事,还是经过国土资源部特批的,之前在全国并
翟灏生活的时代,恰逢朴学大盛时期,受时代思潮之影响,所著《论语考异》具有三大注释特点:其一,注重对经文和音读的校勘;其二,引证广博,不立门户;其三,博搜泛采,资料翔实。《论语考异》是
在我国上市公司中,股权集中这一现象较为普遍。这种现象会造成监管层并不能发挥应有的监管职能,从而使得企业的投资者、债权人以及中小股东的利益受到侵害,他们投资的信心受挫不利于我国的经济市场的进一步发展。在这样的氛围之下,控股股东利用自身的优势,左右上市公司的经营决策,从而进行隧道行为,掏空上市公司,使得上市公司的发展受到阻碍,甚至是股票被“ST”。近两年备受市场关注的康得新复合材料集团股份有限公司,由