基于MongoDB的数据存储技术的研究与应用

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:as33as
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
第三代测序技术的到来对基因的研究有着里程碑式的意义,通过进一步挖掘蕴藏在基因里面的奥妙对我们了解人类进化过程,揭露生命现象本质,预防重大疾病,疾病精准治疗等方面都有着不可或缺的重要作用。传统基因技术与大数据、云计算的交叉式结合应用,一方面产生了海量的基因数据,这些海量宝贵数据不仅仅需要永久保存,同时也需要被快速存储和提速,另一方面,对存储海量基因数据的数据库系统架构有了更高的要求。对于海量基因数据的存储,传统的关系型数据库已经无法满足需求,无法实现海量数据下的高速访问和大规模并发查询,尤其是在面对数据库集群的横向扩展和数据类型的多样性等方面时,显现得力不从心。本文中所提到的Nosql数据库能够支持海量数据高并发读写、数据高效率存储、数据库高可用性以及数据库集群高扩展性,更好地弥补了传统关系型数据库的不足。作为当今最受欢迎的非关系型数据库,MongoDB不仅具有NoSQL数据库的优点,而且能同时实现传统型数据库的索引和查询功能。本文以MongoDB为例,主要研究了以下内容:首先本文对Nosql数据库的定义、特征、种类做了相关介绍,并与传统关系型数据库进行了理论对比,得出Nosql数据库在海量存储和访问方面的优势,同时也对负载均衡算法的定义以及一些常用的负载均衡算法进行了描述。其次本文研究了MongoDB中的分片机制和负载均衡算法,并针对该负载均衡算法只能达到数量上平衡的缺陷,做了相关改进,通过加入节点实时负载和chunk操作热度数这两种参考指标,提出了一种改进的负载均衡算法,并通过对比实验验证了其有效性。最后,针对目前基因组存储系统在面对海量数据存储和访问时无法实现高扩展、高可用、高并发的缺陷,设计了一个基于改进算法的MongoDB基因组存储系统,并通过实验对系统的性能做了一个较为全面的评估。
其他文献
染色体微阵列分析技术(CMA)是目前诊断不明原因智力障碍、生长发育迟缓、孤独症及多发畸形患者的一线技术,阳性检出率约为1 0%-20%。被检出的CNVs中包括大量临床意义不明变异
会议
村镇银行的经营绩效问题,不同于一般商业银行.它的成立,往往是要承担一定的政治任务和社会绩效,以服务农村,促进第一产业发展。因此,在评价其经营绩效时,除了考虑到一般商业银行最关注的盈利性、流动性、安全性之外,还应该重点考虑到其政策性和社会性,这一点尤其体现在村镇银行对农贷款的支持力度上,这是金融行业支持农业实体经济发展最为直接的体现。本文研究先是总结分析了过去国内外学者有关村镇银行极其效率分析的研究
目前,独立随机变量的概率极限理论已经发展得相当成熟,有迹象表明,在理论与应用中,他们将被更加广泛地使用。然而,在现实生活中,我们遇到的问题并不一定总能满足对应的独立性假设条件。在这一苛刻约束的限制下,一些特殊的相依结构与混合结构不断地涌现出来,吸引了大量学者的关注。其中,宽相依结构就是一个重要的相依结构,相关的研究具有十分深远的意义。本文主要讨论了宽相依随机变量最大随机加权和的完全收敛性和完全矩收
目的通过检测孕妇母体血清及其胎盘组织中CXCL12、CXCR4、VEGF、PLGF的水平,统计分析CXCL12、CXCR4、VEGF、PLGF与子痫前期及其合并FGR发病的关系,探讨这四种因子在子痫前期
随着移动互联网的快速发展,数字图像数量呈现激增的趋势,面对海量的图像数据,如何提取这些图像数据中有效的信息,并对其统一管理成为当前计算机视觉领域中的研究热点之一。因
SD公司是一家的中小型民营企业,主要从事碳晶面板发热材料的研发与应用,近年来在“煤改电”政策的带动下,该公司得到迅速发展。目前因种种原因,企业的发展遇到了瓶颈。本文通过对SD公司的企业结构、发展情况以及目前薪酬体系等内容进行调研分析,发现公司目前的薪酬体系存在一系列的问题:公司的薪酬结构对企业的发展没有带动作用,不能引导员工向公司所需要的方向进行发展学习;不同岗位之间的岗位工资相差不大,无法体现出
岩石孔隙结构作为储层地质的重要研究内容,一直是地质研究关注的关键基础问题之一。目前,岩石孔隙结构的表征已经积累了大量的表征分析方法。其中,成像分析法因其成本低廉、操作简单,分析结果准确可靠,是应用最广泛的孔隙结构表征方法之一,为岩石孔隙结构的分析提供了直观的表征策略。传统的岩石孔隙光学成像技术是将标记物(有机玻璃或环氧树脂)在高温高压下注入岩石孔隙中,会在一定程度上对岩石的原生孔隙结构产生破坏,影
人脸表情识别研究涉及到心理学、计算机视觉、模式识别等多个学科领域,具有很高的理论价值和现实意义。如何利用机器学习和深度学习的方法提高准确率和时效性是近年来的一个
自复杂网络理论提出以后,对于复杂网络理论方面的研究不断地得到丰富和完善。SIS(Susceptible-Infected-Susceptible)病毒传播模型属于病毒传播中较为经典的一类传播模型。本
硫化氢(Hydrogen sulfide,H2S)是继一氧化氮(Nitric oxide,NO)和一氧化碳(Carbon monoxide,CO)之后的第三种气体信号分子。CSE(Cystathionine-γ-lyase,CSE)被认为是心血管系统中主要