基于NoSQL存储系统的研究与应用

来源 :重庆交通大学 | 被引量 : 0次 | 上传用户:god_save_me
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统关系数据库具有良好的可扩展性、高可用性、高稳定性,得到了广泛使用。但关系数据库毕竟是通用型的数据库,存在灵活性不足,大数据量情况下响应速度慢等问题,因而不能完全适用于大数据时代互联网应用的需求。鉴于此,研究人员研发了各种各样数据库技术弥补关系数据库的不足。其中以NoSQL为代表的新型数据库因数据模型灵活、响应速度快,可扩展性强等优点越来越受到人们的关注,但是现有很多系统是基于关系数据库的,如何从现有关系数据库系统中引入NoSQL数据库,让关系数据库和NoSQL数据库各自发挥其优秀的性能仍是目前急需解决的问题。本文依托于实际开发的项目——校园58分类信息平台,在关系数据库基础上引入NoSQL数据库,研究两者在深度融合方面的关键技术,包括建立了以关系数据库为主库,以Redis为从库的异构读写分离方案、数据同步技术、客户端分片集群均衡技术等。主要完成以下几个方面的内容。(1)针对原有MySQL系统单一存储架构,引入了Redis这种新型的NoSQL数据库,改进存储系统的整体架构方案,让MySQL负责存储所有数据,提供持久化支持,Redis数据库负责缓存数据结构简单、读取频率高的数据。服务器接收到写入请求时,直接往MySQL中写入数据,并定时同步热点数据到Redis中。服务器接收到读操作请求时,首先在Redis中读取数据,读取失败再从MySQL中读取数据。从而实现了存储系统读写分离,提高了大数据量高并发情况下系统访问效率。(2)根据大数据量存储迁移的需求,在分析、总结现有存储结构和数据迁移技术的基础上,设计了合适的数据存储结构,利用Redis管道机制对数据迁移方案进行改进;同时在大数据量情况下采用hash结构、简化键名的方式节约内存;通过多线程合并操作减少网络开销,提高系统运行效率。(3)随着用户量越来越多,数据量越来越大,单台数据库服务器满足不了日益增长数据量的需求,需要在系统中实现分布式数据库集群。本文针对现有Redis分布式集群负载均衡技术存在的不足,提出了带冗余数据的一致性hash算法,优化了现有Redis客户端分片集群的负载均衡技术,提高了系统稳定性、可用性。最后把研究成果应用到校园58分类信息平台中。结果表明,系统能长时间稳定运行,个别服务器出现故障不会影响系统运行,改进后的数据迁移率明显提高,在高并发情况下,改进后的存储系统整体性能高于原来的存储系统。
其他文献
进化算法是建立在自然选择原理和自然遗传机制上的新型优化算法,有着简单、通用、健壮性强、适于并行处理等显著特点。多目标优化问题是科学和工程研究领域的一个难题和热点
图像分割是图像处理和计算机视觉中的关键技术之一。它有助于提高基于图像内容的特定目标定位的准确性,在图像的编辑抠图等技术中离不开正确的分割。图像分割的方法浩如烟海,但
随着企业级应用需求不断提升,大吞吐量、高性能、高可用性和高稳定性已经成为判定一个企业生产管理系统是否成功的主要标准。同时,随着人们对计算能力的依赖,企业级应用已经
在B3G/4G的网络环境下,未来的通信业务将具有泛在、融合、智能化协同工作的特征。业务平台可以根据用户的请求,捕获用户当时的环境信息和个人数据信息,为用户提供量身定做的个
目前网络学习资源日益繁多,面临着资源分散、资源冗余、共享性差、对资源检索难以实现预期希望的现状。从生态学的角度讲,就是各个物种之间的某个食物链和能量链(知识链)缺失
随之科技的迅猛发展,如今的手机已经不单单是一种通信工具,他的处理能力可以与一台小型的计算机相媲美。与此同时,无线网络的传输能力和传输质量的不断提高,3G时代的到来,这
近年来,随着各种高速超大容量网络迅速普及,人们对信息的安全性需求变得越来越迫切,然而,信息安全技术仍然很落后,且信息安全算法的软件实施已成为网络性能提高的系统瓶颈。
以Internet为代表的信息网络已成为现代社会最重要的基础设施之一,它逐渐渗透到社会的各个领域,成为知识经济的基础和载体,并在人类社会的政治、经济、军事、文化和商业等各
生物信息学是一门交叉科学,它包含了生物信息的获取、处理、存储、分发、分析和解释等在内的所有方面,它综合运用数学、计算机科学和生物学的各种工具,来阐明和理解大量数据
随着Web服务技术的成熟,越来越多的企业将自己的业务作为Web服务发布到互联网上。然而,一个单独Web服务的功能并不完备,只有把互联网上多个简单的Web服务按照一定的逻辑顺序组合