云环境下分布式应用多级故障恢复机制研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:yuantian723
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着云计算的发展,虚拟集群技术应运而生,将分布式应用部署到虚拟集群已成为一种趋势。但是,虚拟化层的引入造成故障层次增多,系统整体故障率也随之增高,而且物理层故障造成的损失也更大。这无疑阻碍了分布式应用向云环境迁移的步伐。现有的解决方案一般基于传统的节点冗余和进程迁移技术,不适应弹性的云服务模式且资源利用率低,或者基于虚拟机级别的容错技术,不具有高效性。  云环境下分布式应用多级故障容错系统(CDMCR),为虚拟集群中的分布式应用提供了透明、高效的分层容错机制。CDMCR采用基于虚拟磁盘快照的检查点协议,将程序的执行状态和文件系统的当前状态周期性地备份到分布式备份存储库中。备份文件只保留与应用程序相关的状态而忽略虚拟机的运行状态,从而最大限度减小备份开销。磁盘快照保存了备份时刻的文件系统状态,能够解决应用程序恢复时的环境依赖问题。分布式备份存储库通过各物理节点的空闲存储构建而成,在提高存储资源利用率的同时能够缓解集中式存储带来的I/O瓶颈问题。CDMCR实现了多级别的故障检测机制,能全面应对应用程序故障、虚拟机故障、虚拟机管理器故障和物理机故障。检测到故障时,CDMCR利用分层的故障恢复机制对故障组件进行逐级恢复:采用进程检查点直接恢复应用层故障,采用虚拟机克隆技术对故障虚拟机进行快速恢复,在物理层故障情况下采用调度算法根据物理节点的历史故障率和资源负载情况选举最优迁移目标节点。CDMCR能够集成到StrongCloud容灾云平台中,为用户提供高可靠的分布式应用容错PaaS服务,做到可靠性和易用性的统一。  功能测试表明,CDMCR系统能够为用户提供弹性的虚拟容错集群服务,能够自动对应用进行备份,在模拟故障发生时,系统能够准确检测故障并自动对虚拟集群和分布式应用进行恢复。性能测试表明,系统的单次备份开销小于10s,总的备份时间开销占应用程序正常运行时间的比例不超过20%,且在虚拟集群节点规模呈指数增长的情况下该比例保持稳定。
其他文献
BOSS在整个通信系统中处于非常重要的位置,它是电信运营商一体化、信息资源共享的支持系统。随着电信市场的不断发展和激烈竞争,以及新业务的不断出现,尤其是数据增值业务发展迅
针对目前Web服务中遇到的问题,研究界提出了将语义Web的技术应用到Web服务领域,为Web服务的描述提供语义信息,即语义Web服务(Semantic Web Services)。语义Web服务技术通过为
目前异构系统之间的信息交换和互操作已经引起业界的高度重视,并成为业务过程集成研究领域的一个热点问题。Web服务在Internet标准协议基础上,为解决异构系统的互操作和企业
虚拟现实技术(VR)是近年来十分活跃的研究领域,而虚拟手术是虚拟现实技术在医学领域的重要应用。可以用于术前对手术过程的模拟,提高手术的成功率,降低医疗成本。本文对给定
在桌面虚拟化环境中,虚拟机镜像文件经常采用集中的方式存储。当虚拟机大量并发启动时,由于网络拥塞或者物理机的磁盘I/O能力不足,经常导致启动风暴的发生,即虚拟机镜像文件从存
专有名词的识别是中文信息处理领域的重要研究课题之一,目前尚未得到很好的解决。在大规模真实文本为基础的语料库研究的重要性日益突显的情况下,如何提高大规模语料库的质量
在现代开放网络环境下,大量分布在不同网络中的信息往往需要被一个多变的、动态的人群使用和管理。为了在应用中安全有效使用这些信息,要求访问信息的用户身份和访问特权必须
随着以互联网技术为核心的信息技术的发展,网络教育在我国得到了蓬勃发展。建构主义强调的教学环境是以学习者为中心,强调学习者对知识的主动探索、主动发现和对所学知识意义的
随着互联网的发展,对软件兼容性和可移植性需求剧增,虚拟机的发展进入了一个繁荣的时代。同时,随着x86服务器市场的快速增长,x86虚拟机更是为人们看好。根据VMM(Virtual Machine
本文首先主要介绍了下一代网络的发展状况及NGN的安全,然后分析了IPSec的安全能力,安全体系的构成、IPSec的工作方式以及IPSec在IP的实现方式。论述了IPSec的基本协议认证扩展