基于虚拟化平台优化机群可用性问题的研究

来源 :中国科学院计算技术研究所 | 被引量 : 0次 | 上传用户:chen20080310
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于机群具有低成本、易管理、易扩展等优势,在高性能计算领域中机群架构所占的份额越来越大。机群性能的提高以节点规模的扩张为代价,因此,人们对计算能力的不断追求同时带来了故障增加,可用性降低的问题。传统的机群容错技术在解决上述问题时存在一定的局限,本文另辟蹊径,利用时下非常热门的虚拟化技术进行机群容错的研究,提出了主动容错策略。   主动容错策略区别传统机群容错技术的被动容错策略,利用不影响业务运行的虚拟化实时迁移技术,在告警模块告知硬件故障潜在威胁的情况下,分析告警原因,并根据整个系统的运行状态选择合适的物理节点实施迁移,将故障隐患节点上虚拟机迁移到安全节点上,从而在故障产生之前避免了可能的故障带来的影响。另一方面,用户可以提交硬件维护和升级需求,由管理模块告知主动容错策略实施待维护节点的虚拟机转移,避免了由于硬件维护导致的业务中断。计算节点的资源长期不足的情况可能导致软件效率的下降甚至软件的崩溃,针对这一情况,主动容错策略利用虚拟机资源可以动态调整的灵活特点,设计了全局资源动态重组的子策略。这一子策略在一定程度上缓解了资源不足的情况,因而间接上为潜在故障的减少有所裨益。   本文研究的主动容错策略聚焦于提升系统的可用性,因此在策略的设计之后本文使用了几组大规模机群的故障数据,考察在实施主动容错策略之后的可用性提高情况,验证了该策略的有效性和意义。
其他文献
软件定义网络(SDN:Software-Defined Networking)采用了数据平面与控制平面相分离的开放式系统架构,可有效地简化网络的控制与管理,促进网络的创新。早期SDN控制平面向外提供低
DNS(Domain Name System,域名系统)作为互联网的基础设施,支持了绝大多数互联网应用的顺利运转,从根本上保障了互联网上各主机之间的互联互通。因此如何有效的实时监控域名服务
学位
互联网的蓬勃发展,加速了人类信息化时代的到来。在高度信息化的今天,大量庞杂的信息充斥着网络,而且信息的规模还在不断地急剧增加。因此人类希望能快速查询信息、准确获取信息
学位
J2EE无疑是当今社会炙手可热的企业应用框架,它的主要目的是实现可跨平台的大规模企业应用。网格计算是计算机研究领域中的一朵奇葩,它的主要目的也是实现大规模的资源共享。 
近几年来,深度神经网络发展迅猛,引起了包括学术界和产业界的广泛关注。这项技术在计算机视觉、语音识别以及自然语言处理等众多领域取得了巨大的突破,显著提高了算法在多种任务
随着大数据时代的来临,社交媒体网站的日益普及促使越来越多的人参与到多个在线社交网络中,不同的在线社交网络平台以不同的功能吸引用户,如信息搜索、分享或社交联系等,为了更好
工业无线网络技术是继现场总线之后,工业控制领域的又一个热点技术,是降低工业测控系统成本、提高工业测控系统应用范围的革命性技术。无线HART规范作为第一个开放的工业无线网
目前网络发展日新月异,网络的复杂性也随之不断增长,对网络管理的要求也日益增加具体表现在管理功能的增强和管理对象的扩大,这使得网络管理管理系统逐渐成为网络运营和维护的一
随着深亚微米工艺技术的快速发展,SoC技术成为超大规模集成电路发展的必然趋势。在SoC平台上集成视频系统有着极高的实用价值,对于其在手机通信、数码相机、监控系统、影音播放
随着人类社会的发展,城市规模逐渐扩大,三维数字城市为人们规划管理城市提供了一个高效的信息服务平台。大规模城市建筑物群的构建和渲染是三维数字城市工作中的一个不可或缺的