【摘 要】
:
与传统的单机系统相比,集群系统具有更高的可扩展性、更高的性能价格比和更高的可靠性,因而愈来愈被广泛地应用到国民经济的各个领域.随着集群系统规模的不断扩大,集群系统内
论文部分内容阅读
与传统的单机系统相比,集群系统具有更高的可扩展性、更高的性能价格比和更高的可靠性,因而愈来愈被广泛地应用到国民经济的各个领域.随着集群系统规模的不断扩大,集群系统内部发生故障的概率也会呈指数增长.对于集群系统内部发生的节点机故障,一般采用优美降级的方法.但是对于运行时间较长的并行数值计算,如在计算过程中,它所在的节点机发生故障,就会导致整个并行计算的彻底失败,故障之前的大量计算不可再用,程序不得不从头开始执行.为了避免因为单个故障导致整个并行计算失败而引起的计算上的大量浪费,就必须采用相应技术来进一步提高集群系统的可靠性.而检查点技术(Checkpointing)正是目前被国内外广泛研究的一种用来提高集群系统高可靠性的关键技术.检查点技术的基本思想是在系统政党运行的时刻设置检查点,保存系统当前相关进程的进程级信息到可靠的存储器上,当系统发生故障时,将系统卷回(Rollback)到上一个检查点处重新执行,而不是从程序开始执行.在美国国家橡树岭实验室开发的并行虚拟机(PVM)的基础之上,针对提高系统可靠性的要求,进行了内核一级的分布式检查点技术的研究与实现工作,研制了FTPVM原型系统.这样,FTPVM原型系统不仅实现了对于集群并行计算机系统瞬间故障的恢复,而且也实现了对于集群并行计算机系统永久性故障的恢复,从而最终成功地实现了集群环境下的并行计算的高可靠性.
其他文献
H.264/AVC是国际上最流行的视频编码标准之一, H.264比其它编码标准更具有高效压缩和高可靠传输的优势。然而,编码H.264视频会消耗大量处理器资源,导致编码速度较低,为此,学
本文围绕C2这种特定风格的软件构架,对构件组装涉及的多个方面进行了全面的研究.首先,作者以软件构架为系统模型,阐述了一个支持配置管理的软件构架XML描述方法.对于构件组装
WirelessHART协议是一种专门应用于工业过程自动化控制领域并具有安全与稳健的网络拓扑结构的无线网络通信协议。按照简单性、可靠性和安全性的设计准则,它提供了一种具有低
该文阐述了我们对软构件属性模型与语言的研究成果,引出了一组问题抽象,以便对目前软构件模型语言所做的描述进行改进.我们称新的模型为图形形式语言模型(GFL),以满足软件工
数据挖掘是一门从大量的数据中挖掘出隐藏的有潜在价值知识的技术,是当今研究的热点内容之一。数据挖掘的技术有:决策树方法、模糊集方法、遗传算法、神经网络方法、粗糙集方
该文对嵌入式Linux技术进行了系统分析,并详细介绍了一个完整的嵌入式Linux系统,就其各个主要子系统,如初始化、中断处理子系统、进程调度、内存管理子系统、文件子系统、网
Intranet(企业的内部网)是将Internet技术引入现存的企业的网络,能更好地满足企业的经营和发展需求的一种新型网络,近两年已经得到了迅速的发展。将Intranet方式引入电厂管理信息系统中,建立全省甚至全国的电力企业信息网络,可以实现将来整个电力系统信息共享、互相协作、统一调度、统一指挥,具有重大的意义和非常广泛的应用前景。 本文主要工作是:基于Intranet的电厂MIS应用软件
医学图象有配准,尤其是多模态的医学图象准技术是一项难度较大的研究课题,得到了广大医学影响学影像学学者的广泛关注和研究,有着很高的理论研究价值和商业应用价值.该文首先
"SET协议的消费者隐私性保护改进与商家系统软件实现"是国家药品监督管理局委托我们开发的"网上药品信息监管系统"中为实现对药品网上交易的监督而预先研究的内容.为满足消费
现代计算机通信网正朝着ATM交换网和宽带综合业务数字网(B-ISDN)的方向发展,其服务业务包括话音、数据、传真和视频等。每种业务都有不同的统计特性并需要不同的服务质量(QoS)