论文部分内容阅读
随着现代计算机网络技术的发展,诸如银行系统、火车票网上订票系统、卫星控制系统等分布式系统得到广泛的开发和使用。针对大规模分布式系统以及安全至上的系统,容错能力是其设计开发必需考虑的一个重要因素。一方面,系统复杂性的增加必然会降低系统整体的可靠性,即使所有组件都具有高可靠性;另一方面,总是存在某些不可预期的环境因素或者潜在的软件错误没有被设计者考虑在内。 容错系统的正确性由分布式系统的安全性质和生存性质保证;这两种性质往往与系统功能模块的状态相关,取决于分布式算法。因此,系统的容错模块与功能模块紧密相关。在理解、设计或者扩展分布式容错系统的框架时,无论是增加失效类型,还是增加容错机制,或是增加容错的系统组件,系统的设计、开发与维护人员都需要首先对(原有的)系统模块有详尽的认识,甚至可能需要学习与容错计算相关的理论体系,然后才能开展进一步的研究与开发任务;另外还需注意,系统的局部修改和维护非常困难,容易引发新的失效。 为了简化上述冗长并且繁琐的系统开发流程,基于可用于刻画并发通信实体的通信顺序进程理论(CSP),借鉴维也纳开发方法(VDM)既有语言成分的定义,本文使用维也纳定义语言(VDL)元语言定义了一种抽象的容错描述语言(FTDL),用于刻画计算系统的行为。该语言的解释器定义主要包括对以下成分的解释:并发性,同步调用和异步调用,基于消息的通信,以及针对不同层次范围内默认类型失效的检测和处理监控。 为了说明如何使用FTDL语言,本文使用类似VDM语言语法成分的程序语言,分别描述使用Finn算法的分布式系统和使用选举算法的分布式系统,刻画如何描述分布式容错计算。 本文的研究在分布式容错计算领域具有探索性的特点。目前的工作进展,已经初步给出了核心部分的容错语言设计,以及基于这种语言的分布式容错计算描述,对于未来进一步沿着这个方向深入开展研究,具有实际的参考价值。