论文部分内容阅读
网络故障管理是网络管理的基础工作,也是最重要的网络管理任务。主要包括网络故障检测、网络故障定位、网络故障隔离、网络故障恢复等几项关键技术。如何保证网络故障监视数据的有效采集、如何优化故障管理策略、如何快速定位网络故障等则是网络故障管理的主要内容,本文从网络故障监视算法、网络故障定位策略、快速网络故障诊断以及故障管理在Ad hoc网中的应用等四方面对网络故障管理进行了深入研究,具体研究成果如下;1.在网络故障监视方面,本文提出了一种动态网络监视算法,本算法可以帮助故障管理系统在监视到网络故障的同时降低实时监视带来的网络管理负担,算法根据轮询和事件通知获得的网络状态数据,预测发生告警的可能性,对于不发生告警的情况,则延时轮询,同时采用告警滞后机制过滤冗余告警信息,保证了既不漏报告警,又有效地降低了网络管理的通信负担。论文同时从理论上对该算法的性能进行了分析,并证明了该算法的有效性。2.在网络故障定位方面,本文提出了MMDP网络故障定位策略算法。网络故障监控系统是一个随机动态响应系统,故要求当网络性能变化时,能够进行策略调整,保障网络故障管理的有效性。论文从理论上证明了马尔科夫过程在网络故障管理模型上的可行性,分析了当多个管理者共存的情况下马尔可夫决策过程,提出了MMDP故障定位策略算法。在多管理者管理的情况下,中间管理者之间可以交换响应消息,从而获得其他子网的统计数据,本算法结合强化学习模式,在有限阶段选择最优策略,从而使系统报酬最大化。论文确定了故障数据采集过程中MIB库的被管对象以及轮询方式的结构,进而指出轮询步长会随着被管对象数目的增加而增加,随着观测阶段的延长而减少。3.在网络故障诊断方面,本文采用贝叶斯置信网,研究了网络故障的快速发现问题。贝叶斯置信网是一种基于概率的不确定性推理网络,它所采用的依赖关系模型符合面向对象的开放式网络系统的特点,论文利用贝叶斯置信网的信念推理,从理论上证明了贝叶斯推理算法在给定的Noisy-Or节点以及Noisy-And节点模型上的可行性,提出并证明了最优寻径算法,所提出的最优寻径算法在故障发现时间等方面明显优于没有采用这种寻径的故障定位算法。4.本文针对Ad Hoc网络无线、多跳、移动的特点,分析了故障管理在Ad Hoc网络中的应用,讨论了实现Ad Hoc网络的分层分布式网络管理体系结构,通过设置和监视被管对象的状态的改变,完成故障管理任务。论文给出了故障管理需要的但未出现在MIB-Ⅱ中出现的故障管理信息,为网络故障管理提供了一个较为完整的应用实例。