论文部分内容阅读
在构建大规模企业级应用时,采用面向服务的体系架构(SOA)不失为一种可以有效控制开销的方式。通过使用SOA,企业系统可以定义、执行分布式、跨多重服务领域的服务。然而,对于大规模商业流程而言,对其的管理是一项富有挑战性的任务。当发生端到端的服务质量失败时,必须有一种机制去定义服务的责任,包括服务级别协议的违反和功能性错误。因此,SOA的灵活性和动态性,使得对其运行时服务行为的监管与诊断,成为性能保证至关重要的一方面。论文首先阐述了SOA与Web Service的相关理论知识,介绍了采用贝叶斯网络推理进行故障诊断的相关技术概念:包括可计量的体系架构、敏感性分析技术、K-median问题、诊断参数等。论文详细介绍了可计量的故障监管诊断框架,以及相应的贝叶斯网络诊断算法。论文在原有的ECS故障迹象集选择算法的基础上,综合贝叶斯敏感性分析技术以及K-median模型,并加入故障标识集,改进了原有的故障迹象集选择算法和故障诊断算法。论文的主要工作是细化了可计量的故障监管诊断框架,设计并模拟了一个基于SOA的监管诊断环境,改进了贝叶斯网络监管诊断算法,即增加故障疑似集、故障事件集以及故障标识集:在贝叶斯推理进行之前,先利用改进的故障迹象集选择算法缩小诊断服务的范围,并且记录了故障事件的历史数据;细化了可计量监管框架各个组件的功能,并据此模拟了监管诊断的环境。通过实验,比较了采用了改进的故障疑似集选择算法和ECS算法、顶端聚簇算法、底端聚簇算法这四种策略来进行故障诊断的性能,验证了本文改进的故障迹象集选择算法的优势。论文采用的基于事件驱动的迹象集选择策略,显著地提高了故障诊断的性能,并且有利于以后的预测分析以及历史信誉的评价。最后,论文对基于SOA的网络监管框架的诊断策略、模拟环境的设计和算法进行了总结,并对未来进一步的研究工作进行了展望。