面向高性能计算的分布式故障定位框架

来源 :计算机应用 | 被引量 : 4次 | 上传用户:xiaobangzi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对高性能计算系统中故障定位难度高且实时性差的问题,提出了一种基于消息传递的故障定位框架(MPFL),包括基于树形拓扑的故障检测(TFD)和故障分析(TFA)算法。首先,在并行作业初始化时,将所有参与计算的节点进行逻辑上的树形划分,生成故障定位树(FLT),并将故障定位任务分布到节点上;然后,当消息库、操作系统等组件检测到节点异常状态时,基于TFD算法分析作业的FLT结构,根据负载平衡、性能开销等因素选择接收异常状态的节点;最后,节点利用TFA算法对接收到的异常状态进行推理得出故障,TFA算法使用基
其他文献
我国反贫困政策从单纯的救济式扶贫发展到救济式扶贫与开发式扶贫相结合,取得了重大成就,但也存在严重的问题。开发式扶贫与生态环境保护之间的冲突愈演愈烈,为了实现全体人
提出了新的混合FSO/RF系统信道模型,此模型不仅克服了雾和雨对链路的严重影响,而且降低了系统的能量衰减,提高了系统的可用性。该系统在接收端探测器采用比较光电流大小来选择适合信道传输的链路,克服了各种天气状况的影响,最大限度地满足用户对通信性能的要求。
认知功能是人脑加工、储存和提取信息的高级心理功能,在日常生活学习中具有不可替代的作用,有氧适能与大脑结构和大脑认知功能具有密不可分关联,有氧适能高的人群认知水平比
学校音乐教育是民族音乐传承和传播的重要途径,中小学音乐课堂是传承和发展传统音乐文化的主要阵地。将优秀传统音乐文化引入中小学音乐教学中,既能增强学生对传统文化精髓的
进入信息时代,在物流、外卖送餐服务,租车服务等领域中,车辆不再简单充当运输载体,拥有大量车辆这样的移动资源的企业往往把车辆作为一个信息点来对其进行数据采集并跟踪指挥