Parallel C语言级容错机制的设计与实现

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:o9876521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大规模异构众核计算机系统具有计算能力强、性能功耗比高等突出优点,已成为超级计算机的发展方向,但其复杂的异构结构和庞大的系统规模,也使系统的可用性面临巨大挑战,因此研究面向大规模异构众核系统的轻量级容错技术具有重要意义。针对传统基于检查点的系统级容错开销过大的问题,在Parallel C语言中设计并实现了故障局部感知的轻量级降级、编译指导与自动分析的检查点等语言支持的容错机制,兼顾了好用性和高效性。局部故障感知的轻量级降级结合动态任务调度框架实现,支持众核系统,可扩展到百万以上并行规模;编译指导与自动分析的
其他文献
三维激光扫描技术可以快速而精确地获取既有建筑的完整点云数据,但要从点云中获得修缮设计及结构健康评估所需要的特征信息仍然是一个极为耗时耗力的工作。为改善目前纯手工交互的作业现状,提出了一种从点云中快速获取建筑特征剖面数据的算法,阐述了其基本思想与作业流程,并研发了基于该算法的具有较高自动化水平的剖面图制作软件工具。实际应用证明,软件在面对海量点云数据处理时,能够显著提高作业效率及提升成果制作质量。
研究了直觉模糊推理三I约束算法,给出了IFMP、IFMT问题的直觉模糊推理三I约束算法解的表达形式和分解形式,在此基础上,指出了直觉模糊推理三I约束算法是模糊推理三I约束算法
针对现有的边缘缓存策略无法有效预测短时热内容集和冷内容集流行度时变规律,而基于探索的多臂算法缺乏有效机制解决探索过程的过量探索问题,提出了基于用户中心访问行为的多
针对具有领导层与跟随者层的多智能体网络点对点的一致性问题进行了研究。为了有效降低多智能体一致性控制协议的更新频率,同时为避免芝诺现象的产生,采用了周期采样与事件触
马克思哲学作为思考和探究“现实的人及其历史发展的科学。”其实质是一种实践人学。和旧哲学不同之处在于:其运思路向是生存论的,而不是知识论的。哲学生存论与传统知识论的简
软件测试是一种极为有效的软件质量保证手段。测试数据生成是软件测试的关键。基于智能优化算法的测试数据生成方法为自动化的测试数据生成提供了解决问题的一个有效手段。首
采用国际电信联盟(ITU)的星地链路计算模型,推导出考虑站点分集增益后的大气总体衰减计算公式,并据此定量仿真分析站点分集对低轨遥感卫星Ka频段星地数传链路可用情况的改善效