基于分层回滚恢复协议的动态分组机制研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:hlp2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着高性能计算的快速发展,高性能计算系统的规模快速扩大,在近几年间系统内核数目甚至达到了百万级别。因此,系统的平均无故障时间随之降到了小时的级别,远大于系统的平均无故障时间,导致系统频繁的出现错误,引起系统性能急剧下降。因此,容错在高性能计算领域得到了越来越多的重视,变得越来越重要。分层回滚恢复协议,是高性能计算中常用的容错方案,它结合了协作式检查点和消息日志协议的优点,根据应用程序特有的通讯模式将进程进行分组,并在组内和组间采用不同的容错机制。分层回滚恢复协议在提供错误控制的同时减少了需要记录消息的数量。然而,通过对MPI通讯机制和通讯模式的详细研究发现,随着应用的复杂化,应用的通讯模式并不是一成不变的。分层回滚恢复协议在这样的情景中并不能达到最高的效率。所以,在应用的通讯模式改变的情景中,有必要提出一种基于预测机制的动态分组策略,来进一步的提高分层回滚恢复协议的效率。在该动态分组策略中,应用程序被划分成多个程序段。每个程序段在运行完成后,通过分析消息传递记录来算出该程序段对应的进程分组方案,然后将得到的分组方案应用到下一程序段的运行过程中,以此来适应应用通讯模式的变化。该策略减少了进程分组的次数,从而减少了进程迁移引入的额外开销。基于该动态分组策略,设计并实现了一个基于分层回滚恢复协议的动态分组系统,并详细介绍了其中各个模块的功能以及对应的工作流程。通过在High Performance Linpack基准上应用动态分组策略,并在实验中分别使用两种不同的静态进程分组算法,评估了该策略在减少消息记录上的有效性和可扩展性。同时,定义了一个开销计算公式来评估分层回滚恢复协议的开销。实验结果表明,动态分组策略有效减少的消息记录从24%到45%不等,从而减少了内存资源的占用。另外,动态分组策略相较于静态进程分组算法减少了约15%的开销,同时具有良好的可扩展性。
其他文献
随着无线通讯技术、卫星全球定位系统和地理信息系统的快速发展,方便的获取并记录移动对象的位置信息成为可能。如何有效地对移动对象位置信息进行管理、查询及追溯是目前基于
随着自动化程度和系统集成程度的提高,实时内存数据库已经成为企业软件系统中的核心系统,而且也成为生产过程实时监控、生产信息实时管理与决策支持的基础,是进行数据分析与
本课题来源于国家“十一五”863计划重点项目——“面向流程管理的软件生产线”的子项目“表单设计工具”。   表单是工作流系统中传递信息的载体,是实现业务功能的基本单
激光雷达原始回波数据是激光雷达获取大气参数数据的原始资料,反映了大气运动的情况,是研究大气动态变化的珍贵资料。由于研究大气变化是一个大范围、广区域的活动,建立大气活动
移动Adhoc网络做为一种新型的移动无线网络,以其独有的网络特性,广泛应用到军事战场、地震救灾等特殊领域中。但是随着技术的不断发展,对网络性能的要求在逐步提高,尤其是对
计算机支持的协同工作(CSCW)是指借助计算机及网络技术,由多个分散的群体共同协调、协作完成一项任务。企业过程运作的核心技术是企业过程的协同运作机制,它决定了业务过程的
现代网络和多媒体技术给人们带来资源共享的同时,色情、暴力等不良信息极大危害青少年的健康成长。因此,如何快速有效的监测和过滤网络不良图像已经成为当前迫切需要解决的实际
近年来,无线射频识别技术(RFID,RadioFrequencyIdentification)逐渐兴起,已经被广泛应用于生产生活的各个领域。现有的RFID设备和应用系统在资产管理、目标追踪等诸多领域,具有极
在数据库操作过程中,长事务越来越多,结构也越来越复杂,传统事务处理模型无法高效的应用于长事务执行过程中,而且目前对长事务模型的研究与实现过于困难,所以研究一种能够应
随着互联网的不断发展,在网络上产生了大量的短文本数据,这些数据涉及了人们生活的方方面面,并且这些数据包含着大量有价值的知识。但是一方面由于短文本数据的文本短小、文