论文部分内容阅读
随着越来越多科学计算项目的提出与开展,用户对网格环境下的科学工作流管理系统服务质量的问题日益重视。作为科学工作流管理系统中的核心组件,调度策略的优劣对系统的执行效率、资源利用率以及对用户的QoS保障程度有直接而重要的影响。然而,科学应用的多样化导致工作流调度目标呈现多样性。一方面,用户的各种QoS需求之间往往相互联系且相互制约;另一方面,用户的QoS需求与网格系统性能之间的矛盾难以协调与平衡。如何对这些QoS指标进行权衡以提升系统服务质量是工作流调度领域的研究热点。此外,网格系统的动态性和自治性等问题使得资源的可用性、可靠性和负载压力难以准确判断和预测,已有的工作流调度策略经常难以有效适应于现实网格环境,例如保证用户QoS需求中的各种不同的约束性条件。因此,对网格系统中工作流调度策略的研究具有良好的理论价值和实用意义。本文围绕面向QOS约束的工作流优化调度以及如何增强动态环境下的用户QOS满意度两个方面展开研究。论文的主要研究内容和创新包括:(1)提出了时间约束下基于CRO的工作流费用优化算法传统的基于分层思想的工作流费用优化算法为工作流任务设定固定的时间窗口,在一定程度上限制了算法的搜索范围。本文将化学反应优化算法应用于时间约束下的科学工作流费用优化调度问题中并与启发式算法GreedyCost-TD相结合,提出了工作流费用优化算法CROTD。针对该优化问题,构建了四种化学分子反应操作的实施规则并基于正交试验给出了算法的优化参数设置。为了避免求解过程中产生不满足工作流时序约束的无效解,提出了基于任务依赖度的初始随机分子构造方法。通过对不同规模的Montage和LIGO工作流的实验结果表明,CROTD算法在费用优化方面具有较好的性能。(2)提出了费用约束下基于性能评估的工作流动态调度算法针对资源上网格任务及本地任务负载的动态性导致任务执行时间难以预测而影响做出有效调度决策的问题,提出以M/M/C型随机服务系统建模资源的执行性能,给出了任务在资源节点上的执行时间的估算方法。基于列表调度的思想和所建立的资源性能评估模型,提出了费用约束下基于性能评估的工作流动态调度算法SSWC_PE。通过对不同规模的Montage和LIGO工作流的实验结果表明,与GreedyTime-CD、LOSS算法相比,SSWC_PE算法在执行时间方面具有较好的性能表现。(3)提出了时间约束下的工作流可靠调度模型与算法网格环境中资源失效情况较为普遍,对资源可靠性以及资源上任务负载状况的感知将极大地增加应用在资源上执行的可靠性。在考虑本地任务对资源服务能力影响的基础上,本文提出采用随机服务模型建模资源的动态服务能力和负载压力,给出了任务在资源上的“执行可靠性”的定义及其计算方法。然后,结合“资源可靠度”和“执行可靠性”建立了一个新的资源节点可靠性评估模型。在此基础上,提出了一种时间约束下的工作流可靠性调度算法RSA_TC。算法将用户时间约束划分到每个子任务中,将整个工作流的全局优化问题转化为单个任务的局部优化问题,降低了问题的复杂度。实验结果表明,提出的可靠性模型能够准确反映网格资源的任务执行特征,RSA_TC算法在执行可靠性方面优于HEFT、PRMS算法。(4)提出了时间保障度增强的科学工作流管理系统架构及相应的工作流调度策略针对资源预留、任务迁移和任务副本等资源管理策略仍然依赖于动态不可靠的网格资源而不能有效应对任务执行时间不可预测的问题,提出了一种时间保障度增强的科学工作流系统架构EDGESA,利用云服务来增强工作流管理系统对应用截止时间的保障能力。针对系统架构中工作流调度这一核心模块,提出以任务违约风险来量化网格资源对工作流任务的时间保障度,使用时间序列模型预测云服务的响应时间。通过实验对EDGESA的截止时间保障能力进行了分析,表明EDGESA能够有效保证应用的执行时间需求,为下一代工作流管理系统的实施提供了参考。