论文部分内容阅读
数据中心网络作为现代分布式计算的基础架构,决定了分布式应用的通信性能。随着大数据技术的快速发展和云计算基础设施的不断成熟,数据中心承载了越来越多的分布式计算任务,其底层网络的设计也面临着严峻的挑战。为了保证性能和可靠性,现代数据中心网络通常采用专用的结构化多径拓扑。具体地,以Fat-tree为代表的多径网络已成为大规模数据中心网络设计的首选方案。上述多径网络的路由方式与通用的IP网络有很大的不同,直接套用传统的路由算法很容易造成路由性能的下降。因此,本文针对数据中心网络的拓扑结构,提出了专用的高性能路由方案,主要内容如下:首先,本文设计了一种应用于数据中心交换机的高性能迭代调度算法。网络设备的交换功能是路由的基础,而迭代调度算法则决定了设备的交换能力。由于硬件发展的滞后性,传统的基于队列长度的多次迭代调度算法很难满足未来高速数据中心的交换需求。本文针对这一问题,提出了最高阶优先的调度思想,并基于最高阶优先设计了一种单比特、单次迭代的调度算法。新的算法不仅具有较低的计算复杂度和通信开销,而且在交换性能方面也远远超过了传统的调度算法,为数据中心交换设备的设计提供了新的思路。然后,本文针对多径数据中心网络的路径选择问题,设计了基于负载感知的均衡策略和轮盘选择均衡机制。多径网络的负载感知分为全局负载反馈和局部负载预测两种方式,前者具有较高的精度而后者具有较低的开销。本文分别对两种方式进行了探讨,通过将负载反馈与模块化架构相结合,提高了全局负载感知的扩展性,同时为局部负载统计设计了链路能力汇聚机制,以提高其预测准确度。当网络负载确定后,基于轮盘选择的均衡机制可以有效解决传统路径选择机制的链路瓶颈和负载波动问题,从而提高了网络的带宽利用率,降低了排队时延。接下来,在负载感知的基础上,本文提出了基于动态流簇交换的高性能单播路由方案。该方案通过将负载感知策略与流簇交换相结合,提出了动态流簇交换的概念。基于动态流簇交换的路由方案不但具有强大的负载均衡能力,而且能够兼顾多径网络数据流的有序性,有效提高了单播数据流的路由效率。最后,本文针对数据中心网络中的组通信问题,提出了动态分布式的组播路由方案。该方案具有动态性和分布式两大特性,前者用于支持组播树的动态扩展,提高了组播方案的通用性及其在复杂流量条件下的适应性,后者旨在解决集中式组播方案在扩展性和可靠性方面的问题。根据数据中心网络的结构化拓扑形式,本文提出了以上行自路由和下行查表为基础的路由规则,有效降低了路由的复杂度。同时,为兼容现有的分布式应用,本文设计了一种完全分布式的地址分派协议,并在此基础上提出了基于均衡森林的负载感知均衡策略,使得新的分布式组播方案不仅具有较低的复杂度和较高的可靠性,在性能方面亦能达到甚至超过现有的集中式组播方案。本文对交换技术和路由方案的探讨旨在提高数据中心网络的转发效率、扩展能力和可靠性,并降低流量调度的复杂度。在解决实际问题的同时,论文也提出了许多新的设计思想。例如,最高阶优先、链路能力汇聚、动态流簇交换和分布式组播等在相关领域均为首创。通过对多径网络路由机制的系统化论述,本文为大规模高速数据中心的设计开辟了新的思路,对未来数据中心网络的研究亦具有较大的指导意义。