论文部分内容阅读
数据中心日益成为信息化建设的关键基础设施,应用的多样化和复杂化、网络规模的急剧增长、更加严格的网络服务质量需求,都对数据中心网络的管理提出了更高的要求。目前,由于数据中心网络的应用对于丢包非常敏感,包括数据中心以太网和InfiniBand在内的无损网络日益得到广泛应用。无损数据中心网络能够提供更加可靠的传输保证,更加及时的拥塞控制,以及更加灵活的区分服务策略。首先,从应用和网络管理者的角度需要掌握无损数据中心网络在拥塞情况下的带宽与延迟性能,以及在链路级流量控制和拥塞控制下的网络服务质量变化。此外,大规模数据中心网络需要通过监测准确的获取网络性能的细粒度变化,在端到端测量基础上及时发现和准确定位网络中的拥塞和故障。第三,在网络中出现拥塞和带宽竞争情况下,从安全的角度需要有效的性能隔离以保障不同租户之间互不干扰,另一方面从云计算的资源可分配需要网络带宽具有灵活的划分能力。本以无损网络作为研究对象,从无损网络传输模型、数据中心网络拥塞的测量定位、基于拥塞控制的动态网络带宽分配、数据中心网络性能测量工具等方面展开研究。 本研究主要内容包括:⑴提出了无损网络传输模型,从用户、网络和管理更好的支持网络可感知、应用可区分、策略可管理。利用网络演算理论,分析了基于信用量的无损网络流量控制的性能,通过将流量控制功能转化为限制发送端注入的流量控制器,推导出流量控制器乃至整个系统的服务曲线,得到了保证最大服务性能的最小缓冲区空间大小。本文提出了无损网络中流竞争情况下的拥塞网络构建算法,并利用网络演算计算分支插入点的到达曲线,在此基础上推导出等价服务曲线和端到端延迟上限。针对无损交换网络中的停车场问题和拥塞传播问题提出了带宽计算算法,从而能够根据网络中流的竞争关系获得其吞吐量。⑵提出分布与集中相结合的方法对大规模数据中心网络进行拥塞的监测和定位。首先提出的贪心算法以尽可能少的探测分组数覆盖网络链路从而达到有效网络监控。在分布式探测组的基础上,通过组间的交互和基于布尔逻辑的分布式推断,能够快速和较为准确的定位网络拥塞。本文采用最小可辨识段 MIS(Minimal Identifiable Segment)来精确的表示网络拥塞一定粒度的位置和拥塞率的大小,并提出在各个探测集合计算结果基础上的MIS快速合并算法,在拥塞位置不能满足定位粒度要求时,基于启发式函数构造递进式探针,减少了探测轮次及每轮的探针数。本文提出了一种被动延迟测量机制,在无损数据中心网络设备之间普遍存在乱序的情况下测量各个报文的精细延迟(如μs级),同时支持报文乱序水平的推断。⑶基于无损网络中限速表拥塞控制,本文提出了一种动态的带宽划分算法解决云计算数据中心的多实体竞争网络带宽资源的问题。算法通过在基于限速表的拥塞控制算法中,为不同实体设置不同的拥塞控制参数,使得它们在拥塞竞争发生和缓和后获得不同的降速和加速策略,从而得到不同的带宽分配结果。该算法通过无损网络的分布式拥塞检测和本文提出的快速拥塞推断方法,动态的调整拥塞控制相关的参数配置以满足带宽分配的目标,同时这种带宽划分的结果是预测的。在真实IB环境下的实验证明该动态分配算法能够以极低的开销及时响应拥塞的变化,并通过调整参数达到最低带宽保证和加权比例带宽划分的目标。⑷针对IB数据中心网络性能测量的需求,提出并在真实IB系统中设计实现了IBperf网络探测机制,采用集中控制的方式灵活的配置网络的流量模式及协议行为,同时采用在线和离线的方式对捕获的报文或者信息进行处理,对吞吐量和延时等性能参数进行统计。对该测量工具中的在线抓包性能进行了分析,利用IBperf研究了网络链路和主机输入接口发生拥塞下的网络性能指标,验证了拥塞控制能够很好的消除拥塞传播的影响,最后,通过实验研究了拥塞控制参数在不同流量模式下对性能的影响。