论文部分内容阅读
数据中心为大量的应用提供基础设施服务,如网页搜索和在线推荐系统等,数据中心内部网络作为所有应用数据传输的共同载体,需要提供高带宽、低延迟等服务质量(Quality of Service,QoS)保障。由于应用对云服务性能要求的日趋严格,数据中心网络的服务质量保障面临巨大挑战。此外,数据中心服务器计算能力、存储设备数据存取能力的快速增长,也促使数据中心网络成为数据处理的性能瓶颈。因此,面对日益增长的应用需求和不断更新的软硬件设施,研究高效的数据中心网络流量管理技术,来有效保障数据中心应用的服务质量具有重要意义。现存许多研究都在网络拥塞控制、流量优先级调度和网络负载均衡等方面展开,但目前流量管理的研究方案仍面临诸多问题,比如高性能的解决方案存在部署难度高、难以为不同流量突发特征的应用负载提供性能保障、负载均衡干扰主机端流速控制等。本文针对数据中心复杂多变的网络环境下存在的问题,提出两个负载均衡方案和一个拥塞控制方案,进而高效提升数据中心网络的传输性能。
针对主机端网络负载均衡方案中的拥塞检测不精确问题,提出一种基于精确延迟反馈的负载均衡方案(Latency-based Load Balancing,LLB),在保证易部署的同时,优化负载均衡决策以选择合适的传输路径,从而提升网络传输性能。主机端负载均衡方案由于一般不需要修改硬件交换机,具备易部署的优势,但现存方案使用的显式拥塞通知(Explicit Congestion Notification,ECN)和在应用层监测的端对端单向传输时延(One-way Delay),都无法精确评估路径拥塞程度,导致方案在负载均衡决策时难以选择出最优的数据传输路径,损害了传输性能。LLB利用主机端硬件网卡技术或高效的软件层数据IO处理技术,精确捕获网络单向传输时延来评估路径拥塞程度,从而提升拥塞检测的精确度;LLB还利用网络中其他正常数据流主动更新节点间的延迟数据,加速路径拥塞信息的反馈。实验表明,相比基于ECN拥塞反馈的典型方案CLOVE-ECN,LLB最多提升47%传输性能;在较平稳的应用负载下,相比需要修改硬件交换机的方案CONGA,LLB仍能提升2-8%的传输性能。
针对目前负载均衡方案难以为不同流量突发强度的应用负载提供自适应性能保障的问题,提出一种自适应流量突发性的负载均衡方案IntFlow,通过充分发掘数据平面可编程交换机(Programmable Switches)特性,整合主机端拥塞监测和交换机端流量突发特征捕获两个功能,从而自适应上层应用流量的突发强度变化,提供更优的数据传输性能。IntFlow主要设计思想是:在主机端拥塞控制协议层监控ACK携带的拥塞反馈信息来评估数据流的拥塞状态,并将状态信息写入数据包头部;在可编程交换机解析数据包头部的拥塞信息,来感知当前数据流的拥塞状态,并结合流量的突发特征,实现主动而谨慎的负载均衡决策。实验表明,相比具有代表性的负载均衡方案CONGA和Hermes,IntFlow分别最多提升45%和30%的网络传输性能。
针对网络负载均衡干扰主机端流速控制而导致的性能损失问题,提出一种路由变化感知的拥塞控制方案ACK-correction,在保障易部署的同时,提供更精确的流速控制,从而改善网络传输性能。负载均衡方案频繁调度数据流时会导致反映不同路径拥塞状况的ACK混合在一起,数据流切换路径前的ACK可能被错误地用于调整切换路径后的发送速率(即流速),造成流速控制混乱,影响传输性能。ACK-correction基于覆盖网络(Overlay Network)协议在数据包头部区域记录数据流的传输路径编号,并利用ACK进行反馈;在发送端将ACK反馈的路径编号与数据流当前传输路径编号进行对比,并将对比结果通过TCP头部的一个保留位传递给上层网络协议栈;在宿主虚拟机设计一个新的拥塞控制协议MDCTCP,其根据拥塞反馈信号和上述保留位进行合理的流速调整,避免上述流速控制混乱问题,从而优化传输性能。实验表明,相比典型的拥塞控制协议DCTCP,ACK-correction在保障易部署性的同时,提升所有数据流15%的整体传输性能;ACK-correction还能大幅降低延迟敏感短流的平均完成时间及其尾延迟,分别可实现22%和27%的性能优化,改善了时延敏感应用的网络传输性能;另外,面对数据中心动态网络拓扑,ACK-correction也能提供稳定的高传输性能。
针对主机端网络负载均衡方案中的拥塞检测不精确问题,提出一种基于精确延迟反馈的负载均衡方案(Latency-based Load Balancing,LLB),在保证易部署的同时,优化负载均衡决策以选择合适的传输路径,从而提升网络传输性能。主机端负载均衡方案由于一般不需要修改硬件交换机,具备易部署的优势,但现存方案使用的显式拥塞通知(Explicit Congestion Notification,ECN)和在应用层监测的端对端单向传输时延(One-way Delay),都无法精确评估路径拥塞程度,导致方案在负载均衡决策时难以选择出最优的数据传输路径,损害了传输性能。LLB利用主机端硬件网卡技术或高效的软件层数据IO处理技术,精确捕获网络单向传输时延来评估路径拥塞程度,从而提升拥塞检测的精确度;LLB还利用网络中其他正常数据流主动更新节点间的延迟数据,加速路径拥塞信息的反馈。实验表明,相比基于ECN拥塞反馈的典型方案CLOVE-ECN,LLB最多提升47%传输性能;在较平稳的应用负载下,相比需要修改硬件交换机的方案CONGA,LLB仍能提升2-8%的传输性能。
针对目前负载均衡方案难以为不同流量突发强度的应用负载提供自适应性能保障的问题,提出一种自适应流量突发性的负载均衡方案IntFlow,通过充分发掘数据平面可编程交换机(Programmable Switches)特性,整合主机端拥塞监测和交换机端流量突发特征捕获两个功能,从而自适应上层应用流量的突发强度变化,提供更优的数据传输性能。IntFlow主要设计思想是:在主机端拥塞控制协议层监控ACK携带的拥塞反馈信息来评估数据流的拥塞状态,并将状态信息写入数据包头部;在可编程交换机解析数据包头部的拥塞信息,来感知当前数据流的拥塞状态,并结合流量的突发特征,实现主动而谨慎的负载均衡决策。实验表明,相比具有代表性的负载均衡方案CONGA和Hermes,IntFlow分别最多提升45%和30%的网络传输性能。
针对网络负载均衡干扰主机端流速控制而导致的性能损失问题,提出一种路由变化感知的拥塞控制方案ACK-correction,在保障易部署的同时,提供更精确的流速控制,从而改善网络传输性能。负载均衡方案频繁调度数据流时会导致反映不同路径拥塞状况的ACK混合在一起,数据流切换路径前的ACK可能被错误地用于调整切换路径后的发送速率(即流速),造成流速控制混乱,影响传输性能。ACK-correction基于覆盖网络(Overlay Network)协议在数据包头部区域记录数据流的传输路径编号,并利用ACK进行反馈;在发送端将ACK反馈的路径编号与数据流当前传输路径编号进行对比,并将对比结果通过TCP头部的一个保留位传递给上层网络协议栈;在宿主虚拟机设计一个新的拥塞控制协议MDCTCP,其根据拥塞反馈信号和上述保留位进行合理的流速调整,避免上述流速控制混乱问题,从而优化传输性能。实验表明,相比典型的拥塞控制协议DCTCP,ACK-correction在保障易部署性的同时,提升所有数据流15%的整体传输性能;ACK-correction还能大幅降低延迟敏感短流的平均完成时间及其尾延迟,分别可实现22%和27%的性能优化,改善了时延敏感应用的网络传输性能;另外,面对数据中心动态网络拓扑,ACK-correction也能提供稳定的高传输性能。