论文部分内容阅读
随着互联网行业的快速发展,数据中心需要处理TB级别甚至PB级别的数据。在海量数据处理的驱使下,数据中心的扩展方式由纵向扩充方式到横向扩展方式转变。在这种背景下,众核架构具有很好的应用前景。此外,由于需要处理多种不同类型的应用,数据中心正逐步趋向于计算资源异构化方向发展。与此对应的是,众核架构中也可以包含很多异构的计算资源,例如cpu、gpu等。在众核架构中,各个资源节点之间通过片上网络进行通信。片上网络的通信质量将影响整个系统的整体性能,例如响应时间、吞吐量等。 本文主要工作如下: 1、为众核架构设计并实现了一款片上网络路由器。该路由器采用没有虚通道的带有输入端缓存的设计方案,内部采用三级流水模式。它被用于作者所在课题组设计的众核处理器中。本文为该架构的原型系统制定了专门的片上网络,并在FPGA上进行了功能验证。此外,本文还在FPGA平台上,对片上网络进行了性能测试。 2、针对路由器中的头数据包阻塞问题,对路由器设计进行优化。在路由器的本地输入端口的缓存中,去往不同方向的数据包会在同一个队列中按照先进先出地顺序被处理。因此,队列头部的数据包将阻塞住队列中去往其他不同方向的数据包。这种现象在同时多线程处理器中尤为明显。针对该现象,本文对片上网络路由器进行了设计优化。该方案为,在路由器的本地输入端口中为每一个输出端口设置一个缓存空间,每个资源节点发出的数据包先进行路由器计算,再送往对应的缓存中。同时,本文在模拟器平台上,使用多种类型的应用对优化效果进行了评测。结果显示:针对选用的应用负载,其网络传输性能大约提升了10%到18%。 3、针对异构架构中存在的大量“流式数据”,对片上网络进行优化。大量的“流式数据”会增加片上网络的传输压力。根据“流式数据”中存在连续数据包的特点,本文在片上网络的网络接口处,将去往相同方向的多个连续请求包或应答包进行合并处理,从而减少了片上网络的压力,提高了网络的传输性能。本文在模拟器平台上,对该优化方案进行了性能评测。结果显示:针对选用的GPU类型应用负载,网络传输性能提升范围在3.7%到21.1%之间。