一种面向众核架构的片上网络路由器的设计与实现

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:cjl7648893
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网行业的快速发展,数据中心需要处理TB级别甚至PB级别的数据。在海量数据处理的驱使下,数据中心的扩展方式由纵向扩充方式到横向扩展方式转变。在这种背景下,众核架构具有很好的应用前景。此外,由于需要处理多种不同类型的应用,数据中心正逐步趋向于计算资源异构化方向发展。与此对应的是,众核架构中也可以包含很多异构的计算资源,例如cpu、gpu等。在众核架构中,各个资源节点之间通过片上网络进行通信。片上网络的通信质量将影响整个系统的整体性能,例如响应时间、吞吐量等。  本文主要工作如下:  1、为众核架构设计并实现了一款片上网络路由器。该路由器采用没有虚通道的带有输入端缓存的设计方案,内部采用三级流水模式。它被用于作者所在课题组设计的众核处理器中。本文为该架构的原型系统制定了专门的片上网络,并在FPGA上进行了功能验证。此外,本文还在FPGA平台上,对片上网络进行了性能测试。  2、针对路由器中的头数据包阻塞问题,对路由器设计进行优化。在路由器的本地输入端口的缓存中,去往不同方向的数据包会在同一个队列中按照先进先出地顺序被处理。因此,队列头部的数据包将阻塞住队列中去往其他不同方向的数据包。这种现象在同时多线程处理器中尤为明显。针对该现象,本文对片上网络路由器进行了设计优化。该方案为,在路由器的本地输入端口中为每一个输出端口设置一个缓存空间,每个资源节点发出的数据包先进行路由器计算,再送往对应的缓存中。同时,本文在模拟器平台上,使用多种类型的应用对优化效果进行了评测。结果显示:针对选用的应用负载,其网络传输性能大约提升了10%到18%。  3、针对异构架构中存在的大量“流式数据”,对片上网络进行优化。大量的“流式数据”会增加片上网络的传输压力。根据“流式数据”中存在连续数据包的特点,本文在片上网络的网络接口处,将去往相同方向的多个连续请求包或应答包进行合并处理,从而减少了片上网络的压力,提高了网络的传输性能。本文在模拟器平台上,对该优化方案进行了性能评测。结果显示:针对选用的GPU类型应用负载,网络传输性能提升范围在3.7%到21.1%之间。
其他文献
云计算平台通过虚拟化技术将软硬件资源组成大规模的虚拟资源池,为用户提供按需取用的云服务。随着云计算技术的不断发展,越来越多的应用和服务选择云平台来部署。监控系统是云
随着信息产业的不断飞速发展壮大,网络上的数据每天都在以惊人的速度不断的增长。用户在查询中越来越多的包含实体的信息,例如人名、机构名等,试图通过围绕实体来构建有意义
伴随着大数据时代的到来,云计算、大数据等方面的技术在过去的十几年间飞速发展。据统计,全球范围内每天大约产生2.5EB的信息量,并且在不断增长。在此背景之下,数据中心技术迅速
该课题的任务是设计和分析电信业务多媒体查询系统,研究人员将电信业务多媒体查询系统(MIS)分为两个子系统,即多媒体演播系统和多媒体编辑系统,目标是:实现多媒体信息的交互
该文首先以渤海湾的两座典型海洋导和架平台为研究对象,运用非线性逐步破坏分析方法,提出了在环境荷载作用下海洋导管架平台结构抗震可靠性的分析方法,并计算了相应的可靠度.
随着网络信息的普及与快速发展,信息安全变成了网络信息发展的一个关键性问题。由于信息网络环境变得非常开放,网络攻击技术发展迅速,同时攻击者很容易获得一些自动化和智能化攻
目前高等院校排课作业基本停留在人工排课为主,排课软件调整为辅的状况。其根本原因在于排课作业是公认的NP-完全问题,其计算复杂度与问题的规模呈指数关系。因此,产生了大量
学位
分割是将图像细分为构成它的子区域或对象,分割的程度取决于需要解决的问题。在实际运用中,当感兴趣的对象被提取出来时,就停止分割。超出需要解决的问题的分割时没有意义的。图
本文主要研究三维医学图像中腹部血管的分割方法。  首先,提出了基于八元数矢量积表示定理与基于Clifford代数矢量积表示定理的两种三维区域生长算法用于分割腹主动脉血管。