四核龙芯3号处理器网络性能分析与优化

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:softdir
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
国产龙芯3号多核处理器具有高性能低功耗特点,主要应用于服务器、集群、网络安全设备等领域。其中,龙芯3A是我国首款四核高性能处理器,运算峰值达到16GFLOPS,功耗不超过15瓦,具有很高的性能功耗比。提高龙芯3A系统的网络性能可以促进多核龙芯3号处理器的应用推广,是很有价值的。本文主要工作和贡献如下:   1、针对龙芯3A系统的网络中断处理负载不均衡问题,本文提出并实现了中断轮转负载优化技术,有效提高了网络带宽。中断处理是网络数据接收和发送的重要环节,目前龙芯3A所有中断都由0号处理器核处理,负载很不均衡。本文分析了主流多核处理器的中断均衡处理和龙芯3A中断系统,结合龙芯3A处理器的核间中断机制,提出并实现了中断轮转负载均衡优化技术。采用中断轮转均衡优化后,龙芯3A的千兆网络带宽从原来的337.7Mbits/s提高到556.3Mbits/s,提高了64.7%,丢包率从原来的42.3%下降到7.5%。   2、针对龙芯3A多核处理器架构特点,本文实现了相对于网卡硬件协议栈“offload”技术的软件并行化处理技术,把网络中断服务和协议栈处理分开到两个不同的处理器核进行并行处理。通过并行化处理优化后,龙芯3A千兆网络带宽达到642.7Mbits/s,比未做任何优化前带宽提高了90.37%,网络数据包的协议栈处理时间从原来的135061ns下降到40044ns,处理时间降低了三分之二。   3、针对龙芯3A多核处理器架构特点,及中断处理任务相对轻而协议栈处理任务相对重的特点,在分析目前主流千兆、万兆网卡用于多核处理器系统上的并行技术的基础上,本文进一步挖掘并行处理空间,实现了软件协议栈多队列处理技术。根据数据流的源、目的IP地址和端口号组成的四元组,把数据流哈希到不同的协议栈队列中,每一个队列由一个处理器核进行处理。通过软件协议栈多队列优化,龙芯3A千兆网络带宽提高到918.3Mbits/s,已接近主流处理器千兆网络的极限速度。
其他文献
随着通讯和计算技术的发展,呼叫中心坐席系统被广泛运用于各行各业。由于业务的多样化需求和融合通信的发展趋势,传统的坐席系统需要提供越来越多的新功能,并与业务相关的CRM
在存储容量和传输带宽的限制下,视频编解码一直是多媒体应用的重要课题之一。在过去的二十多年里,各种视频编解码标准层出不穷,其中H.264标准凭借其卓越的压缩比和良好的网络
随着计算机网络的普及和计算机技术的发展和人们对信息数字化的需求越来越高,数据的整体存储容量正在以惊人的速度增长着,而且这种趋势只会越来越明显。在磁盘技术发展的缓慢背
为了适应时代的进步,国内高校对于留学生的管理工作加快了信息化进程,《留学生信息管理系统》便应运而生。《留学生信息管理系统》一方面可以使得高校的招生工作从传统的管理
嵌入式系统是复杂的反应式系统,其主要特点是持续与外部环境进行交互、运行通常没有终止状态。由于嵌入式系统本身的确定性、并发性、实时性,对此类系统进行形式化建模具有很
天才和民族学生的学校(GSES学校)是一所大学的示范学校,由学术和行政单位组成。它控制和促进了大学教师的教学。这项独立研究的目的是为NUOL大学示范学校(天才和民族学生的学校)开
物体检测是计算机视觉领域的热门研究课题之一。其目的是找到图像或者视频中的属于某一特定物体类别的对象实例。物体检测技术依赖于底层特征的选择。其中,形状特征是描述物
软件调试一直是软件开发中的重要问题。人们对调试传统的单线程程序有丰富的经验。单线程程序的调试通常以循环调试和在线交互调试为基础,其中最重要的问题是错误的重现。通
图像去模糊(ImageDeblurring)及图像修复(ImageInpainting)是近些年来图像复原领域的热点问题,得到国内外学者的广泛关注和研究。造成图像模糊的主要原因是成像设备的误差(如相
商品个性化推荐是电子商务领域中的关键技术,如何将商品个性化推荐的思想运用到金融投资领域中,实现股票个性化推荐是股民一直关注的热点。而目前在股票投资领域中的推荐方法较