【摘 要】
:
随着科技的发展,自主研发通用微处理器已经成为迫在眉睫的重要任务。伯克利大学最新提出的RISC-Ⅴ指令集具有免费、开源、模块化的特点,这为国产处理器的发展提供了无限可能。RISC-Ⅴ自2014年正式发布以来,受到了包括谷歌、IBM、Oracle等在内的众多企业以及包括剑桥大学、苏黎世联邦理工大学、印度理工学院、中国科学院在内的众多知名学府与研究机构的支持;与此同时,围绕RISC-Ⅴ的生态环境逐渐完善
论文部分内容阅读
随着科技的发展,自主研发通用微处理器已经成为迫在眉睫的重要任务。伯克利大学最新提出的RISC-Ⅴ指令集具有免费、开源、模块化的特点,这为国产处理器的发展提供了无限可能。RISC-Ⅴ自2014年正式发布以来,受到了包括谷歌、IBM、Oracle等在内的众多企业以及包括剑桥大学、苏黎世联邦理工大学、印度理工学院、中国科学院在内的众多知名学府与研究机构的支持;与此同时,围绕RISC-Ⅴ的生态环境逐渐完善,涌现出了众多采用RISC-Ⅴ架构的开源处理器。RISC-Ⅴ架构的开放性和成本优势能够打破国外垄断,实现处理器内核的自主可控和国产化,为国产处理器的发展带来巨大机遇。作为微处理器中重要的组成部分,内存管理单元(Memory Management Unit,MMU)和高速缓存(Cache)构成的存储系统能够使软件开发人员使用比物理内存容量更大的存储空间进行开发,极大提升处理器的访存效率。本文以自主设计的32位嵌入式RISC-Ⅴ内核NF5为基础,主要研究包含MMU和一级数据Cache的存储系统。首先,本文根据RISC-Ⅴ特权指令集中规定的Sv32两级页表地址翻译机制设计了面向NF5微处理器的32位MMU。利用开源模拟器CRAS对不同替换策略进行仿真,对命中率为98.33%的MRU策略和命中率为97.43%的基于二叉树的PLRU替换策略进行资源占用分析后,采用基于二叉树的PLRU替换策略设计MMU中的转译后援缓冲单元(Translation Lookaside Buffer,TLB)。接着设计了页表查找单元(Page Table Walk,PTW),实现从Cache中查找页表项(Page Table Entry,PTE)并将其更新至TLB中的功能。最终实现了将NF5处理器产生的32位虚拟地址转换成物理地址(最大支持34位)的功能。在设计的模块级验证环境中对该MMU进行验证后,结果表明其能够完成页表项缓存、查找以及地址翻译等功能。其次,本文结合RISC-Ⅴ指令集的访存特点,使用LRU替换算法和伯克利大学最新提出的Tile Link总线协议设计了具有两路组相联结构的一级数据高速缓存单元,每个缓存行具有4个字,整体大小为16KB。针对不同访存情况验证的结果表明,所设计的一级数据高速缓存单元能够正确缓存数据。最后基于Nexys-video FPGA开发板设计了包含内核、外设的片上系统,在系统级环境中对MMU和Cache分别进行了功能验证,运行了RISC-Ⅴ的指令测试程序,证明了整个系统的功能正确性。同时还对Cache的命中率进行了测试,利用多个访存测试程序对Cache进行了读写测试,结果显示本文设计的一级数据高速缓存单元命中率均在70%以上,最高达到了97.96%。综合结果表明LUT占用15.43%,Flip Flop占用8.8%,整体运行频率为25MHz。最终在系统中运行了汇编测试程序,利用串口软件在主机中观察到了UART端口输出的“NF5 RISC-Ⅴ Core”字样。
其他文献
计算流体力学(Computational Fluid Dynamics,CFD)是一门采用数值计算方法求解流体运动控制方程,以研究流体运动相关问题的交叉学科。当前,CFD已广泛应用于航天航空、汽车、船舶、能源、化工等领域。CFD的发展及其应用很大程度上得益于计算能力的提高,在高性能计算体系结构上对CFD应用程序进行并行化与性能优化有重要意义。近年来,随着图形处理器(Graphics Process
在当今时代的边境治理主体中,原本以地方边防部门的多元治理为主,随着对党政军警民五位一体的时代需求,将“民”这一边民群众吸纳进多元主体参与治边。护边员作为群众性力量在陆地边境越来越受到国家和社会各界的关注,边民的主体地位在陆地边境有着自身的价值和意义,是以“民”为角色的边民群众融合边防系统的主体进行联防联控的群防群治力量,在党政军警民体系中可进一步实现合力强边固防的目标。因此基于一定实证性的个案研究
随着人工智能科学和大规模科学计算的高速发展,计算机软件对硬件计算能力的要求越来越高。目前许多计算机都采用GPU+CPU异构体系结构来提升性能。随着需要处理的数据量逐渐增加,应用程序对GPU的内存容量需求也越来越高,迫切需要引入虚拟地址空间来增加GPU内存的利用率。GPU+CPU异构体系结构的编址方式经历了独立内存空间、统一虚拟地址、统一内存空间的发展过程。GPU中引入统一内存空间,可以在运行时将程
随着工业控制总线的对带宽、实时性和可靠性等要求越愈发严苛,传统中低速总线已经难以满足工业任务的要求,高速实时以太网开始展现出巨大的应用和开发潜力。但工业环境复杂,总线可靠性成为实时以太网应用发展的重点。为解决上述问题,本文以自主可控的国产芯片为基础,将实时以太网总线系统作为研究对象,并形成相关开发应用方法。论文的主要研究工作有以下几点:1、针对总体方案设计问题,通过研究现场总线的通信方式和数据控制
当前以并行计算为主要形式的高性能计算已经成为促进科技创新和经济发展的重要手段,各类问题对计算规模增长的要求促进了计算机系统性能的发展。但系统性能提高带来的高能耗问题,一方面带来了高昂的电费开支以及对供电资源的迫切需求,另一方面产生的热量对系统的可靠性、稳定性提出严峻的挑战。因此能耗问题已成为制约并行计算系统性能进一步提升的重要影响因素,如何提高计算机系统的能量有效性已经成为高性能计算研究的热点问题
在工业智能化的背景下,OPC UA作为旨在满足工业不同层面通信需求的协议受到Industry 4.0的大力支持。为了在工业控制层面上取得更好的表现,OPC基金会对OPC UA协议扩展了Pub Sub架构。随着工业控制网络的逐步开放,工业设备面临着严峻的安全挑战。安全网关作为工业控制网络中重要的安全防护系统,已经成为工业控制网络安全防护架构的重要研究方向之一。Pub Sub协议与现场总线协议不同的是
边缘计算是业界新兴的计算模式,在目前数据急速膨胀的互联网环境下,边缘计算模式能够将原本需要集中在云计算中心进行的计算任务卸载到边缘测,使得服务能部署在靠近用户的边缘侧。这一新兴的计算架构,既能减少云计算中心的负载,又能减轻网络传输基础设施的带宽压力,节约网络资源。因用户至边缘侧的物理距离和网络距离比云计算中心的短,经过的通信节点少,网络环境相对稳定,边缘计算对依托其运行的应用带来了显著的时延降低效
为提高优秀足球教师的执教能力,本研究运用文献资料法、专家访谈法、德尔菲法、问卷调查法以及数理统计法等研究方法,对足球教师的年龄、性别、学历、专业、执教年限、参与足球活动与培训情况等人口学特征进行了深入地调查和分析,在了解调查足球项目特点以及足球教师职业特征的基础上,以系统理论和多因素理论为研究基础理论,构建了足球教师执教能力影响因素指标体系,并运用探索性因子分析对公因子指标进行分类、命名与排序。研
在科学计算和工程计算的领域中,CPU与GPU构成的异构系统因其优越的计算能力被广泛使用。GPU为程序员编程简便提供了共享虚拟内存(SVM),使程序员不再需要考虑CPU与GPU之间的数据传输而交给系统自动完成。虽然编程更加方便,但是共享虚拟内存引入了额外的虚实地址转换开销。近年来,随着GPU应用场景的不断广泛,出现了大量的不规则应用(虚拟地址分布空间局部性差且数据之间存在相关)。由于GPU单指令多线
伴随着计算机技术的不断发展,设备与设备之间的信息交互越发频繁,这些在信息网络中不断传递和交互的信息汇聚成了流动的数据集合。数据流的流动方向就是信息的传递方向,对数据流的处理过程就是获取其中蕴含信息的过程。通过对数据流组成信息的处理,研究者可以分析得到这些信息背后隐藏的规律和特征,根据不同的应用场景和应用需求,研究者能更具目的性地进行信息处理和分析,提高信息的利用率。在本文中,应用的场景主要是对网络