DSP高效片内二级Cache控制器的设计与实现

被引量 : 0次 | 上传用户:cngd0613
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数字信号处理器(DSP)在近年来得到广泛的发展及应用。“Cache+RAM”的存储结构已经成为高性能DSP设计中不可或缺的技术之一。二级Cache控制器的设计是“两级Cache+RAM”存储结构中的关键环节。如何设计和实现一个正确、高效同时又满足高频要求的二级Cache控制器是一个值得研究的问题。FT-CXX是我们自主研发中的一款高性能定点DSP,采用超长指令字(VLIW)技术,一拍内最多可以发射8条指令。预期CPU频率600MHz,外设频率300MHz,二级Cache(L2)的总容量1MB。本文对其中的L2控制器的设计和实现技术进行了研究,主要工作和贡献集中体现在以下几个方面:首先,分析了一般的Cache的设计方法,全面考察了主流DSP芯片中Cache的性能要求和实现技术,设计实现了FT-CXX L2的Cache/SRAM结构,确定了L2数据体、Tag体的结构及地址访问规则,设计实现了L2Cache的映象规则、替换算法、写策略等。其次,针对L2存储容量大、存储体只能支持CPU频率一半的事实,采取措施优化对一级Cache(L1D和L1P)缺失的处理。1)设计了缺失流水线,理想情况下平均每个L1的缺失代价只有两拍;2)在L1D和L2之间设计了一个宽度为64bit,深度为4且支持写合并的L1D写缺失缓冲队列,有效地减少了L1D写缺失的等待时间;3)提出了跨边界访问问题的解决方案,该方案具有效率高、硬件开销小且不会增加编译器的额外负担等特点。再次,设计并实现了一种高效的L2 SRAM的EDMA访问的处理机制。该机制充分挖掘了EDMA访问潜在的并行性,综合采用了EDMA请求猝发(可以连续发8个读请求,4个写请求)、侦听和数据发送处理流水化、基于侦听历史的侦听次数减少、基于旁路和归并机制的L2数据体访问的削减等技术,使EDMA的传输效率大大提高,平均访问一个数据只需要2-3拍,和一般的串行通路相比,加速比在2.0以上。最后,设计并实现了高效的数据一致性维护机制。一方面提供了丰富的Cache控制寄存器操作,另一方面对侦听和数据写回进行了分类处理。实验结果表明,该机制使系统典型请求的开销降低了10%以上。此外,本文对以上设计进行了较为系统地验证,并进行了逻辑综合和优化,使其在SMIC 0.13 um工艺下满足与一级Cache的接口部分工作频率为600MHz,内部的工作频率为300MHz的要求。
其他文献
教师激励是教师管理中最为重要的一个部分。但是,在当下中学教师的激励中存在着功利倾向,这种倾向性与教育的伦理目的和教师的伦理追求产生了矛盾。为此,就如管理与伦理的结
本文认为,公司法人人格否定理论只是对股东有限责任的例外适用和有益补充,不意味着彻底否定公司的法人人格。其效力仅限于特定的法律关系中,即公司法人人格被否定仅仅是在个案中
对一道数学考研题作出推广,给出一类极限的求法.
目的探讨心脏再同步化治疗(CRT)在慢性充血性心力衰竭(CHF)患者治疗中的作用,为慢性充血性心力衰竭患者的治疗提供依据。方法选取符合心脏同步化治疗标准的CHF并成功植入CRT的30
本文根据2006年7月~2007年11月南京北郊大气气溶胶、2007年1~3月南京市区PM2.5与气体污染物SO2、NOx、CO、O3的观测资料,分析了南京大气气溶胶的污染特征及其影响因素的相关关系
丙烯腈(AN)共聚物(AN wt%>85%)纤维即腈纶,在合成纤维中因其纺织服用性能类似羊毛,深受消费者欢迎,成为当今世界轻纺工业的重要原料。通常引入第二单体,如丙烯酸甲酯(MA)、醋酸乙烯
德沃夏克是欧洲19世纪捷克民族乐派的代表人物,同时也是欧洲19世纪浪漫主义时期的重要作曲家。从文献搜集的情况来看,无论在我国还是在国外,关于德沃夏克作为民族乐派作曲家
自二十世纪二、三十年代以来,有关儿童利他行为的研究一直成为发展心理学和社会心理学领域研究的热点课题。他们现有的研究成果一致显示,学前期儿童利他行为的养成是其成年后
社会主义新农村建设是在我国国民经济高速增长,城市化与工业化快速推进的新的历史时期,在我国总体上已进入以工促农、以城带乡的新的发展阶段,在我国初步具备了加大力度扶持
目的:通过对乌鲁木齐市社区老年人生活质量和社会支持状况的调查,了解社区老年人生活质量和社会支持的现况,探讨老年人生活质量和社会支持的主要影响因素,并分析两者之间的相