基于数字迭代算法的基本函数研究与实现

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:menglimengwaiszy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基本函数是高性能计算、图像处理、数字信号处理等领域的常用操作,它指由有限的常数和单变量的n次方根、指数、三角及反三角等通过基本操作组合而成的函数。这些基本函数具有种类多、计算复杂、延时大且开销大的特点,尤其在高精度计算中,这些问题更加明显。由于硬件支持的基本函数比软件方法实现的基本函数在速度上占有较大优势,因此从上世纪70年代开始,人们展开了大量浮点基本函数的硬件设计研究。然而,由于基本函数实现复杂、开销大的特点,目前硬件设计仍只停留在理论研究阶段并未大规模用于实际应用中。数字迭代算法是基本函数运算的一种主要硬件实现方法,典型算法有SRT算法、CORDIC算法等,他们的实现操作简单、硬件开销小,但收敛速度慢、计算延时大。为使用数字迭代算法高效实现基本函数运算,本文在深入研究传统SRT算法和CORDIC算法的基础上,提出统一的基本函数计算模型,并通过预测机制和迭代展开的方法对传统实现进行改进,提出统一的并行加速模型,并基于此加速模型展开了如下研究:1、本文提出了基于余数和商预测的低延时并行SRT算法,并用此改进的算法设计实现了除法和开方计算单元,通过部分余数和商值预测机制、并行迭代的方法,消除上下迭代之间的数据相关,开发其并行性,大大减少计算周期,并通过交叠两个低基SRT-4迭代构成高基SRT-16,在低基算法的硬件基础上获得高基算法的计算速度,具有很大的实用性。2、本文还提出了基于旋转方向预测的CORDIC算法,并基于此改进的算法设计实现了超越函数计算单元,通过旋转方向预测、并行迭代和线性近似迭代的方法,实现快速计算,并将此并行CORDIC算法应用到蝶形运算中完成复数乘法,设计实现了高效FFT加速器结构。实验表明,本文优化的SRT算法实现除法和开方布局布线后的面积仅37795um2,功耗仅81.19mW,关键路径延时仅656ns,基于优化的CORDIC算法实现的含一个蝶形单元的FFT加速器结构完成双精度浮点计算仅需8211个REG资源,35547个LUT资源,且频率可达127MHz,两种改进的算法都具有很大的扩展性和实用意义。
其他文献
采用新的软件优化设计深沟球轴承 ,介绍在MATLAB环境下实现的有关技术 ,编写了MATLAB程序。通过给出的优化实例可以看出 ,应用该软件求解此类问题非常方便
财政学课程的教学质量受教材编写质量、教学内容及教学方法三大因素的影响。当前,财政学课程在教材编写、教学内容及教学方法方面存在的问题制约着财政学教学质量的提高,因此,要
西部民族地区发展特色经济有其资源、政策方面的优势。从目前西部民族地区的经济发展现状看,西部地区特色经济没有形成。产业结构不合理。教育相对落后,而且支柱产业与地方缺乏
<正> 灵山县地处桂南,是一个132万人口、一产业占全县国民生产总值46%多的农业大县。农业是我们的优势,也是我们的难点。近年来,我们积极进行农业经济结构战略性调整,大力推
会议
十八载春华秋实,艺术节流光溢彩。历时35天的第十八届中国上海国际艺术节,吸引来自64个国家和我国30个省区市及港澳台地区的1.3万名艺术工作者,以境内外49台参演节(剧)目、86场文
报纸
针对某发电公司1号锅炉水冷壁管壁温度出现频繁超温以及灰渣含碳率较高的状况,分析了水冷壁超温是因为乏气侧着火较差及配风模式的不合理导致火焰下冲过度造成的;采取对二次
本研究以沙洋县荸荠生产基地(112.48°E,30.50°N)为依托,针对当地水稻荸荠轮作的耕作方式,在《不同光源对农林重要害虫诱杀效果》项目的系列研究基础上,于2011年,选用光源2
随着经济日趋市场化和国际化,我国大学经济管理类专业的学生队伍不断扩大,但我国传统的大学经济管理类专业人才培养模式存在明显的不足。结合经济管理类专业人才的必备素质,研究
长期以来,在我国的司法实践之中,由于侦查权的过于强大,导致公诉权和审判权形同虚设。公诉权和审判权往往沦为侦查权的附庸,难以对侦查权形成监督和制约。权力一旦缺少监督制