面向嵌入式高性能计算的浮点字长匹配性研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:kaliya
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
嵌入式系统已经广泛地运用在生活中的各个领域,嵌入式设备的性能、功耗、实时性等要求均与一般环境不同,导致算法程序需要高效可靠地实现。算法在其数学形式上可能有优美的公式,但在实际的运行过程中,由于受到浮点数的存储位数的限制,计算得出的结果可能不精确,导致结果的可信度不足。算法的浮点稳定性常常会被忽视,而这种误差会随着计算规模而放大,甚至累积到计算稳定性和可信性超过最低限度,导致结果不可接受。本论文研究了浮点数对嵌入式计算机中算法的性能和稳定性影响。主要工作如下:1降低算法中部分浮点数的精度以加速算法的运行速度,即混合精度技术。本论文研究了预处理共轭梯度迭代法,在GPU平台的CUDA环境中,通过降低预处理共轭梯度迭代法中的多项式预处理子的精度,以加快求解线性方程组的速度,这种技术对不同矩阵的求解加速比最高可达约1.67倍,平均加速比约为1.32倍。2详细研究了光路计算程序中一元二次,三次,四次方程的求解算法,根据现有环境中对数值稳定性要求,利用数值稳定性理论,优化其程序流程,从原本三种算法的精确率99.9935%、58.2868%和67.4891%分别提升为100%、100%和99.9976%,使得算法稳定性满足应用工程要求。3基于LLVM开发了一个浮点计算稳定性的自动化分析工具。在不修改源代码的情况下,通过在编译的中间过程中插入相应的浮点稳定性分析代码,从而能够自动探测算法各个位置的真实有效位数,极快地加速研究人员对已有算法的数值稳定性分析过程。目前工具处理后的会使程序降速约1000倍,仍处于优化过程中。
其他文献
合成孔径雷达(Synthetic Aperture Radar,SAR)因为具备全天时、全天候的优势,成为敌方目标监视和现代战场侦察的重要手段。传统的SAR解译依赖于人工判读,不能满足战场实时性
视频放大器是机载平视系统中的关键器件,可实现对视频信号的对比度、增益和亮度进行调节。目前我国视频放大器主要依赖于进口,由于中美贸易摩擦因素,导致航空机载领域核心器
近年来,由于GPU在复杂的科学计算上的出众表现,CPU-GPU异构系统逐渐成为了科学计算的重要工具。目前,CPU-GPU异构系统通常使用PCI-E协议连接,相对于CPU和GPU访问本地内存的高
海31块是位于海外河油田中部的一个复杂小断块,于1990年5月正式投入开发,期间经历过天然能量开发、常规水驱、和局部分层系注水的开发方式,开发至今,油田已进入高采出程度、
传统的雷达成像系统主要包括实孔径成像系统和合成孔径成像系统,但二者都有各自的缺陷,其中实孔径成像系统的性能受制于孔径的大小;合成孔径成像系统的性能受制于目标与雷达
随着基因组学和宏基因组学的快速发展,大量未知功能基因的测序数据引起了广泛关注,这些未知功能基因被视为大多数生物有机体基因蓝图中不可或缺的部分。目前,在所有真核生物
量子通信技术在国家安全领域具有重要的应用前景,量子密钥分配(QKD)是量子通信技术中的重要内容,脉冲激光器模块是量子密钥分配系统的重要器件。目前,高速脉冲激光器模块依赖
当前我国正处于全面建成小康社会,实现两个一百年奋斗目标的关键时期,经济发展已经取得阶段性成效,而企业是我国经济发展的中坚力量,因此企业进行有效发展、科学规划是当下的
自雷达问世并不断发展以来,对复杂目标的电磁散射特性进行计算分析一直是电磁领域的一个重要研究方向。而在分析电大目标的电磁散射特性时,高频方法具有计算的算法简单、计算
多输入多输出(Multiple Input Multiple Output,MIMO)技术基站端装有大量的天线,使得系统的频谱效益和能量效率都得到了极大的改善。不仅如此,由于不同用户间的信道趋向于正