基于DSP的嵌入式神经网络计算框架设计与实现

来源 :兰州大学 | 被引量 : 3次 | 上传用户:ososxx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,深度学习(Deep Learning)的研究和应用进入了爆发阶段,出现了多个适用于移动端的神经网络以及一些模型压缩算法,神经网络开始大规模应用到嵌入式平台,进而产生了越来越多的面向嵌入式平台的神经网络计算框架。这些计算框架主要使用ARM CPU、GPU(Graphics Processing Unit)或者FPGA(Field Programmable Gate Arrays)作为计算加速硬件,但是这些硬件在性能、成本或者功耗上都存在一些问题,难以在这三者之间达到一个较好的平衡,导致这些框架尚未在嵌入式领域大规模应用。相比而言,DSP(Digital Signal Processor)具有较好的性能以及较低的成本和功耗,因此,本文调研了目前嵌入式平台神经网络加速框架存在的问题,研究与实现了基于DSP计算优化的轻量级神经网络计算框架——Lightweight Accelerator for Neural Networks on Embedded System,简称LANNES。该计算框架在嵌入式平台既有不错的性能,又能较好地控制成本和功耗,是一个适用于神经网络在嵌入式平台大规模应用的解决方案。本文设计了适用于DSP平台的神经网络计算框架的架构和底层加速机制。框架架构主要包含三部分:LANNES模型和网络文件、LANNES基础组件和LANNES加速器。在此基础上本文实现了框架的模型和网络文件的转换与加载以及框架的各个基础组件,充分利用DSP的特殊架构,利用内存优化算法和CPU指令级并行优化手段,实现了DSP加速器的性能最大化。本文对所实现的LANNES框架的性能和精度进行了测试和验证,测试表明基于DSP实现的LANNES框架性价比高于基于GPU实现的框架,且性能领先于基于更高成本的4核心ARM CPU实现的计算框架,同时LANNES还具有非常轻量、高易用性和低功耗等优点,此外又能保证计算结果的精度不会受到框架的影响。本研究所提出的基于DSP实现的轻量级神经网络计算框架可以作为神经网络在嵌入式平台大规模应用的优秀解决方案。
其他文献
改革开放40年来,我国高等职业教育快速发展,办学条件显著提高,发展氛围显著优化,培养质量持续提升,院校数量和学生规模均为世界首位,为国家经济腾飞和社会进步贡献了大批应用
在媒介融合背景下,会采编、精管理、懂拍摄、懂经营、善于评说等复合型、应用型人才是新闻人才培育的主要目标。而通过校企合作共建模式能够实现人才多方面发展模式,增强人才
试验选270只28日龄AA肉用公鸡,随机分为3组,每组6个重复,每重复15只鸡。采用配对试验设计,高温组为28~34~28℃日变高温,适温自由采食组和适温配对组都为22℃,适温配对组鸡喂
微小器件在许多未来科技的发展领域中发挥着非常重要的作用,因为它们拥有诸多优点,比如低材料成本,可移动性,可移植性,低功耗,和由于高的表面体积比而具有较高的热传导率。在
目的:探讨个性化护理干预应用于慢性胃溃疡患者中的作用。方法:回顾性分析浙江长广(集团)有限责任公司职工医院2012年11月-2015年11月112例慢性胃溃疡患者临床护理情况,其中5
<正>改革开放40年来,我国林业和草原事业走过了极不平凡的发展历程,在理论和实践上进行了不懈探索,走出了一条具有中国特色的林业和草原发展道路,为国家走上生产发展、生活富
当今世界,国际恐怖主义有着愈演愈烈之势,中国的恐怖主义与国际恐怖主义有着千丝万缕的联系,是国际恐怖主义的一部分。弄清中国反恐的特点及趋势有利于中国反恐的成功开展,也
机动车污染是城市大气污染物的重要来源,城市机动车污染排放量模拟对城市街区环境污染状况监测和污染治理都有重要参考价值。目前确定排放因子的方法有底盘测控仪检测、模型计
作为货币政策的重要组成部分的利率和汇率,是否会因这两次的调整而增加其相关性,就这一问题做出研究,得出利率——汇率传导机制通过迂回的影响国内经济的形式对汇率产生作用,