深度卷积算法优化与硬件加速

来源 :北京交通大学 | 被引量 : 3次 | 上传用户:jacychang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度卷积神经网络(Deep Convolutional Neural Network,DCNN)在语音识别、图像检测等领域各个领域都得到了充分发展。由于CNN的计算量非常大,很难将其应用到具有能量限制的嵌入式平台和物联网设备上。但是,近年来可编程逻辑门阵列(FPGA)的发展,由于它本身具有大量的计算资源和出色的能量效率和可编程性的特点,可以设计独特的并行计算架构,使得卷积神经网络能够在低功耗的嵌入式设备上使用。现如今的硬件加速器设计倾向于使用类似于基于乘法累加器阵列(Multiply-Accumulator,MAC)的底层架构,这种方法得缺点是有可能使得FPGA上DSP的数量限制了加速器的性能,但是其他片上资源没有得到充分利用。为了解决这个问题,本文考虑转变卷积计算的方法,转换加速器的设计空间,并释放对所需DSP资源的压力。使用本文的方法能够平衡的利用片上存储器、逻辑资源和DSP资源,因此本文的加速器明显优于现有技术。本文利用深度卷积神经网络卷积计算的稀疏性,将模型进行剪枝、量化,提出了一种新的稀疏卷积方法 ABM-SpConv(Accumulate-Before-Multiply Sparse Convolution),它首先执行特征映射的累加,然后将部分结果乘以非零权重。通过这种方法,在卷积运算过程当中实现了更多的累加运算而不是乘法运算,因此,当在硬件中实现时,性能是累加器而不是乘法器约束的,从而在FPGA上实现时放宽了对DSP单元的需求,提高了资源的利用率。设计了一个基于FPGA的低功耗、高并行度的异构并行计算框架,使用开放运算语言(Open Computing Language,OpenCL)进行编写,包括任务调度单元、提取/存储单元、多个卷积单元及其他的功能层单元。通过使用任务调度程序对卷积单元进行同步,以解决各稀疏卷积核之间计算负载不均衡。对稀疏的网络模型进行编码,以解决稀疏权重存储的不规则性导致的带宽效率过低的问题。卷积单元由累加器和乘法器的异构阵列组成,以匹配ABM-SpConv的不同计算流程。本文将所提出的稀疏深度卷积网络加速器架构实施在DE5-Net平台上,并实现了 ResNet-18,ResNet-50网络,取得了良好的效果,识别一张图片的时间分别为7 ms和15 ms,并且在能效比方面是GPU的3倍,CPU的34倍,具有极佳的能效比。吞吐量分别达到了 532 GOPS和546 GOPS,与当前最先进的架构相比,提升了 2倍。
其他文献
风味独特的平遥牛肉制作从汉代发端,盛于明清,光大于当代,从20世纪50年代起,平遥牛肉获"全国名产"、"星火博览会金奖"、"中华老字号"之美称,是平遥县传统六大支柱产业之一.…
基于成果导向理论,根据动物医学专业核心能力设置《宠物疾病防治》课程。本文探讨《宠物疾病防治》课程大纲设计原则、方法,和内容,并通过多元化评量实现教学目标。
随着环保事业的发展,对水污染的治理逐步取得了成效,用活性炭法进行水处理效果比较显著,主要论述了工业水处理的粉末活性炭净水技术。
【正】据悉,美国对陶瓷的需求量将以每年7%的速度增长,其中,电子陶瓷元件仍为市场主流。2010年到2015年内,氧化铝、氧化钛、氧化锆、碳化矽、氮化矽等涂层、复合制品的生产情
8Cr4Mo4V钢目前广泛应用于航空发动机轴承上,为提高其使用性能,尤其耐磨性及疲劳性能,本文通过喷丸与离子注入技术实现8Cr4Mo4V钢表面强化。本文通过阿尔门试片测得了在不同喷丸风压及喷丸时间下的喷丸强度曲线,研究了不同喷丸强度对8Cr4Mo4V钢组织结构、位错密度、应力梯度、摩擦磨损性能影响,以及喷丸和离子注入复合强化对8Cr4Mo4V钢组织结构、应力梯度、纳米硬度、耐磨性影响。经XRD分析
大规模线性方程组常出现在工程实践和科学计算等许多领域当中,研究高效准确的数值求解方法是一件很有意义的事情。已有的求解线性方程组的方法中,直接法运算效率较低,误差较
随着区域经济的快速发展,区域内各城市间商品、资金、技术、信息、劳动力等生产要素的流动更加频繁,经济联系也更加紧密,区域间形成一种动态的具有复杂网络关系的经济关联系统。旅游作为区域经济活动中最活跃的要素,信息、交通的便捷化和全域旅游的发展使得城市间旅游经济联系日益紧密,区域间形成了相互联系、相互作用的旅游经济网络。旅游经济网络是区域旅游一体化供求运作的空间效应,其网络结构越稳定,城市间旅游经济联系越
静电对农田残膜具有吸附作用,可以用来进行残膜回收,以提高残膜回收机的收净率.为此,采用静电对残膜的吸附力作为评价指标,对静电残膜吸附力的影响因素进行了试验研究,考虑的
吊杆是大跨度桥梁中最脆弱的部件之一,其在正常服役状态下的持续的振动响应会引起疲劳累计甚至导致构件损坏;以往的研究表明,在极端天气下吊杆可能发生的大幅振动,会对桥梁结构和交通安全构成威胁。到目前为止,垂直吊杆的减震研究还较为有限,但近年来逐渐引起学者和工程师们的重视。本研究着眼于大跨桥梁细柔吊杆的振动控制,研究了使用两种被动控制手段对其实现减振:环形调谐液体阻尼器与摆式调谐质量阻尼器,并给出了相应的
钙质砂颗粒具有多孔、形状不规则、易破碎等特性,对其工程性质有很大的影响。为探讨钙质砂粒径、形状对其压缩性的影响,本文对取自南海某岛屿的钙质砂颗粒依据其粒径与形状进