【摘 要】
:
卷积神经网络(Convolutional Neural Network,CNN)已经成为计算机视觉领域最成功的算法之一,并且在众多领域中得到广泛的应用。然而,随着CNN的网络层次的加深以及模型结构愈发复杂,CNN模型的计算量激增,导致大量资源和能源的消耗。另一方面,传统的通用处理器(Central Processing Unit,CPU)由于其串行的计算方式难以满足实时性需求,GPU(Graphi
论文部分内容阅读
卷积神经网络(Convolutional Neural Network,CNN)已经成为计算机视觉领域最成功的算法之一,并且在众多领域中得到广泛的应用。然而,随着CNN的网络层次的加深以及模型结构愈发复杂,CNN模型的计算量激增,导致大量资源和能源的消耗。另一方面,传统的通用处理器(Central Processing Unit,CPU)由于其串行的计算方式难以满足实时性需求,GPU(Graphics Processing Unit)因为其高功耗不适合应用于移动嵌入式平台。FPGA(Field Programmable Gates Array)具有灵活可编程、低功耗、开发周期短的特点,在性能功耗比方面对比CPU、GPU具有独特的优势。利用FPGA有限的硬件资源实现CNN模型的并行加速计算成为业界研究的热点问题,其核心在于通用加速模块架构的设计。首先,通过对CNN的整体架构以及不同模型计算方式进行分析,确定了卷积神经网络可并行计算潜在模块和过程,以及可行的优化措施。以此为基础,设计划分软硬件协同方案,设计并采用ARM+FPGA的整体系统框架。在硬件设计上,使用HLS(High-level synthesis)技术分别设计了输入输出单元、基于乘累加阵列的卷积运算单元、池化运算单元、激活函数单元和重排序单元等计算模块,并采用流水线的思想将各个计算模块整合起来。在优化措施上,使用压缩量化、流水线、循环优化、乒乓缓存和参数数据缓存等优化措施来减少访存,加速计算过程。通过Roofline性能评估模型优化硬件结构解决FPGA片上存储、计算资源有限的问题。最终实现了对于CNN网络的前向FPGA加速计算。其次,对本文提出的基于FPGA的并行加速设计方案进行了验证和分析,利用Xilinx Zynq-7000系列的PYNQ-Z2开发板搭建了卷积神经网络加速器综合验证平台,并分别对图像分类和目标检测领域中较为典型的轻量卷积神经网络Le Net-5和YOLOv2模型进行了功能验证以及性能对比评估。对于Le Net-5网络,采用MNIST、CIFAR-10数据集进行性能测试,以MNIST数据集为例,实验结果表明与i5-8300H CPU相比,FPGA的功耗是其3.6%,能效为其20.5倍;与GTX 1060 GPU相比,功耗是其2.1%,能效为其12.3倍。对于YOLOv2网络,实验达到了26.23GOP/s的计算性能,FPGA性能为i5-8300H的5倍,ARM Cortex A9的87倍;能效方面为i5-8300H的95倍,为ARM的145倍,为GTX 1060的6.8倍。
其他文献
基于中国知网(CNKI)数据库,运用CiteSpace软件对1999—2018年国内核心期刊发表的校本课程开发相关论文进行梳理,从发文总量、机构分布、阶段进展及主要内容等四个维度分析我国校本课程开发研究的现状。近二十年关于校本课程开发的研究日渐成熟,但也存在研究不足:校本课程研究主体众多但缺乏合作;研究内容广泛但缺乏深度;研究方法科学但视角需多元综合,研究对象明确但不够丰富。因此,未来校本课程的相
固定型带式装卸机被广泛应用于散装物料的装卸作业中,但固定型带式装卸机占地面积大,无法灵活转场的问题导致铁路运输过程中散装物料的装卸效率提升缓慢。当前大多数铁路货场在进行散装物料装卸时仍采用斗式装卸机和人工装卸相结合的方式进行,不仅装卸效率低下,而且人力资源的成本很高。传统的装卸机构已经不能满足日益增长的散装物料装卸的需要,急需设计一款高效率、可伸缩、可旋转、可移动式的散装物料装卸机来满足当今的社会
装袋是马铃薯从收获到运输和储藏的重要环节,马铃薯入袋后的质量将影响运输、贮藏效果,马铃薯装袋机造成的机械损伤成为此阶段马铃薯损伤的主要来源。为解决现有马铃薯装袋机效率低、损伤率高的问题,本文设计了新型的导流、撑袋和定重装袋结构,研制了一种高效低损的辊式导流马铃薯自动定重装袋机,主要研究内容如下:(1)对马铃薯自动定重装袋机进行结构设计,摒弃了传统机械结构,设计了全新的导流机构、撑袋机构和定重装袋机
随着计算机技术、网络通信技术和控制科学的日益发展与交叉渗透,控制系统的结构也越来越复杂,为了满足日益增强的性能要求和复杂的功能需求,网络控制系统应运而生。网络和控制系统的结合具有成本低、功耗小、能实现信息资源共享、安装简单便捷等优点。但是,网络的引入也引发了网络时延、采样周期变化、执行器故障等问题。本文主要针对不同情况下系统的稳定性及控制方法进行了研究。首先,研究一类具有短时延的网络控制系统,假设
随着自动化水平的提高,自动导引车(Automated Guided Vehicles,简称AGV)越来越多的被应用到生产、生活之中,发挥的作用也越来越重要。AGV的应用不仅可以减小人工成本,而且生产效率也随之提高。视觉引导的AGV具有不受电、磁信号的干扰,路线易于改造等优点。近年来,随着计算机技术的飞速发展和传感器硬件能力的提升,基于视觉引导的AGV逐渐成为研究的热点。本文以某汽车零部件生产车间为
硫化氢是广泛存在于自然界和人类活动中的一类有毒气体,在工业生产中会对管道造成严重的腐蚀,对工业运行形成了极大地困扰,更对人身安全构成巨大威胁。因此,如何高效的脱除硫化氢成为丞待解决的问题。近几年在利用离子液体和低共熔溶剂等非水溶剂脱硫的领域取得了一定的成果。本文开发了一系列功能化非水溶剂用于硫化氢的去除,并采用傅里叶红外光谱(FT-IR)、扫描电镜(SEM)、X射线衍射(XRD)、热重-差示扫描量