基于Zynq的卷积神经网络嵌入式加速系统设计

来源 :南京理工大学 | 被引量 : 4次 | 上传用户：kaeco

【摘要】

：

卷积神经网络(Convolutional Neural Networks,CNN)作为深度学习的代表算法之一,在图片分类、目标检测、语音识别等方面得到了广泛的应用。CNN需要的计算量巨大,但传统的嵌入

【作者】

：

匡鑫

【出处】

：

南京理工大学

【发表日期】

：

2019年01期

【关键词】

：

卷积神经网络加速器量化 Winograd Zynq FPGA

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

卷积神经网络(Convolutional Neural Networks,CNN)作为深度学习的代表算法之一,在图片分类、目标检测、语音识别等方面得到了广泛的应用。CNN需要的计算量巨大,但传统的嵌入式系统计算能力十分有限,很难满足在自动驾驶等应用场景中的实时性要求,因此迫切需要设计新的推理加速系统来提升其计算能力。Zynq作为一个CPU+FPGA的新型异构计算平台,在实现CNN加速方面具有巨大的潜力。本文基于Zynq实现了能适应多种CNN模型的嵌入式推理加速系统。首先,论文总结了神经网络理论的发展演进过程,并从3个经典的CNN模型中分离出4个基本算子;然后,提出了利用Zynq进行CNN推理的软硬件协同设计方案,并对CNN的定点数量化进行了研究;接着,研究了每个算子在FPGA上进行硬件加速的方法,针对FPGA的结构特点围绕数据复用和并行度探索问题进行深入研究,并设计出相应的IP核;然后,利用设计的IP核在Zynq平台上搭建出嵌入式CNN推理加速系统,完成了相关的驱动设计和软件开发;最后,利用该系统对CNN模型LeNet-5、AlexNet和VGG-16进行了验证和测试。结果表明,本文设计的推理加速系统能够适应卷积核大小不同的CNN模型。经ZedBoard平台测试,系统对CNN模型LeNet-5、AlexNet和VGG-16的实测性能分别为0.08GOP/s、8.4GOP/s和32.6GOP/s。针对运算量最大的VGG-16模型,该加速系统和CPU的对比测试结果表明,在保持了精度损失小于3%的条件下,本文设计的加速系统的速度是CPU的32.1倍,效能为其503倍。

其他文献

赛利涂层：为3C行业的加工难题提供完美解决方案

随着国内产业升级，机加工行业面临难加工材料、高速高效以及高精度的切削场景，对机加工刀具涂层的要求进一步提升，本文分别讲述了赛利涂层技术针对3C行业中316L、钛合金以及石圣

期刊

机加工行业难加工材料刀具涂层3C产业升级高速高效316L涂层技术

2014年11月单反相机网络零售品牌销售排名

<正>~~

期刊

网络零售品牌销售单反相机

简论郭沫若的“风韵译”观念及其历史意义——兼论20世纪中国翻译标准理论的演进

<正>巴渝作家对中国现当代文学的发展做出了卓绝的贡献,郭沫若等人对中国新诗发展的推动作用更是熠熠生辉,已有大量学者对此作了深入而全面的论证。因此,本文尽量避开人们早

会议

器械健身课程教学体系新构的研究

<正>1研究目的一些高校均开办了器械健身专项课程,但都没有一套完整的教学体系。通过对器械健身课程教学体系新构的研究,能更加清楚课程内容的框架,了解各课程内容间的相互关

会议

路桥工程深水基础钻孔灌注桩施工技术应用研究

随着社会的不断发展和进步,科学技术的不断提升,在现有的社会背景下,人们对于建筑行业也提出了更高的要求。路桥工程在我国基础设施建设中属于一项比较关键的项目建设,在这种

期刊

路桥工程深水基础钻孔灌注桩施工技术应用

基于Zynq的卷积神经网络嵌入式加速系统设计

其他学术论文