【摘 要】
:
近年来,计算能力的迅速提高使得基于卷积神经网络(CNN)的方法已在大量应用中取得了巨大成功,并且已成为计算机视觉中最强大,应用最广泛的技术之一。本文基于VGG16卷积神经网络的巨大潜力和通用性,对其进行硬件加速在不影响其精度的情况下加速计算过程并且降低功耗。FPGA是加速CNN的最有前途的平台之一,但是有限的带宽和片上存储器大小限制了CNN的FPGA加速器的性能。本文设计实现一种卷积神经网络的硬件
论文部分内容阅读
近年来,计算能力的迅速提高使得基于卷积神经网络(CNN)的方法已在大量应用中取得了巨大成功,并且已成为计算机视觉中最强大,应用最广泛的技术之一。本文基于VGG16卷积神经网络的巨大潜力和通用性,对其进行硬件加速在不影响其精度的情况下加速计算过程并且降低功耗。FPGA是加速CNN的最有前途的平台之一,但是有限的带宽和片上存储器大小限制了CNN的FPGA加速器的性能。本文设计实现一种卷积神经网络的硬件加速器。该加速器是基于FPGA并且由硬件和软件协同工作完成的。使用了FPGA和ARM的计算框架。在硬件方面对CNN模型进行正向推理,在软件方面完成系统的数据传输和控制。本文首先对VGG16模型进行深入分析,卷积层以计算为中心,全连接层以内存为中心,然后提出了一种动态精度数据量化方法和一种对CNN中所有层类型均有效的卷积器设计,以提高带宽和资源利用率。结果表明,当使用8/4位量化时,VGG16模型的数据量化流程只会引入0.4%的精度损失。随后本文提出了一种数据布置方法以进一步确保外部存储器带宽的高利用率。在硬件设计中,采用自顶向下的设计方式将加速器分为若干个子模块来设计。完成包括卷积层CNN模块,池化层POOL模块,AXI接口模块和缓存区域模块在内的多个模块的电路设计。该卷积神经网络加速器实现了VGG16模型的正向推理并且对于加速器的每一层,都通过使用流水线结构来提高整体数据吞吐量。每层之间的乘法累加器以及输入和输出缓冲区通过多路复用减少了资源消耗。在软件方面,设计了ARM CPU与CNN加速器数据交换逻辑和控制交互。结合硬件和软件设计,已成功对IMAGENET数据集进行了分类和识别,与软件实现相比,具有良好的分类结果。
其他文献
随着互联网中流量激增和新业务的不断涌现,现有网络技术已难以满足工业物联网、5G移动通信、AR/VR音视频和智慧城市等新应用场景中对实时性和可靠性的要求。面对这种时间敏感性业务的急切需求,如何保证可靠性,准确控制端到端时延成为热点问题。鉴于其成本低、部署简单、产业链成熟且带宽不断增大,以太网技术在新一代传输和接入网络中被广泛使用。因此,出现了多种改善以太网“尽力而为”机制引起的分组丢失和不确定性等问
序列密码的设计思想正在从线性序列变换到非线性序列,与此同时涌现了很多性质良好的非线性部件。进位反馈移位寄存器(FCSR)由于自带非线性,类似于LFSR的代数结构,具备优良的密码学性能,被认为是LFSR的一个较好的替代。在研究FCSR的结构和生成序列的同时,基于FCSR设计的各种新型序列密码开始出现,催生了各种针对FCSR类密码的分析技术与攻击手段,这反过来促进了FCSR理论与结构的进一步完善。本文
近年来,随着传统媒体不断向数字化转型,数字媒体内容逐渐成为互联网的主体。然而,大量的数字媒体内容中只有少部分是真正热门的,这就需要及时而有效的热度预测算法来甄别热门
随着信息技术的蓬勃发展,集成电路集成度不断提高,器件的特征尺寸不断缩小,传统的非挥发性存储器正面临着发展瓶颈:不断缩小的器件尺寸使得浮栅的厚度相应减小,然而过薄的栅
软件安全漏洞问题是当前网络空间安全的重要研究方向之一,软件安全漏洞一旦被恶意攻击,会导致用户的财产损失和信息泄露。模糊测试(Fuzzing)技术作为一种自动化的软件漏洞动态检测技术,因其在漏洞发掘方面的高效性和易用性,近些年获得了很大关注。将Fuzzing测试技术与符号执行、静态分析等其他程序分析技术相结合来提高Fuzzing测试的效率,成为了目前的一个研究热点。论文主要研究以一种更有效、更高效的
随着人类社会发展,贫穷和人类社会历史相伴而生。社会救助作为整个社会保障体系中最古老的一项制度,几千年以前,我国政府通过为社会中的贫困者和其所在的贫困家庭提供帮助的
中文分词是自然语言处理中的基石,由于中文在文本中的特殊性,它并不像英文一样有明显的空格分隔开,而是以单个字为单位,因此如果需要从文本中获取有用的信息,一定需要有正确分词后的文本,才能更好地进行下一步的自然语言处理方面的工作。然而中文分词的两大难点——真歧义以及未登录词,至今仍旧没有很好地解决。面对网络上用户的复杂信息,作为命名实体识别中必不可少的一部分,用户标识识别就可以发挥其作用。序列标注模型在
数据挖掘是一个从大量、复杂且冗余的数据中利用先进且精确的技术挖掘并产生新知识的过程,目的是寻找数据间潜在的关联,为研究者提供有利的科学指导依据。聚类算法是数据挖掘领域的一种重要的无监督算法,旨在找寻数据内在的分布结构,以便做进一步的数据分析。目前在许多研究领域都有较为广泛的应用,包括模式识别、信息检索、神经网络、图像处理等。本文对聚类算法进行了深入的研究,提出三种新的无参数峰值聚类算法:1.提出了
伴随着近些年来移动互联网以及移动支付的蓬勃发展,移动终端自身所蕴含的价值日益增多。由于巨大黑灰色利益驱动,恶意攻击者开始尝试入侵移动终端并进行盗用,在面对层出不穷的恶意入侵方法的情况下,如何对用户进行身份认证成为了保护用户财产的重要研究内容。当前对手指操作行为的身份认证的研究,大多数针对的是用户触碰屏幕时的过程,通过对用户触碰屏幕瞬间产生的行为数据进行特征提取,并使用各类检测算法进行比对或分类。因
在当今科技飞速发展的时代,人工智能成为核心领域之一,机器学习和数据挖掘逐渐影响着人们的生活,很多科技产品都是在此基础上的应用与研究,如指纹或人脸识别考勤设备、汽车无人驾驶、高级智能化机器人等新技术,这些利用信息科技推动发展的新技术使人们的生活和工作变得更加方便和高效。在众多的领域中,聚类分析是一类重要的应用技术,将粗糙集应用在聚类分析上也是当前研究的热点领域。本文首先对常用的度量方法进行介绍和总结