基于可重构阵列架构的智能处理器残差网络模块设计

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:eoast
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,卷积神经网络在诸如图像分类、目标识别、决策等许多应用领域展现出优异的性能。但是现有的人工智能芯片在物联网、车载等场景部署困难,因为它不但要求芯片具有一定的计算能力,同时也对功耗和成本有着严格的约束。为解决传统芯片架构对卷积神经网络算法在计算能力与功耗上的限制,专用人工智能处理器芯片凭借其体系结构的创新大大提高了神经网络计算速度,减小了功耗。此外,现有人工智能芯片可编程能力亦有待提高,对卷积池化等网络核心运算的支持有限,对残差网络等提高计算准确率的技术尚无特定架构的支持,从而在一定程度上限制定制智能芯片的推广。随着网络层数的增加,卷积神经网络会出现过拟合现象,准确率达到饱和并出现退化,而残差网络的出现有效地解决这一问题并且显示出不错的效果。因此,本研究在多个卷积神经网络算法架构中选择了残差网络,在现有的可重构阵列架构的智能处理器的基础上设计残差网络模块。该模块的实现拓展现有智能芯片的功能,从而增加低功耗智能芯片在边缘计算中的应用前景。本文致力于拓展现有体系结构设计方案,通过残差指令集、输入输出系统与存储系统的定制设计实现对多层残差神经网络的实时、高效部署。鉴于残差网络每层的权重及输入/输出数据量较大,因此本文采用片下DDR存储器对数据进行存储。将所设计残差网络模块用硬件编程语言来实现,通过EDA工具验证其功能正确与否。同时使用Keras模型来训练卷积神经网络,并将所得模型参数保存为HDF5文件,然后用python语言编写工具从中批量获取权重及配置参数。最后采用ISE工具来对整体设计进行逻辑编译综合以及布局布线设计,将所得bit流下载至FPGA上进行实验,此过程中也需要加载权重参数、配置参数以及图像数据文件。在FPGA实验中,先将其结果与ModelSim仿真结果进行对比,然后采用对照实验不但对残差网络自身不同深度时的性能进行纵向比较,而且也将残差网络与其他网络的性能横向比较。全文前两章首先介绍了课题研究的背景意义以及现状,接着是卷积神经网络发展历程、层级结构包括卷积层池化层和全连接层的计算,最后是FPGA的设计流程。第三章则是残差网络的具体设计方案,第四章是芯片设计中需要的权重参数、指令参数和图像数据的准备工作。第五章则是将残差网络等卷积神经网络部署到FPGA上进行实验对照。第六章是工作总结与展望,介绍了整个研究设计工作的理论知识学习和遇到的困难的解决方案以及对于本研究的不足。
其他文献
数字化科技信息技术快速发展,许多新兴市场日渐繁荣,从QQ、微信、微博的出现,再到“抖音”短视频、“伙拍”小视频以及“快手”短视频等短视频软件的火热,其为社会新经济发展提供驱动力的同时,更是带动了互联网新产业的崛起。凡事有利便有弊,网络迅速发展,其带来许多新景象,亦使短视频著作权受到了前所未有的风险与挑战。本文旨在通过对司法案例进行分析,研究在短视频著作权领域的法律规定与司法实务之间相存在的差距以及
植被图像识别是智能识别的重要研究内容之一,它在农业种植、植被科普研究、稀有植被保护、生态文明建设、植被文化传播等方面扮演着重要的角色。现如今许多基于位置的服务(LBS)应用也融入了图像识别技术来提升用户体验。但是随着拍摄技术的不断发展,更多的图像细节也会被捕捉到并展现在我们眼前,图片的拍摄角度、分辨率、植被生长的地域、植被的千姿百态以及不同植被在不同生长时期的形态不同,都给传统的图像分类算法带来了
多输入多输出(Multiple Input Multiple Output,MIMO)技术和低密度奇偶校验码(Low-Density Parity-Check,LDPC)码是当前无线通信技术中研究的重点。LDPC码采用基于置信传播的迭代译码算法,具有良好的译码性能;MIMO技术对空间域加以利用,在时域、频域和码域之外极大的增加了频谱利用率,将LDPC码与MIMO相结合,研究二者间的联合检测译码算法
广西沿海地区经济迅速发展的同时对土地的需求也不断扩大,作为重要的土地后备资源——海洋滩涂被大规模的开发利用,这对满足经济发展需求具有重要的意义。沿海地区开发利用海
背景乳腺癌是女性最常见的恶性肿瘤之一[1]。目前,乳腺癌已经成为我国女性发病位居首位的恶性肿瘤[2]。微小核糖核酸(microRNA)是一种短小的内源性非编码单链RNA分子,主要参
随着当前网络技术迅猛发展,越来越多的人开始在网络平台发表自己的观点和对事物的评价,从而产生了海量的文本数据。面对如此巨量的文本信息,有效对其进行分类和挖掘,提取文本隐含的情感信息具有重大的社会和商业价值。本文采用深度学习中的门控循环单元网络和自注意力机制,针对目前基于深度学习的中文文本情感分类方法中存在的问题进行了改进,并进行了基于字向量的中文文本情感分类研究。首先,针对中文文本情感分类采用一种预
目的椎间盘退行性疾病是脊柱外科最常见的一类疾病,而软骨终板作为椎间盘的重要组成结构和营养途径,它的退变是造成椎间盘退变的主要原因。软骨终板退变的发生和发展是一个涉及细胞自噬、增殖、凋亡、侵袭和迁移等复杂的生物学过程,虽然Mirco RNA(微RNA)及HMGB1(高迁移率蛋白-B1)都参与了椎间盘退变的进程,但二者之间是否存在明确的关联及之间的相关机制仍不明确。因此我们通过探究mi RNA及HMG
随着近些年来各类数据的急剧增加,从海量数据中进行知识发掘已经成为各行各业中最迫切的需求。在可获取的数据中有高于80%的数据都与地理信息相关,时空大数据挖掘应运而生。时空异常数据探测作为时空大数据挖掘中的新兴领域,以其能快速准确发现时空事件的异常特性得到了快速发展。通过揭露时空数据异常背后所蕴含的未知信息,可以对尚未发生的某些事态变化发出预警,对于早期公共事件决策和部署有着重大意义。目前扫描统计方法
传统可降解高分子材料聚乳酸(PLA)的力学性能较差,降解产物呈酸性,在临床使用中出现了较多的问题,而作为新一代可降解医用植入材料,镁及镁合金的降解速率过快限制了它的发展。本文设计并制备了以Mg或Mg-Sn-Mn、PLA互相增强的镁合金/聚乳酸互穿结构复合材料,实现了Mg、Mg-Sn-Mn和聚乳酸的优势互补。文中通过浸泡实验和电化学实验研究了复合材料的降解性能;采用拉伸、弯曲等测试评价了材料的力学性
目的:从鳞尾木种质资源遗传多样性、营养成分、总黄酮含量及抗氧化活性、光合特性等方面进行研究,以期为鳞尾木的可持续开发利用提供研究基础。方法:(1)采用正交和单因素试验设计方法,对影响鳞尾木ISSR-PCR反应体系的d NTPs、Taq DNA聚合酶、引物、模板DNA及Mg2+浓度5个因素进行优化,建立出稳定、重复性好的鳞尾木ISSR-PCR扩增体系,筛选出所有有效引物后对所有DNA分子样进行扩增,