【摘 要】
:
目前图像分类技术已经被广泛应用,但是它的主流算法DCNN(Deep Convolution Neural Networks)参数多、计算量大,很难部署到资源有限的嵌入式平台上,限制了图像分类技术在嵌入式平台上的应用,所以研究轻量CNN(Convolution Neural Networks)很有价值。FPGA(Field Programmable Gate Arrays)适合流水并行处理且功耗非常
论文部分内容阅读
目前图像分类技术已经被广泛应用,但是它的主流算法DCNN(Deep Convolution Neural Networks)参数多、计算量大,很难部署到资源有限的嵌入式平台上,限制了图像分类技术在嵌入式平台上的应用,所以研究轻量CNN(Convolution Neural Networks)很有价值。FPGA(Field Programmable Gate Arrays)适合流水并行处理且功耗非常低,可以大幅提升网络推断速度,是目前DCNN的主流加速平台。根据上述总结,本文构建了轻量级网络HW_Shuffle Net,然后使用HLS(High Level Synthesis)开发工具设计了基于HW_Shuffle Net的FPGA加速器系统。具体工作如下:(1)首先,对比现有的卷积神经网络,以准确率、参数量和计算量作为网络选择指标,选出了Shuffle Net网络。通过对其使用输出通道数不变增加分组、减少复用的Shuffle1基本单元和卷积步进代替池化的方法,在保证准确率的前提下,缩减了Shuffle Net网络的参数量和计算量,构建了HW_Shuffle Net轻量级网络。(2)其次,考虑到FPGA硬件资源有限,本文采用了分块机制并使用半精度权重,在FPGA上实现了HW_Shuffle Net网络的推断加速系统。然后针对HW_Shuffle Net网络的特殊结构,采用流水并行架构设计、混合层设计、卷积层优化设计的方法对加速器系统进行了优化。同时借助HLS工具使用模块化与模板化设计,提高了加速器系统开发效率。将本文构建的HW_Shuffle Net网络与Shuffle Net网络进行对比实验,前者参数量约为后者的1/6,计算量约为后者的1/5,速度约为后者的2倍,准确率却只下降不到2%。然后使用HW_Shuffle Net网络加速器进行推断测试,处理速度比CPU(Intel Xeon E5620@2.4GHz)快约57倍、比GPU(NVIDIA Tesla K80)快近2倍,同时功耗比GPU降低了约46%。实验结果表明,HW_Shuffle Net网络在保证推断准确率的前提下,采用网络缩减策略减小了网络体积,解决了由于FPGA资源不足而难以部署CNN网络的问题。并通过加速器优化策略,有效提升了加速器推断速度。
其他文献
近年来,第五代通信技术日趋成熟,可穿戴设备和便携式设备的应用越来越普及,物联网的蓬勃发展正在将世界带入一个传感器无处不在的环境。模数转换器(ADC)作为连接模拟世界与数字系统的桥梁,普遍应用于各类电子设备中。为了实现整个系统的低功耗设计,对模数转换器性能和功效的要求也越来越严格。逐次逼近流水线混合型(Pipelined SAR)ADC结合了流水线型(Pipelined)ADC和逐次逼近型(SAR)
低轨卫星作为一种覆盖面广、不受地理和气象因素影响的中继节点,克服了地面网络远距离传输弱点,相对其它轨道卫星,其灵活可靠,成本低廉,更易满足地面移动用户的业务质量需求,因此受到了学术和工业界的广泛关注。随着通信技术的高速发展,用户终端的数量不断增加,业务范围也在不断拓展,这些都对未来卫星网络接入等性能提出了更高的要求。在如今的卫星网络环境中,用户分布跨度大,无法采用地面网络中基于载波侦听的冲突避免机
随着无线通信的迅速发展,人类正逐步进入万物互联的时代,多模式、多频带的无线通信设备将成为日后发展趋势,因而宽带射频接收前端成为时下的一个研究热点,除此之外,无线通信设备对功耗、性能等方面的要求越来越高。低噪声放大器(LNA)和混频器(Mixer)作为通信设备中的重要模块,同样也是主要的耗能模块,因此研究并设计高能效的低噪声放大器和混频器具有重要的意义。本文提出了工作在0.15~1GHz频段的低功耗
水下无线光通信(Underwater Wireless Optical Communication,UOWC)则是实现水下高速率、低时延通信的一种有效手段。且对比于传统的两种水下通信方式,水声通信、水下RF(Radio Frequency,RF)通信,它具备通过更小的功耗和更低的架设成本实现更大的信道容量和更高的传输速率的优点。不过水下无线光通信的难点在于水下环境复杂,激光在传输过程中需要面临水体
近年来,由于抗生素及免疫抑制剂在临床中的广泛使用,真菌感染的发病率逐年上升。目前,真菌的形态学检测手段仍依赖人工,并不能满足现阶段需求。因此,有关真菌检测的研究对真菌感染的及时发现和对症治疗有重要的现实意义。目前对真菌检测的研究多采用特征工程的方法。该类方法需要针对特定真菌的形态,通过人工设计提取特征信息对真菌进行分类识别。这些传统方法无论是在精度上,还是在适用性上都无法满足人们的要求。随着深度学
随着对海洋的探索不断深入,面向海洋信息收集监测的各类新型海上浮标、传感器不断涌现,传递信息从早期的低速传感器信息逐步演进至高速传感器数据、图像、视频等业务,人们对海上通信的质量与速率要求越来越高。另一方面,海上信道环境恶劣、设备功耗受限、频谱资源有限等问题始终是限制海上通信系统发展的重要因素。现有的海上通信系统具有传输效率低、通信成本高等问题。因此,研究近岸海面信道模型及与之适配的调制解调传输技术
我国海域面积宽广,拥有极为丰富的海洋资源。作为渔船在海上通信的主要方式之一,渔用通信系统的发展和改良关系着渔民在海上的生活状态和安全形势。同时,随着物联网技术和流媒体技术的不断发展,人们开始在改良当前的渔用通信系统中,研究具有更多功能的新型渔用综合通信系统,从而提高海上的通信能力。本文首先阐述了物联网技术的概念和特点,以及物联网技术在渔业通信中的研究现状,着重对物联网中的关键技术——集群和负载均衡
恒温晶体振荡器具有体积小、功耗低、短期稳定度好等优点,被广泛用于卫星导航、通信、电子仪器、计量等多个领域。恒温晶体振荡器随着工作时间的增加或温度的变化,其输出频率会发生缓慢地漂移,无法独立应用在授时、守时等高精度领域。本文通过对晶体谐振器两端相移变化特性的研究,提出了一种新的晶体振荡器老化补偿技术。在无需外接参考源的情况下,根据谐振器两端相移的变化特性,实现了恒温晶体振荡器的老化补偿。本文的主要工