基于多核DSP的卷积神经网络算法优化关键技术研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:liongliong490
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
卷积神经网络(Convolution Neural Network,CNN)这一系列深度学习算法是计算机视觉领域的关键算法,已经在无人驾驶、智能语音、智能识别等生活场景中取得了巨大的进展,但CNN对计算力的要求也在不断加大,且随着现代社会的不断发展,在工业生产控制,军事作战管理,医疗电子辅助等多种领域,需要功耗较低的便携设备实时性地完成相关作业,数据处理和数据存储的平台多为嵌入式移动端设备。DSP是具有代表性的移动端设备之一,其能快速实时地完成计算任务,因此,研究卷积神经网络系列算法在多核DSP上的应用加速技术具有重大现实意义。基于上述目的,本文以消除网络冗余参数和降低计算量问题为核心,依托多核DSP硬件平台,针对常用人工智能算法CNN优化的技术,进行了实验验证,最终成功在多核DSP平台上实现了CNN模型的推理过程,并提高了模型的推理速度。本文主要从以下几个方面进行了相关研究:首先对CNN的结构进行分析,使用同样具有卷积层、池化层和激活函数等CNN结构的Squeeze Net模型进行推理优化实验,统计模型推理计算过程中数据分布情况,为了降低模型量化处理造成的精度损失,采用控制激活函数的方法缩小数据分布范围,以提高数据分辨率;其次根据硬件平台的存储能力和计算能力,尽可能地减少数据访问DDR的频率,提出将卷积层、池化层和激活函数合并为一层进行处理的方法;然后又对Squeeze Net模型中卷积计算的具体信息进行分析,结合卷积核大小、数量,以及各卷积层的步长,提出了一种基于GEMM和Winograd结合的卷积实现方案,以最大化提高模型的推理速度;最后提出具体的部署方案,通过设计可行的多核并行方案,调用TI公司提供的库和SIMD指令,并进行了访存优化实现了模型推理速度的提升,成功完成了识别工作。
其他文献
从电影发展史看,叙事曾挽救了新生的电影,让电影成为伟大的第七艺术。电影可以叙事,并且主流电影大多讲述故事,这对于观众是不言而喻的常识,为什么却成为电影叙事学家必须论证并解决的基本问题?本文论述作为一门科学的电影叙事学如何从学理上阐明电影与叙事、电影与叙述者、演示和叙述之间错综复杂的关系,并论述从结构主义经典叙事学向后经典叙事学研究的转向。面对数字时代出现的各种新的叙事现象,采取类似“叙事学+”的研
期刊
人工智能的发展已经被提升到国家战略高度,第三次工业革命的浪潮已经袭来。人工智能想要更好地与人打交道实现人机交互,亦或是帮助人类在医疗、公共安全、远程教育等领域实现更高智能化,在人脸识别和表情检测方面的研究尤为重要。2021年作为新冠病毒全球大流行之后的人类发展的元年,人们的社交距离普遍增大,佩戴口罩成为一道靓丽风景线。多种人脸遮挡的现实场景给相关识别任务的研究和发展带来了机遇和挑战,现实意义非凡。
学位
受限于光纤激光器热效应、非线性效应、模式不稳定、光纤端面损伤等因素,单根光纤激光输出功率存在理论极限,对多束激光进行合成是提升激光亮度、功率的有效技术途径。本文以基于双色镜的光谱合成技术作为研究对象,开展系统的理论和实验研究,旨在通过提高单路输出功率、增加合成路数,实现高功率、高光束质量近单模激光输出。1、介绍了光谱合成技术的应用背景,总结了国内外利用双色镜开展实验研究的发展现状,指出了基于双色镜
学位
对于腿足动物来说,步态和运动的速度以及周边的地形环境是紧密联系在一起的,因为在某一范围内的速度选择合适的步态能够最大限度的减小机体的能耗,同时选择合适的步态能够通过相应的地形环境,这些对于动物来说是十分重要的,而这也同样适用于腿足式机器人。其次是对于四足机器人的多步态运动控制而言,如果能在统一的控制框架下实现多种步态运动控制的目的,这不仅能够简化控制程序,同时还增强了控制方法的统一性和适用性,因此
学位
近年来,深度卷积神经网络(Deep Convolutional Neural Networks,DCNNs)在图像分类、语义分割和目标检测等计算机视觉领域中取得了巨大的进步。然而为了提高模型的泛化精度和质量,深度卷积神经网络模型的规模不断加深加宽,这使得模型的训练过程需要大量的时间和计算资源。现有的分布式并行加速训练方法主要有数据并行(Data Parallelism,DP)和模型并行(Model
学位
单晶硅反射镜在高功率激光系统中有着广泛的应用。单晶硅表层特定原子结构(即功能序构层)直接影响单晶硅负载能力水平。目前存在功能序构层结构对负载能力影响机理不明确、精抛光过程中单晶硅表面负载能力变化较大等问题,导致其负载能力难以确定性提高。针对上述问题,本文从单晶硅功能序构层结构光学性质仿真、功能序构层引入及调控等方面进行了深入研究,提出了基于功能序构层调控的单晶硅反射镜高负载能力制造新工艺,对于实现
学位
老龄化现象已经成为一个不容忽视的存在,在我国社会的持续稳步发展中,需要对其高度重视并审慎对待。第七次全国人口普查数据显示,G市60岁及以上人口总数为2130598人,占总人口比例11.41%,而65岁及以上人口则占总人口比例7.82%。广州人口总量持续增长,但劳动人口比重下降,预计到2025年,G市常住人口将达到2150万人左右,未来五年将进入老龄化和少子化"双加速"的转折期。居家养老是当前乃至未
学位
海上目标探测和定位对于国防安全有着重要意义,沿海侦察站可对第一岛链内的目标高精度定位,但对于第一岛链外的目标需借助卫星无源定位系统进行定位。随着战争形态的转变,对无源定位系统的生存能力和快速响应能力的要求变高,侦察卫星小型化和网络化成为新的研究热点和趋势,由于小卫星的有效载荷受限且电功率较低,其只能搭载性能有限的数据采集和卫星链路通信设备,因此对星上数据采集和地面站处理提出了新的要求。本文在低采样
学位
遥感图像目标检测是遥感图像智能解译分析的一个重要研究领域。随着近些年来遥感技术和深度学习技术的快速发展,以及遥感图像目标检测技术在军民领域广泛的应用需求,如何利用卷积神经网络(Convolutional Neural Network,CNN)提高遥感图像目标检测性能并应用到现实场景中已成为该领域的研究热点。与基于模板匹配、基于统计判决等的传统方法相比,基于CNN的方法利用多层网络自主学习样本特征,
学位
战场态势是战场感知能力所实现的最终结果,反映了战场空间中兵力分布和战场环境的当前状态以及对未来战场发展变化趋势的预测,为指挥员作战决策和指挥提供有力的支撑。未来战争逐步趋于无人化、智能化,大规模分布式无人系统将应用于实战战场,有人、无人集群自主协同作战将逐步成为未来战争的主要形式之一,维护各分布式作战单元所面对相关态势信息的一致、实现对战场环境态势的全方位感知的战略意义愈发凸显。针对分布式系统中战
学位