基于GPDSP的深度学习编译器的实现与优化

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:jacklong1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度学习的发展热潮正在席卷全球,为推动该领域的高速发展,各大厂商纷纷推出了自己的网络框架和加速芯片。但由于框架和硬件的多样性,在不同硬件上高效部署各框架下的网络模型成为了一个难题,深度学习编译器的出现成功的解决了该难题。GPDSP是由国防科技大学计算机学院自主研发的高性能处理器,该处理器采用了超长指令字的体系结构,同时支持多核和向量指令扩展,十分适用于并行计算及AI云端计算。本文的主要工作是实现与优化了基于GPDSP的深度学习编译器。通过在深度学习编译器TVM上添加对GPDSP的支持与优化,充分扩展了该处理器在深度学习领域的应用场景,本文的主要内容有:1.结合源码探索和分析了TVM编译器的基本构成与编译流程。目前描述TVM整体编译流程的文献十分稀少,结合源码分析该编译流程的对后续开发工作来说将具备较大的参考价值。2.完成了TVM对GPDSP的支持。通过在TVM上添加GPDSP的接口,实现了算子的正确解析,并生成了功能正确的LLVM IR。3.在LLVM上添加了GPDSP指令与寄存器信息的描述,支持将TVM中的算子解析成GPDSP上的汇编代码。4.在TVM上根据GPDSP的特点制定了典型算子的优化,并通过测试用例说明了优化的效果。得益于向量部件的加速,这些优化对比默认实现都获得了11倍以上的性能提升。
其他文献
电离层是离地球表面约60~1000km范围内的大气部分,对人们的生产和生活有重要影响。我国现有电离层测量手段主要依靠地基设备和掩星技术,在海洋上空的探测数据相对缺乏。利用飞机的广播式自动相关监视(Automatic Dependent Surveillance-Broadcast,ADS-B,1090MHz)和船舶的船舶自动识别系统(Automatic Identification System,
学位
报纸
报纸
程序合成是软件工程的一个重要的研究领域,它是一项根据用户意图自动生成代码的软件开发活动。近年来,许多方法通过设计领域特定语言来限制程序空间,使得程序合成问题易于处理。虽然在某些特定领域这些方法是有效的,但是对于合成通用编程语言的程序而言仍然存在很大的挑战。基于API的合成为此提供了一种有前景的方法,它能够基于应用程序编程接口(Application Programming Interface,AP
学位
<正>抽象代数也称近世代数,简单地说它是研究各种抽象的公理化代数系统的数学学科。19世纪是抽象代数发展的创立期。1843年,哈密顿发明了一种乘法交换律不成立的代数——四元数代数。第二年,格拉斯曼推演出更有一般性的几类代数。1857年,凯雷设计出矩阵代数。1870年,克隆尼克给出了有限阿贝尔群的抽象定义;狄德金开始使用“体”的说法。1893年,韦伯定义了抽象的体。1910年,施坦尼茨建立了关于体的一
期刊
我国正在加快资本市场开放步伐,同时制造业企业的技术创新也因大力打造制造业强国的国家战略目标而愈发被重视,因此探讨资本市场开放能否促进A股制造业企业的技术创新具有现实意义,而沪股通制度的实施为我国资本市场开放问题的研究提供经验与证据。本文采用2011-2019年A股上市的制造业企业数据,以纳入沪股通作为解释变量,采用多元线性回归方法进行实证检验,结果表明:(1)制造业企业的研发投入与创新产出在纳入沪
学位
北斗导航系统(BDS,Bei Dou Navigation Satellite System),作为我国自主研发的现代卫星导航系统,在军民各领域发挥了重要作用。高轨卫星由于具有对地覆盖广、运行安全稳定等优点,其自主导航的研究受到了广泛关注。高轨卫星导航滤波算法设计是高轨卫星导航的关键研究内容之一,导航系统可观测性分析作为导航系统状态可估计性能力的重要指标,是导航系统设计与导航滤波算法优化的前提和基
学位
随着城市化的持续推进,目前全球大部分人口集中在城市。当城市战争、恐怖活动发生时需要搜索发现敌情,当城市灾害、事故出现时需要搜索救援,目标搜索需求越来越强烈。与此同时,城市环境中目标搜索存在诸多困难。小型、微型无人机能够在建筑物中间来回穿梭,甚至进入室内;能够克服人员地面视角和大型飞行器高空视角的局限性,寻找最合适的观察高度和角度进行目标搜索,是解决困难的极佳手段。和单无人机任务系统相比,多无人机系
学位
多智能体系统的集群现象在自然界中普遍存在,在生活中也有着广泛的应用.由于实际需求,不仅需要系统形成集群,而且需要保证系统形成某种固定的构型.因此越来越多的学者开始关注系统的集群编队行为,并从理论对这种现象进行建模与分析.在已有的文献中给出了很多关于系统集群和有限时间集群的丰富成果,对于两种混合型的集群行为分析的文献很少,本文将考虑一类混合型Cucker-Smale模型的有限时间集群行为.对于Cuc
学位
商业银行薪酬结构不当被认为是金融危机爆发的内部诱因之一。商业银行作为我国重要的金融中介,对我国金融发展与金融稳定发挥着举足轻重的作用。在商业银行迅速发展的同时,其的存贷利差受到冲击,盈利收窄下商业银行将倾向于开展高风险业务,并且在此过程中信用风险不断积累,从而导致商业银行的风险承担的变化。此时,商业银行薪酬结构的不完善也日趋凸显。本文以2010-2019年36家境内上市商业银行作为研究样本,基于上
学位