基于图网络的OpenCL程序启发式优化研究

来源 :西北大学 | 被引量 : 0次 | 上传用户:yufs80131234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着通用计算譬如3D图像处理、视频处理等对GPU的性能要求越来越高,异构设备得到了快速的发展,异构平台下的传统编程模型存在可移植性差和兼容性低的问题。为此,苹果公司开发了旨在面向异构计算平台的框架OpenCL。OpenCL编程模型虽能在一定程度上降低程序设计的难度,但在编写高性能的通用计算程序时仍需考虑如何利用优化方法使其获得更短的执行时间和更高的加速比。为了提高OpenCL代码的执行效率,目前学术界和工业界提出了利用机器学习进行kernel参数自调优和启发式程序优化等解决方法。但是目前的方法存在人工干预多、LSTM不适合处理非欧几里德结构数据的问题。因此本文提出了一种基于图网络的OpenCL启发式程序优化方案,通过完成异构设备的最佳映射和预测最佳线程粗化因子两个任务来达到减少程序执行时间和提高程序加速比的目的。本文的研究工作主要包含三个方面:(1)针对目前编码方式仅考虑代码浅层的顺序文本结构信息问题,研究并设计一种基于LLVM的OpenCL源代码构图方法。在预处理阶段简化代码、去除冗余信息后,从获取到的抽象语法树上构建了七条边,旨在尽可能多地概括源代码的语法和语义信息。七条边共分为抽象语法树边、语法信息边和语义信息边三类。(2)针对LSTM不适合处理非欧几里德结构数据的问题,研究并设计一种基于图网络的启发式优化方法。通过word2vec去学习token的上下文关系及类型信息,归一化去缩放工作项等辅助输入,基于RGCN和GNN提出了基于边类型的图神经网络RGNN,通过RGNN去完成代码特征的自动提取,进而完成异构并行映射任务。(3)针对OpenCL粗化后的数据集难以获取、人工干预多的问题,研究并设计一种基于迁移学习的启发式优化方法。去除冗余信息后生成了大量的OpenCL代码作为训练集,对异构并行映射任务中学习到的模型进行迁移学习,在保留了源码构图和图神经网络层的同时实现了任务的迁移,在多个平台下完成了线程粗化因子预测任务。实验结果表明,在异构并行映射任务中,本文的优化方法最佳情况下能够达到88.50%的识别率,相较于最先进的方法,提高了20.8%的性能。在线程粗化任务中,最佳情况下能够达到1.14倍的加速比,相较于最先进的方法,提高了10.6%的性能。
其他文献
我国全面推进商事登记制度改革,目的在于转变政府职能,理顺政府和市场的关系,建设服务型政府,简政放权,发挥市场在资源配置中的作用。现阶段,商事登记制度改革持续推进,与原
现阶段关联规则挖掘算法大部分依靠学生课程的最终成绩挖掘课程间的关联,而很少挖掘课程内部知识点间的知识关联,以及不同课程中知识点间的关联关系。针对这一问题,从学生试卷中知识点的得分情况分析,挖掘知识点间的关联关系,同时结合知识点间固有的包含关系和前驱关系,使用neo4j图数据库进行可视化,根据可视化的结果,对学生进行指引和预警。在挖掘知识点间关联规则的过程中,针对学生成绩中知识点得分数据十分密集知识
近些年来,兼具电子关联效应与非平凡拓扑结构的相互作用拓扑绝缘体已成为凝聚态物理学研究的热门话题之一,这当中以拓扑近藤绝缘体候选材料SmB6为典型代表。理论上研究其基本
20世纪以来,形上学家们一直在关注使真者与使真关系。在使真者形上学中,使真关系被认为是一种跨范畴的关系、内在关系与必然关系,并且每个命题都至少有一个使真者。对于语义学的研究,不同历史时期,则出现了不同的语义学理论,而影响最大的就是真值条件语义学。根据真值条件语义学,一个语句的意义就是其真值条件。近年来,在真值条件语义学框架下,凯特·法恩(Kit Fine)则提出一种使真者语义学。他尝试通过使真者与
TDLAS技术广泛应用于石油、化工、环境监测等领域,具有检测速度快、精度高、可在线检测等特点。TDLAS技术需要数字锁相放大器进行信号处理,传统上的锁相放大器体积大不易集成
随着物联网技术的广泛应用,作为其核心的无线传感器网络也发挥越来越关键的作用。无线传感器网络为物联网应用提供数据采集和传输的支持,然而传统网络标准并不能很好的满足实际应用场景对可靠性和实时性等性能要求,因此迫切地需要一种具有高质量网络传输特性的无线传感器网络标准。IETF 6TiSCH工作组通过整合IEEE 802.15.4e TSCH标准和6LoWPAN协议提出了新型无线传感器网络标准6TiSCH
复杂且精密度高的设备因退化失效发生故障会造成重大损失。工业设备剩余寿命预测是故障预测与健康管理的重要组成部分。根据设备的运行状态数据预测剩余寿命,用于制定维护计
随着新兴电影产业的发展,全球的电影市场保持着稳定增长的基本态势,互联网上也拥有无比浩瀚的电影资源,推荐系统已经成为了人们在快速查找感兴趣的电影的方式。近年来,深度学习在图像识别,自然语言处理等领域得到了广泛的应用,同时,最近的一些研究也表明深度学习在推荐系统上的可靠性。在这样的背景下,对个性化推荐系统的基础理论进行研究,并利用深度学习在推荐领域的相关技术,提出了一种基于深度神经网络的个性化推荐算法
图像作为信息传输的载体会在传播的过程中受损导致图像质量下降,因此就需要好的图像质量评价(Image Quality Assessment,IQA)方法来对图像进行质量评价,以便及时发现图像质量
我国《物权法》规定的浮动抵押制度不仅是大陆法系吸收英美法系制度的成果,而且也是民法商法化的典型,具有自己的特点。但我国缺乏关于浮动抵押受偿顺位规则的制度安排,这一立法漏洞使得浮动抵押的整体制度价值大打折扣,应借鉴外国立法并结合浮动抵押的特性,基于浮动抵押的安全与效率的双重价值诉求,完善我国浮动抵押权受偿顺位规则。本文在前人研究的基础之上,从浮动抵押制度实践中发生权利竞合时的受偿顺位出发,分析以下问