基于异构平台的图像识别加速算法研究与实现

来源 :大连理工大学 | 被引量 : 1次 | 上传用户:zhaocd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人工智能和高性能异构计算在视频大数据处理中的研究应用意义重大,将算法高效部署在特定计算平台具有极大的挑战。本文以智慧城市智能监控应用为项目背景,针对深度学习计算量大、视频识别产业应用实时性要求高、异构平台复杂多样等问题,从图像识别算法、异构计算及并行编程和算法优化加速三个方面深入研究实践。对比分析经典图像识别算法,明确了YOLOv3算法模型在工程部署中的重要地位,着重研究该算法模型、框架结构及核心计算模块,理论分析和实验验证该模型计算性能。研究CPU+GPU异构计算平台和编程技术,提出基于OpenCL统一并行编程模型的协同计算方案,运用循环展开、向量化、数据重排、多线程并行和内存访问优化等并行加速策略。基于DarkNet开源深度学习框架,使用OpenCL设计实现卷积层、池化层、批量归一化层及激活函数层等内核函数。采用端到端自动优化编译堆栈TVM,重写高级数据流,生成优化的计算图,结合张量描述和目标硬件优化原语,生成可能的优化调度空间,构建机器学习成本模型自动调度优化器。并采用XGBoost对模型进行训练调优,将优化后的模型及参数生成库文件供CPU/GPU设备部署。实验表明YOLOv3算法在CPU+GPU异构计算平台上相对于CPU加速比达到271.8,相对于GPU加速比达到1.6。TVM优化部署在CPU上加速比达到4.62,在GPU加速比达到1.46。研究成果突破了原算法应用平台局限性并提升平台计算性能和算法运行实时性,解决了跨多种硬件设备代码重构和性能优化的难题,对于复杂多样的异构平台上算法功能及性能移植具有重要的意义。
其他文献
随着“绿色化学”理念的提出,发展新型、绿色、有效的化学转化以提高原子利用率已经成为有机化学领域重要的研究内容。为解决原子经济性的问题,以碳氢化合物作为起始原料的氧
瓦斯爆炸与火灾事故是目前煤矿重大事故之一,在对矿井火灾与爆炸隐患进行辨识的基础上,对隐患致灾链进行分析与研究,并应用面向对象的程序设计方法及地理信息系统(GIS)技术开发隐患及致灾链信息管理系统,以加强并完善矿井火灾与爆炸事故隐患管理,为建立防灾体系提供技术支持。
心理学和行为学研究表明,在公司决策和治理中女性高管更偏向谨慎和稳健的决策,其对企业内部成本费用的管理方案和调整策略区别于男性高管。本文力图以上市公司女性高管为研究
健康是衡量一个国家经济社会发展水平的基础条件,也是评价民族昌盛和国家富强的重要标志。当前中国特色社会主义进入了新时代,要实现中华民族的伟大复兴、满足人民群众对美好
2019年5月29-31日,2019北京国际道路运输、城市公交车辆及零部件展览会在中国国际展览中心(新馆)举行,重庆车辆检测研究院有限公司(以下简称"重庆车检院"或"公司")应邀参展。
紫云英是一种天然的有机肥源,在稻田种植紫云英能够为稻田生态系统增加大量的生物固氮并提高土壤肥力,有利于水稻稳产增产,从而减少矿质态氮肥的投入。因此,紫云英作为稻田中
目前采用的发电机密封油系统,由于种种原因,运行不稳定,有时还会激发系统的耦合震荡,导致发电机进油、漏氢等后果。利用液压与机械阻抗原理、借助四端参数方法,对双流环式密封油系
2019年5月13日,重庆车辆检测研究院有限公司(以下简称"重庆车检院")新增电动汽车电机加载EMC检测能力,在5m法电波暗室顺利完成了用于EMC性能测试的电动汽车电机控制器及驱动