基于移动平台的深度学习优化计算方法研究

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:gmn10021
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,基于卷积神经网络(Convolutional Neural Networks,CNN)的深度学习(Deep Learning)相关技术和算法,以其在诸如图像分类,目标检测,自然语言处理等任务上优异的性能表现,获得了学术界和工业界越来越广泛的关注。随着新需求,新任务的不断涌现,其应用场景也随之越来越广泛。然而,为了处理越来越复杂的任务,满足人们对精度越来越高的要求,大多数现代深度神经网络的深度和宽度不断增加,随之而来的是其越来越高的内存占用量和计算复杂度。与此同时,在移动端设备上运行基于深度学习的相关算法的需求不断提高,而在这些设备上,无论是内存,电量还是计算能力,都受到极大限制,这给深度学习相关算法的移动端部署带来极大困难,也成为限制深度学习相关算法应用场景的主要瓶颈。为了解决这个问题,本文对二值神经网络的内存管理方式和计算流程进行了重新优化和设计,实现了一个高效的二值神经网络前向计算算法BitStream,与已有算法相比,BitStream在速度上和内存占用上取得了明显的提升;除此之外,本文设计并实现了一个基于移动平台的量化神经网络优化计算方法,与浮点神经网络相比,取得了数倍的性能提升;为了让这些算法真正落地,本文设计了一个基于移动端的,轻量级、高效的深度学习前向推理框架QEngine,在各个不同的网络和硬件平台下的性能评估表明,与其他流行框架相比,本文提出的算法可以有效的提高深度神经网络在移动端的运算性能。
其他文献
本文试图从生态翻译学的关注焦点:选择与适应、译者中心、译有所为,这三个层面出发,对许渊冲先生的翻译活动及其作品《李白诗选》进行分析。
介绍了地下连续墙的概念以及特点,对部分渗漏部位的形成以及影响进行了简单的分析,并且对深基坑地下连续墙快速注浆堵漏的施工技术做出了相关的介绍,取得了良好的经济效益。
国内外研究和实践都已证明,大力发展公共交通是解决日益严重的城市交通需求与供给问题尤其是交通拥堵带来的如环境、经济、安全等问题的最有效措施。而且只有将公交优先发展
当前,我国互联网技术迅猛发展,主流媒体在发展中遭遇到诸多难题,也一直在进行着积极的探索。从各类新型平台的启动,到不同新闻方案的发布,在先进信息技术的驱动下,实现主流媒
随着我国城市化进程的发展和节能降耗需求的提出,大型公共建筑能耗尤为突出,据不完全统计,我国既有大型公共建筑以不足4%的城镇建筑面积占比消耗了25%以上的城镇建筑总电耗。
阐述了武咸公路的现场胎架设置和吊装施工的实施,主要介绍了现场胎架的设计和吊装施工的部署、吊装设备选用、箱梁就位等。
为了提高碳钢的微动磨损特性,采用不同参数的滚压工艺对45号钢试样进行表面处理,通过表面形貌测量仪、维氏显微硬度计和扫描电镜(SEM)考察在不同参数下,滚压工艺对钢的表面粗糙
<正>博物馆是科学文化事业的一个重要组成部分,是随着社会的发展、适应社会的需要产生并发展的。博物馆事业发展的规模和质量是衡量一个国家、一个地区科学文化发展水平的重
会议
目的为了强调和重视中医“五方异治”和“因人制宜“思想,探讨青海不同民族之间舌象的差异性。方法对青海高原地区150名汉藏土族健康青年的舌体和舌苔进行检测观察,舌质按舌色
课题名称:慢病中医临床研究示范方案科学性和可行性的调查课题来源:国家中医药管理局中医药行业科研专项:中医慢病临床科研体系及其成果转化应用模式研究(课题编号:201107006)研