面向图像语义分割的新型卷积神经网络及其应用研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:zhangg91
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在过去的若干年中,卷积神经网络(CNN)在图像分类和对象检测领域表现出众,并且具备良好的应用价值,尤其在计算机视觉方面的应用已经取得了一系列显著的成果。从生物识别系统到实时应用程序,都受到深度神经网络(DNN)的深刻影响。而卷积神经网络作为使分类和学习更容易和更可行的关键技术工具之一,极大地提升了对象识别应用程序中的识别率。在GPU技术的支持下,CNN被证明非常适用于基于视觉的应用程序。然而CNN需要消耗大量内存和计算资源,在传统CPU上运行极慢,不适合进行训练。因此,想要在存储和计算能力有限的实时系统上实现非常高效的CNN几乎不可能。在这种情况下,需要一些改进的CNN解决方案,以提供更简单的结构,更好的性能和更高的准确性。本论文围绕两个核心课题展开研究:提出一种具有高精度的新型CNN架构;降低传统CNN架构的计算资源消耗。本文的研究内容和贡献如下:1)针对当前视觉应用对架构扩展性的需求,提出了一种面向实时系统的可扩展神经网络架构,该架构使用卷积神经网络来设计资源节约型视觉应用系统,并介绍了该架构的理论和设计方法。2)针对辅助驾驶系统中道路场景理解缺少足够带标注训练数据的问题,提出了解耦卷积神经网络DCNN(Decoupled CNN),从而能够用较少的或半标注的数据来训练CNN。DCNN使用了不均匀标注的方式,包含少量带标注数据以及大量弱标注数据。3)针对语义像素分割应用中CNN模型过于复杂的问题,提出了一种简化的全卷积神经网络模型。该模型与传统CNN流水线的不同之处在于,只使用了卷积层,而没有池化层4)针对CNN在实时语义分割应用中过分参数化及网络模型冗余问题,提出了一种用于像素级分割的资源节约型语义分割模型。该模型是一种编码器-解码器结构,编码器建立在VGG-16网络基础上,而解码器则来自于SegNet。该模型能够预测给定输入图像的像素级分类标签。该模型旨在用于道路场景理解,适用于基于视频流的辅助驾驶系统。5)针对CNN计算复杂性较高导致难以在便携式设备和实时系统上使用的问题,提出了一种压缩CNN以降低存储和处理需求的解决方案。论文中介绍了各种网络架构的实验。所提出的编码器-解码器架构旨在减少可训练参数的数量。通过尝试不同的层和网络组件,利用减少的网络结构来分析最佳性能。关键思想是减少整体网络存储和计算需求。另一方面,二值化分割网络可以大大减少处理和存储要求,通过排除CNN训练中的关键乘法运算,并用更多的计算友好运算(加法,减法)代替,这种二值化过程将大大改进模型的性能。文中所提出的网络模型在CamVid和Pascle-Vocl2数据集进行实验。所提出的网络模型也可从 www.github.com/robail/获取。
其他文献
视频中人体动作识别作为计算机视觉与模式识别领域中的一个重要分支,在智能视频监控、人机交互、运动分析、视频检索等诸多领域,具有广阔的应用前景,受到了国内外学者广泛关
通过对兰坪盆地内三种主要成因类型(沉积-热液改造型、热水沉积-热液改造型和热液脉型)的铜银多金属矿床硫、碳、氢、氧同位素的研究,揭示了成矿作用过程的某些重要信息:矿石中的
活动轮廓图像分割方法于1987年由M.Kass等人最先提出,在过去几十年中逐渐成为图像处理领域特别是图像分割领域的研究热点。随着研究的不断深入,大量的活动轮廓模型先后被提出
随着大数据时代的到来,人们所采集的数据量已达到ZB级规模。为了精确查询数据,越来越多的搜索引擎采用知识图谱作为底层数据支撑。知识图谱是描述现实世界中地点、人物、城市
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
选取260例于2012年5月~2013年5月我院接收的龋齿患儿,共患有邻面龋或面龋乳牙448颗,根据洞型充填材料的不同将患齿分成A组、B组、C组、D组,A组、B组均为Ⅰ类洞,A组充填材
本文主要深入探索PDDM理论的内涵,建立完善的PDDM设计方法的理论及应用体系,为自售货机设计的设计、管理过程提供新的方法论,从而缩短新产品开发的时间、提高产品质量、降低
摘要:现代学徒制人才培养方案是学徒制的核心内容,那么如何制订现代学徒制专业人才培养方案?本文以工业机器人专业为例,较详细地介绍了人才培养方案的制订过程。  关键词:现代学徒制;机器人;人才培养方案  中图分类号:G710 文献标志码:A 文章编号:1674-9324(2019)21-0245-03   人才培养方案是现代学徒制专业教学活动安排的基本依据,也是学徒制试点的重要文件。在实际运作
精细的室内三维测图已经成为支撑室内三维制图,室内定位导航及增强现实等应用的重要的技术手段。目前,常用的室内场景三维测图手段主要有激光扫描(Terrestrial Laser Scannin