视觉注意力和深度学习驱动的车道线检测与分类研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:yangwenhuai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
车道线检测和分类是自动驾驶技术中环境感知系统的重要组成模块。传统的车道线检测和分类算法主要提取车道线的颜色、纹理等特征,进一步采用聚类或分割算法获取车道线的位置和类别信息。然而,传统算法依赖于手动提取的特征,在不良天气以及复杂道路环境下的性能具有一定的局限性。深度学习具有强大的自动提取特征的能力,可应用到复杂多变的道路场景中。目前,基于深度学习的算法是将车道线检测任务和分类任务视为语义分割任务。然而,主流语义分割算法通过堆叠大量的卷积层以取得较高的性能,导致算法参数量较大以及实时性较低。由于车载设备的计算资源、存储空间等限制,要求算法具有较高的实时性和较少的参数。因此,本文对深度学习的网络结构进行了研究与改进,从而实现以较少的参数量获取较高的车道线检测与分类准确率以及实时性。本文的研究内容和创新点总结如下:(1)提出了基于混合注意力的快速车道线检测网络(Lane-VGG)。首先,在编码器中建立卷积特征与注意力特征之间的相关性,增强网络学习上下文信息的能力;其次,将上下文信息融合到解码器的上采样中,以补偿池化操作在信息传递过程中丢失的细节信息;之后,将解码器划分为两个分支,分别为可将像素分割为车道线和背景的二值分割分支和将特征嵌入到空间结构的可嵌入分支;通过融合双分支的特征图,可取得最终车道线检测结果。实验结果表明,Lane-VGG采用视觉注意力可以增强网络聚焦车道线区域的能力,取得了较好的实时性,有效降低了误检率。(2)提出了基于语义分割的轻量车道线检测网络(LLNet)。首先,构造了一个简单的子单元,可显著降低网络的参数量;其次,为增强标签的监督作用,采用密集连接和跳跃结构将两个子单元级联起来构成密集块;然后,将编码器中的密集块特征和解码器中的密集块特征相融合,以增强网络性能;最后,采用实例分割分支替换Lane-VGG中的二值分割分支,利用车道线实例分割的强约束条件,提高检测精度。实验结果表明,LLNet在保证网络实时性的同时,可以有效提升网络的检测精度,降低网络参数量。(3)提出了基于网络级联的实时车道线分类网络(DCNet)。DCNet由一个检测网络(DNet)和一个分类网络(CNet)级联组成。首先,将DNet编码器特定位置的低层特征与解码器中的高层特征相结合,实现高级语义信息与低级语义信息的联合编码,并获得车道线的像素坐标值;其次,利用车道线的像素坐标值索引出原始图像的对应位置的像素值,并生成包含有颜色和纹理等信息的新特征;然后,将此新特征和车道线类别联系起来,构造特征-类别对;最后,将特征-类别对送入CNet中进行训练,从而得出车道线的类别。实验结果表明,DCNet可以同时实现车道线的检测和分类,且具有较高的精度以及鲁棒性,能够可靠地检测和分类多种场景下的车道线。(4)提出了基于双向分离注意力的车道线检测与分类网络(TSANet)。首先,TSANet采用更小的卷积核构建对称单元,可进一步降低参数量;其次,在多个对称单元之间采用密集连接构造密集连接块,可获取多尺度信息;然后,构建了双向分离注意力模块(TSA),通过在横向和纵向两个方向上提取出注意力特征,建立长距离像素之间的依赖关系;最后,将TSA模块嵌入到编码器中,同时将TSA模块提取的语义特征融合进解码器中,以获取准确的车道线信息。实验结果表明,TSANet可以应用到驾驶场景中的车道线检测与分类,也可以实现道路场景中多目标的分割,具有很好的检测与分割效果。
其他文献
目前受控热核聚变能被认为是能够有效解决人类未来能源需求的清洁新能源,燃烧等离子体、托卡马克聚变堆工程技术、聚变堆各类材料是影响托卡马克聚变堆走向产业化应用的三个主要方面。在磁约束热核聚变装置中,面向等离子体部件的表面材料会与等离子体发生作用,形成杂质进入等离子体,杂质辐射对高参数等离子体稳定运行产生重要影响。前期大多数中大型托卡马克实验装置均使用碳瓦作为第一壁和偏滤器靶板表面材料,在未来托卡马克聚
随着海上运输业的蓬勃发展,船舶火灾安全问题日渐凸显。根据事故统计船舶火灾多发于机舱,而七成以上的船舶机舱火灾事故是发生在海上航行过程中。海上航行中的船舶不可避免会受到海风的作用,事故分析表明环境风影响下的船舶火灾危害性更大。前人研究中通常将船舶舱室简化为顶部开口舱室,但鲜少考虑环境风这一外界因素的影响。因此,研究环境风对顶部开口舱室火灾的影响,能够为此类船舶火灾事故的预防和应急救援对策的制定提供理
黄热病毒家族的寨卡病毒(ZikaVirus,ZIKV)由于导致人类神经系统疾病如小头畸形和Guillain-Barré综合征等而受到广泛关注。寨卡病毒是一种单链正义RNA病毒,其RNA基因组编码的非结构蛋白3(NS3)包含一个蛋白酶结构域和一个解旋酶结构域,N端丝氨酸蛋白酶结构域需要与NS2B蛋白因子相互作用才能发挥活性;C端解旋酶结构域在核糖核苷三磷酸(Nucleoside triphospha
单视角深度估计任务是计算机视觉领域中极具挑战性的问题之一,其目标是给定单张彩色图像,预测图像上每个像素点的深度值。由于三维空间到图像平面的透视投影,该任务存在天然的歧义性,是一个非适定问题。近年来,随着深度学习技术的发展,单视角深度估计的算法性能得到大幅提升,但仍然面临三个困难:(1)通过深度卷积神经网络预测的深度图缺乏对场景精细结构的描述;(2)深度标注数据获取难度大;(3)单视角深度估计网络的
近年来,太赫兹(THz)电磁波在医疗生物检测、材料分析、无线通信、大气监测等广泛领域展现出越来越重要的应用前景。THz辐射源是支撑THz技术应用和发展的关键器件。然而,由于THz波处在电子学和光子学的中间地带,基于传统电子学方法和光子学方法的THz源在输出功率、频率、便携性等方面难以满足实用需求。自由电子驱动的电磁辐射源在THz频段可以实现大功率输出,是一类重要的THz源。但是这类装置通常体积庞大
服役于人体生理环境中的植入金属材料往往由于腐蚀、磨损等作用而产生金属离子释放。某些适量释放的金属离子虽然在促进组织再生等方面发挥积极作用,但不可否认,过量的离子积累将对人体产生毒副作用,进而直接影响材料的生物相容性。通常,植入金属离子释放行为与材料的耐蚀能力息息相关,而作为评价植入金属材料耐蚀性的通用、实用手段,腐蚀电化学测试技术已广泛应用。因此,探究模拟人体环境中金属离子释放的动力学过程,阐述离
基于密度泛函理论的第一性计算方法已经被大量应用于预测和研究材料的各种物理和化学性质,已经成为独立于实验和理论的第三种研究方法。密度泛函理论的成功在于创造性利用密度作为能量的泛函,将3N维的Schr(?)dinger方程转为了三维问题,大大降低了计算量。但是密度泛函理论是基于变分原理的基态理论,这使得其在应用到激发态过程中存在很多问题,比如无法准确地预测分子和固体体系的光谱和激发态能级等。同时由于到
随着计算能力日渐强大的移动智能设备的广泛普及,一种基于众包思想而衍生出的移动计算范式——移动群智感知,可以协调网络中的移动用户群体通过携带的智能设备进行大规模的数据收集和复杂的任务计算。另一方面,数据交易可以打破数据孤岛,提高数据的流通性和复用性,但它同时也面临数据来源匮乏和多样性欠缺的问题。因此本文利用移动群智感知在数据收集方面的智能性、普适性、低成本等优势构建一种新型的移动群智感知数据交易系统
移动场景下的轻量级客户端不在本地储存完整的区块链,在向全节点查询交易过程中轻量级客户端会泄露与其相关的地址和交易。移动用户可以运行一个轻量级全节点来服务其轻量级客户端,从而保护其轻量级客户端的交易查询隐私,但是轻量级全节点面临区块验证效率降低问题,这会降低区块链的可扩展性。此外,区块链可用于管理移动用户访问公共无线热点的访问凭证,但仍需满足移动用户的条件匿名认证需求,以及降低访问凭证管理中的上链数
以深度学习算法为代表的人工智能算法近些年来飞速发展,在计算机视觉、自然语言处理和竞技游戏等不同的领域,深度学习算法展现的智能已经接近甚至超过了人类的水平。基于通用处理器的传统计算系统已经不能很好地支持深度学习算法的需求,新兴的智能计算系统以其在性能和功耗上的优异表现,成为了深度学习算法的重要物质载体。然而,深度学习算法快速发展,智能芯片也不断推陈出新,这对智能计算系统的通用性提出了极大的挑战。本文