基于卷积神经网络的立体匹配算法研究

来源 :长春理工大学 | 被引量 : 0次 | 上传用户:cc51wang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
双目立体视觉在获取场景深度信息上具备着易扩展、低成本和场景适应性强的特点,因此被广泛应用于无人驾驶、增强现实等众多前沿领域。近年来,基于深度学习的方法己经扩展到立体匹配等问题中。与传统的方法相比,基于卷积神经网络的方法能够显著提升立体匹配的准确性和运行效率。本文算法从以下两个方面来解决当前双目立体匹配工作存在的问题。(1)针对立体匹配算法在弱纹理区域匹配精度低的问题,本文通过将特征金字塔与空洞卷积融合,设计了一个基于多尺度特征提取的立体匹配算法FPD-Net。特征金字塔和空洞卷积的融合可以在实现多尺度特征提取的同时,增大高层特征的感受野,获得更多的全局特征,而且还可以有效的降低小尺寸物体细节信息的丢失。其次,为了加快立体匹配的运算速度,将Patch Match的思想引入到了算法当中,通过对特征图的修剪,去除不太可能的匹配区域,获得了稀疏的代价量,大大降低了算法的计算量以及内存的占用量。本文设计的算法与同样是多尺度特征提取的PSMNet相比,本文算法在提高立体匹配精度的同时也加快了算法的速度,性能优于PSMNet。(2)针对目前端到端的立体匹配算法在复杂场景下出现的误匹配问题,本文提出一种基于多尺度注意力特征融合的立体匹配算法AFPD-Net。通过将兼顾空间信息与通道信息的注意力机制与改进后的特征金字塔相融合,算法在特征提取阶段加强感兴趣区域的提取强度,并且抑制无用噪声,捕获丰富的全局上下文信息和长范围依赖,提高了特征的多样性,降低算法在病态区域的误匹配率,使得算法可以面对复杂场景的挑战。其次,为了降低模型的复杂度,较少算法的运算量,将网络中的非线性激活函数替换成了一种可以自适应激活的非线性函数,它可以自适应的学习激活与否,从而提高网络的泛化能力。本文通过在Scene Flow、KITTI2015以及KITTI2012三个公开的双目视觉数据集上对本文算法的有效性进行验证。因为PSM-Net算法与本文提出的FPD-Net算法在结构上十分相似,所以将这两个算法进行了对比。实验表明,本文所提FPD-Net算法在精度超出PSM-Net算法的同时,运算速度也获得了一定的提升。由于AFPD-Net算法是在FPD-Net算法上做出的改进,所以同样将这两个算法进行了对比。实验表明,改进后的算法在病态区域的匹配精度要明显高于FPD-Net算法。
其他文献
随着科学技术的进步与发展,移动机器人等行业应用领域也越来越宽泛。在复杂任务场景中,移动机器人可以完成复杂的路径规划与环境探索,同时也大大降低了人力成本的消耗。伴随着新冠肺炎的爆发,更需要减少人与人的密切接触,因此移动机器人在人们的日常生活中可以发挥巨大的作用。移动机器人需要在未知环境下构建地图和能在构建的地图获得自己的相对位置,因此同时定位与地图构建(Simultaneous Localizati
学位
作为一种新兴生物识别技术,步态识别依靠行人的生理特征和行为特征完成个体识别。相比其他生物识别技术来说,步态识别可以在数十米乃至百米距离识别出人的身份信息,因此在安防、医疗和体育等领域具有广泛经济价值和应用前景。目前,基于视频流的步态识别以突出的优势和广泛的应用前景深受学者们青睐,但是目前对步态识别研究大多停留在算法仿真阶段,只有少数学者在CPU或嵌入式平台上实现了步态识别系统,随着模式识别技术对硬
学位
中国市场作为最有潜力的奢侈品消费新兴市场,销售收入占全球的比重超过三分之一。同时中国消费者也是受数字化影响最大的群体之一,由于奢侈品的独特性、排他性和昂贵的价格,中国奢侈品消费者普遍通过“线上调查研究,线下购买产品”的多渠道购物方式,也称“反展厅行为”,国外奢侈品品牌为满足消费者对渠道的特殊需求,从而留住消费者,因此探讨中国奢侈品消费者反展厅行为的影响因素具有必要性。本文在系统地总结以往优秀学者相
学位
光电稳瞄平台作为一种集光学、精密机械、伺服控制、图像采集与处理等为一体的先进设备,能对载体扰动有效隔离,保证光学探测设备的视轴保持在相对惯性空间的稳定指向。因其能够搭载不同功能的光电探测设备,而被广泛应用于军、民等多种领域,实现对目标侦察、测绘、定位与远程打击等任务。平台工作时会受到来自内部、外部等不同因素的干扰,这些干扰会对光学载荷的最终成像效果产生影响,严重时会导致所搭载的光电探测设备无法正常
学位
原子力显微镜(Atomic Force Microscope,AFM)可以将微观世界难以直接观测的结构信息以图像的形式展现出来,是探索微观世界的重要科研工具。目前,AFM扫描技术向着更精确、更快速、更稳定的方向迅猛发展,其控制精度直接影响着AFM的扫描后的成像效果。现代商业AFM系统中通常使用传统比例积分微分控制方法(PID)作为控制策略。但是,传统PID控制器存在参数整定困难的问题,难以找到最优
学位
现今国际国内经济环境愈加复杂,支撑中国经济可持续发展的要素条件正在发生深刻变化。随着国际投资活动的广泛发展,国内企业逐步摆脱了以往仅依靠市场和资源的传统模式,开始以技术进步为导向进行对外投资活动。虽然自主研发仍然是我国企业技术创新的主要方式,但通过OFDI活动获得的逆向技术溢出也是跨国企业技术创新的重要途径。在“逆全球化”趋势明显的今天,深入研究OFDI逆向技术溢出效应对提高未来企业技术创新水平非
学位
活体人脸防伪识别是人脸识别系统的安全保障,而目前活体人脸防伪技术面临着严峻的挑战,主要有:对光照变化敏感和对攻击类型的鲁棒性表现不佳。随着深度学习的快速发展,深度学习因其出色的特征表达能力已经成为了当前活体人脸防伪研究的主流方法,但其存在以下三个问题:第一,现有深度监督网络的人脸防伪模型大多忽略了多帧间的时间运动信息;第二,网络对防伪线索的表征忽略了梯度级信息;第三,网络对不同层级提取的特征缺乏选
学位
随着人们环境保护意识的增强以及对印刷质量要求的不断提高,柔性版印刷已然成为全球范围内增长速度最快的印刷方式。半色调加网技术作为柔印制版过程中的一项关键技术,虽然经过多年发展,但是在单一调幅、调频加网技术中依旧存在莫尔条纹、网点丢失等问题。因此,本文对混合半色调加网算法进行深入研究,以达到为柔印制版机提供高清网点图像的目的。主要研究内容如下:基于阶调的混合半色调加网算法研究。目前常用的混合半色调加网
学位
近年来,能源危机和环境问题引起了世界各国的广泛关注,能源供需的不稳定性因素增加,石油等化石燃料价格普遍上涨。在物流业,由于电子商务的快速发展,城市货物量增长迅速,物流运输中使用传统化石燃料汽车进行配送所带来的环境污染和运输成本上涨问题愈发突出。运输作为物流的关键环节,其是否低碳清洁对行业发展具有重要意义。新能源汽车相比传统燃油汽车具有绿色低碳、运输成本低等优势,因此在企业中得到不断推广应用。在此情
学位
随着遥感成像技术的快速发展,遥感图像分辨率越来越高,数据量越发庞大,图像信息越发丰富,使用传统图像处理算法或经典机器学习算法判读飞机目标的方式已无法保障算法实时性和正确性,因此,如何快速、准确地在大幅面复杂遥感影像中实现飞机目标的识别和定位,成为当前遥感飞机目标检测领域亟待解决的难题。本文以卷积神经网络(Convolutional Neural Network,CNN)为基础架构,开展遥感影像飞机
学位