基于深度学习的立体匹配网络研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:haoxiaoye
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
立体匹配技术一直是计算机视觉领域中的重要研究方向,不仅在理论方面有广泛的研究价值,在人脸识别、虚拟现实、无人驾驶等实际应用方面也具有很大的探索价值。立体匹配技术最大的困难在于复杂多变的环境,当遇到低纹理、重复区域时匹配难度比较高,所以匹配算法性能需要进一步提高来满足应用场景的需求。本文针对基于卷积神经网络的立体匹配算法展开分析和研究,主要的工作和创新点如下:1)为了提高基于双目视觉中立体匹配在弱纹理场景下的精准性,提出了一种基于注意力机制的立体匹配算法。首先,在CNN特征提取阶段,加入图像注意力机制模块和通道注意力机制模块,获取特征图中各个通道、各个像素点的联系,使网络更好地捕获图像上下文信息,进而对于弱纹理区域的重建更加精确。其次,针对网络损失函数集成了语义编码损失,最终损失函数为语义编码损失和重建损失的加权和,有效提升了在弱纹理区域下的重建精度。使用KITTI2012、KITTI 2015和Sceneflow数据集对算法进行验证,实验结果证明,相比基准算法,本算法在精度方面有较大提升,尤其体现在弱纹理区域,在误差不超过3个像素点的判断标准下超过基准算法4.69%。2)为了提升在无监督学习中立体匹配和光流预测的精确度,提出了一种基于跨模态循环损失的网络框架。目前大多数基于神经网络的立体匹配和光流估计方法都需要大量的真实数据,而获取深度真值一直是立体匹配的难点,所以越来越多的人开始研究无监督学习在立体匹配中的应用。基于光流和视差之间关系紧密,是对同一组图片数据的不同描述,对于这种跨模态的形式,本章设计了一个同时训练光流和深度的网络,在损失函数中引入跨模态循环损失,为光流与深度的协作训练添加了额外限制。最终损失函数为左右一致性损失、前向反向一致性损失、平滑损失和跨模态循环损失的加权和。实验结果证明,本文算法在精度方面有较大提升,在KITTI、NYU-Depth-v2、Cityscapes数据集上都进行了验证,表明与经典的无监督方法相比,该模型更具优势。在KITTI的测试集上相比于基准算法DFNet,本算法准确率提升1.52%。3)为了验证所提出方法在实际应用中的效果,构建了一套基于双目视觉的立体匹配系统,对两种方法进行了实验,一种是运用传统方法,完成了摄像机双目标定、极线校正、图像预处理、立体匹配等步骤。另一种运用本文所提出的基于卷积神经网络的立体匹配算法。构建的系统分为两个模块:数据采集模块和数据处理模块,其优势在于性能高、速度快、成本低、可靠性好并能有效满足系统需求。实验结果表明本文提出的算法可以获得效果较好的立体匹配结果。
其他文献
滚动轴承作为机械装备中的关键零部件之一,其运行状态直接影响机械装备的安全性和稳定性。然而实际工程中滚动轴承工作环境恶劣,工况多变,轴承易出现性能退化。若未能准确表征并预测滚动轴承退化趋势,轻则影响机械装备运行,重则导致人员安全事故。因此,研究准确表征并预测轴承性能退化趋势兹事体大。随着机械装备监测大数据时代来临,基于数据驱动预测方法蔚然成风,本文从数据驱动角度出发,以滚动轴承为研究对象,着重围绕滚
学位
随着机器嗅觉技术在生产生活中各个领域的广泛应用,包括模式识别、数据挖掘或是深度学习技术,应用在工业、医疗、环境、食品安全等各个方面,并随着学者们对算法研究的进一步深入,对气味信息的数据提取方法越来越成熟,因此对数据集的处理方式也更加趋于精准度更高、时间复杂度更低。本文在机器嗅觉算法对气体气味信息特征处理的基础上,创新性的使用优化算法,建立了空气质量预测模型与葡萄酒挥发性气味评价模型,从而对空气质量
学位
功耗评估是功耗优化的基础。近年来,功耗已经成为制约处理器性能的重要因素,功耗评估的意义更加明显。结构级功耗评估方法是一种在设计早期阶段广泛使用的方法,但是目前常见的结构级功耗评估工具,没有考虑在宽电压范围内,电压变化对处理器工作频率的影响。因此,优化处理器在宽电压范围内的功耗评估方法对处理器的设计有重大的意义。目前处理器在宽电压下的结构级功耗评估方法有两个比较大的优化方向:结构级功耗评估工具的输入
学位
显示技术的发展可分为三代,第一代为阴极射线管显示技术CRT,第二代为液晶显示技术LCD,第三代为有机发光二级体OLED,如今,从OLED屏幕演化而来的有源发光二极管AMOLED被广泛使用,而AMOLED屏需要双轨电源同时进行供电,提高电源性能具有重要意义。本文针对微AMOLED屏驱动要求,确定了影响显示性能的关键参数和改进电源芯片性能的方法。微AMOLED屏主要应用于便携式设备中,正电压VOP直接
学位
全球化采购方式推动了产品与资金之间的自由流动,并使得供应链网络更加复杂化,按照牛鞭效应理论,当供应链的任何一个节点发生了问题都会使下游损失变大,并沿着链条迅速扩散,最后给整条供应链带来了重大风险。近年来由于供应链中的不确定因素越来越多,不论是由于天灾、政治影响、重大公共卫生事件等外部环境中不确定因素的增多,又或是产品质量、产能不足等企业内部环境中不确定因素的增多,都导致供应中断风险发生的频率不断增
学位
H公司是一家通讯硬件设施的高新技术企业。公司涉足多个高科技领域,内部的芯片开发部门HS更是一个纯研发的组织。作为一家高新技术企业,那么大量具有各种丰富知识的员工是企业中最具决定性的生产要素,是企业保持核心竞争力、得到持续发展的主要力量。对其进行绩效考评,是提高员工绩效和组织绩效的重要途径。随着技术发展的日新月异,商场竞争的加剧,甚至于国际形势、贸易摩擦的影响,公司的战略目标,战略规划产生了很大的调
学位
随着全球信息化的迅猛发展,物联网、5G通讯、大数据等对通信系统的性能要求越来越高,大容量、高速光通信网络已是大势所趋。作为光通信系统中使用最为广泛的调制器件,马赫曾德尔调制器具有无法替代的地位。马赫曾德尔调制器是一种电光调制器,通过改变电场可以实现输出光场折射率、相位和振幅的调控,而改变调制器的直流偏置点可以使得调制器工作在不同工作状态下,从而满足不同光通信系统的需求,但由于外界环境变化、器件老化
学位
随着居民个人财富的不断累积,个人理财业务越来越受重视。传统的银行业理财产品营销模式存在高度标准化、忽略个性化需求等问题,难以满足用户的个性化需求且难以拓展新用户。银行需要充分利用自己优势,运用大数据思维、借助数据分析的力量为用户提供更为精细化的理财产品服务。因此,本文通过对银行理财产品个性化推荐进行需求分析,设计并实现了基于群体用户画像的手机银行理财产品个性化推荐系统。本文的主要工作如下:(1)提
学位
我国面临高离婚率的社会现状,为防止轻率离婚,《中华人民共和国民法典(草案)》第一千零七十七条增设登记离婚冷静期规定。登记离婚冷静期是指在离婚自由基础之上,双方当事人向婚姻登记机关申请登记离婚,自婚姻登记机关收到离婚登记申请之日起三十日内,任何一方当事人均可撤回离婚登记申请的思考冷静期间。理论和实务界不乏反对设立登记离婚冷静期的声音,但设立登记离婚冷静期有其合理之处。通过考察其他国家和地区登记离婚冷
学位
本论文为《后长寿时代:健康百岁背后的基因秘密》(节选)的英汉翻译实践报告。在翻译过程中,笔者发现原文中出现大量指代词和衔接词,对于原文的理解造成了一定的困难。因而笔者从语篇衔接与连贯理论角度出发,详细分析了保健类文本翻译实践过程中的典型案例,对翻译中遇到的问题、难点进行分析,探讨此类文本的翻译方法和技巧。本报告由四部分组成:首先简要介绍翻译项目的背景,包括项目的来源、文本的语言和风格特点,以及社科
学位