【摘 要】
:
基于图像的三维重建是计算机视觉领域的一个重要研究方向,而多视图立体视觉作为其中最为高效鲁棒的方法,得到了非常广泛的研究。传统的多视图立体视觉通常可以重建出精度较高的模型,但是依赖于手工设计的特征描述子与代价函数,这难度较大并且处理效率通常不高。最近,一些基于深度学习的多视图立体视觉方法也展现出可以与传统方法相比较的重建质量。但是由于模型的复杂性,目前这些方法生成较低分辨率深度图的同时占用大量的显存
论文部分内容阅读
基于图像的三维重建是计算机视觉领域的一个重要研究方向,而多视图立体视觉作为其中最为高效鲁棒的方法,得到了非常广泛的研究。传统的多视图立体视觉通常可以重建出精度较高的模型,但是依赖于手工设计的特征描述子与代价函数,这难度较大并且处理效率通常不高。最近,一些基于深度学习的多视图立体视觉方法也展现出可以与传统方法相比较的重建质量。但是由于模型的复杂性,目前这些方法生成较低分辨率深度图的同时占用大量的显存,并且处理速度可以进一步提升。针对上述提到的主要问题,设计了迭代式的深度图预测网络,以由粗到精的方式迭代地预测出高分辨率的深度图。预测过程采用基于三维代价体的管道,首先将特征图进行可微单应性变换以构建代价体,随后使用三维卷积对代价体进行正则化并进一步预测出深度图。迭代过程中使用所设计的深度图膨胀网络对粗糙深度图进行保留边缘细节的升采样以用于下一轮迭代。此外,设计了适用于迭代网络结构的多级多尺度特征提取在不损失空间信息的同时来提取不同分辨率的特征图。该迭代式的深度图预测网络在生成高分辨率深度图的同时,可以提升重建效率,即降低模型的显存占用与减少处理时间。最后,在为所有视角生成深度图之后,采用高效的过滤策略与融合策略生成统一的稠密点云作为重建结果,用于实验与评估。在大型公开多视图立体视觉数据集DTU上进行了训练与实验,并和其他传统或深度学习的多视图立体视觉方法进行对比,实验结果表明,所设计的方法相较于R-MVSNet,模型占用显存降低了60%,处理速度提升了5倍,较大地提升了重建效率。并且可以保持较好的重建质量,具有较好的视觉效果。
其他文献
RISC-Ⅴ指令集的出现给碎片化的智能驾驶辅助系统(ADAS)开发带来了更多的机遇与挑战,目标跟踪技术作为ADAS关键技术拥有大量的嵌入式应用场景。然而,当前主流目标跟踪算法——核相关滤波算法(KCF),在智能辅助驾驶场景依然无法很好地解决遮挡情况与多目标跟踪等问题。同时,目标跟踪算法在RISC-Ⅴ指令集上的移植与评测研究也较少。针对现有研究的不足,提出面向辅助驾驶的判别类目标跟踪算法评测与优化方
大数据时代下,移动互联网发展与移动终端的普及形成了海量移动对象轨迹数据。通过数据挖掘,运营商可以为用户提供更优质的出行服务,但轨迹数据具有高度敏感性,通过轨迹数据,攻击者可以了解用户的生活习惯,宗教信仰,健康状况等敏感信息。这些敏感信息极易损害用户的个人名誉、身心健康,危害用户的切身利益。因此,如何让轨迹数据发布后不泄露个人隐私,又能满足运营商的数据挖掘需求,为用户提供更优质的生活服务成为当前丞待
终身学习能够为不断增多的复杂任务提供合适的学习模型,绝大部分的终身学习方法都是为了解决灾难性遗忘的难题(即随着复杂任务数量不断增多,用新任务的数据信息训练模型会干扰到先前任务学习到的知识),其中一种名叫少遗忘学习方法(Learning Without Forgetting,LWF),通过知识蒸馏使得模型在学习新任务时限制参数相对于旧的任务的变化,但是,该方法复习旧的任务和学习新任务会存在不彻底的问
随着信息技术的快速发展,数字化办公加速普及。传统的纸质公文渐渐成为现代办公效率的瓶颈,电子公文成为了传统公文在数字化时代的替代物,其相关研究、应用和规范日益增多。为保障电子公文实际使用中的安全性和效率,对电子公文交换系统进行研究十分有必要。首先根据电子公文应当具有的实时可用性、真实性、安全性、权威性等特性,对系统的功能需求和非功能需求进行分析。接着对系统进行详细设计,结合无证书签名方案以保障电子公
近年来,中国的高速铁路蓬勃发展,在世界上名列前茅,通过高速铁路出行也已经成为百姓习以为常一种出行方式。为了提高高速列车上的服务质量,让人民能够享受一个现代化、高科技化的旅途,本课题将以深度学习为基础的计算机视觉技术等和高速列车结合起来,致力于为乘务员和乘客提供更好的科技体验。本课题致力于旅客服务之一的行李服务,致力于解决列车上行李误拿、行李漏拿等问题。为了实现智能化的行李服务,本课题采用了基于YO
随着社会的发展,环境污染、生活习惯、流感病毒等种种因素使得呼吸疾病的发病人群日益年轻化,由呼吸疾病引发的死亡率在城市中死亡率占据第三位,在农村中甚至占据首位。每个人的呼吸特征基本相同,呼吸的普适性是人们得以对其进行研究的基础。监测呼吸能为健康监测提供很有参考价值的数据,使医生能更有效地诊断病情,咳嗽作为一种特定的呼吸特征,对各种病情的诊断有很高的参考意义,当前的研究大多结合语音识别领域中的常用的端
随着国内经济水平的快速发展,人民的生活水平不断上升,各类企业的生产规模不断扩大,社会各处对电能的需求量也越来越大,同时电力系统的管理与调度也面临新的挑战。负荷预测是实现电力系统的管理与调度的基础性工作,潮流优化也是其中的重要一环。因此实现对未来负荷分布和大小的准确预测与实现潮流的最优化对电力系统的管理与调度具有重要意义。为了实现准确的时空负荷预测,提出了一种基于图神经网络与循环神经网络的时空负荷预
在计算存储分离数据库中,数据库的输入输出(Input/Output,IO)瓶颈转向计算节点与存储节点之间的网络IO和存储节点的磁盘IO。缓存技术用来平衡CPU与IO之间的处理速度鸿沟。由于不同负载对缓存的需求不同,一成不变的缓存配置在不同负载下会存在影响性能和浪费资源的问题,因此需要根据不同负载对计算存储分离数据库中各节点的缓存进行参数配置,从而在合理利用资源的基础上提升节点提供服务的能力。通过对
随着视频数据量的爆炸式增长,通过深度学习算法进行视频的分析渐渐变成了热门方向。本课题基于云服务构建了一套监控视频的分析系统。对视频分析的核心算法的处理主要有两个步骤。首先针对模型训练阶段,其中很多步骤需要人工干预,同时依赖专家经验。而自动机器学习可以使这些步骤自动的完成,同时得到性能良好的模型。本课题基于NNI的自动机器学习工具进行模型的自动超参数调优,同时在模型的推理阶段,基于Triton In
随着航天技术和计算机技术的发展,遥感技术实现了蓬勃发展的趋势,怎么样对海量的遥感图像进行处理并且从中获取有效的信息,已经成为遥感领域的核心问题。在遥感领域中,对遥感图像的有效地物分割是遥感技术研究的基础,也是领域中的热点问题,因此从遥感图像中得到有效地物分割结果图是遥感技术发展的重中之重。基于深度学习的地物分割方法能够提取遥感图片中定位信息和语义信息,从而对遥感图片实现端到端的地物分割。采用深度学