【摘 要】
:
室内场景的三维感知与重建一直以来都是计算机图形学和计算机视觉领域热门的研究课题,而高质量的深度图像的获取是研究、理解和重建室内三维场景几何信息的关键。目前获取室
论文部分内容阅读
室内场景的三维感知与重建一直以来都是计算机图形学和计算机视觉领域热门的研究课题,而高质量的深度图像的获取是研究、理解和重建室内三维场景几何信息的关键。目前获取室内场景深度图像有主动式和被动式两种方式。主动式是指通过消费级RGB-D相机主动扫描来获取物体的深度,但当被采集表面过于光滑、高光、太过纤细以及不在相机采集范围之内时,采集到的深度图像会出现深度数据的缺失。被动式是指通过算法来建立“RGB图像-特征-深度”的映射关系,从而获取对应的深度图像。但当前存在的深度估计算法未充分考虑到RGB图像中隐含的几何信息,导致重建的深度信息精度不高。此外,由于硬件设备所限,无论是主动式获取还是被动式估计得到的深度图像普遍存在着分辨率不高的问题。这会对深度图像的下游应用带来不利影响。本文针对这些存在的问题,对室内深度图像的修复与重建进行了以下几方面的研究:(1)针对当前室内场景RGB-D数据集中的深度图像缺少缺失区域的深度真值进而导致无法将基于学习的策略应用到深度图像补全任务的问题,提出了一个基于随机掩码和“真实-合成”数据联合训练的策略,从而可以将当前大量大规模的RGB-D数据集应用到深度图像补全的任务上。接着,本文在此策略的基础上,提出了一个融合RGB图像特征的多尺度的深度图像补全模型;(2)提出了一个融合法向量和边缘特征信息的深度图像估计模型。该模型通过从RGB图像中提取法向量和边缘特征,并在不同尺度和RGB图像中的原始特征融合,进而提升深度估计的准确度;(3)分别提出了在没有配套RGB图像下的基于适应性权重卷积的深度图像超分辨率模型和在高分辨率RGB图像指导下的深度图像超分辨率模型。实验表明,相较于其他对照方法,本文提出的方法在室内场景深度图像修复与重建方面,准确性和鲁棒性方面均有较大提升。
其他文献
在计算机视觉的模式识别中,目标检测是一个非常具有挑战性并且极具现实意义的的研究方向。多人姿态估计作为计算机视觉领域的一个重要组成部分,也影响着很多其它研究方向,包
近年来,天然气在国民经济中发挥着愈来愈重要的作用,这使得天然气与管道业务快速发展,逐渐构成了全国性的天然气骨干管网。多气源、多用户、管网化的供应格局已经形成。天然
多智能体系统通常是指由大量具有通信连接的智能体所组成的系统。借助相互之间的信息交换系统在整体上可以呈现出单一智能体所不具备的行为。由于在多智能体系统的研究领域,
胃癌的发病率和死亡率都位居各种癌症的前列,是一种世界性的疾病,给很多人的正常生活带来严重影响。胃癌在早期症状不明显,相当多的病例在确诊后已经延误了最好的治疗机会。
在医学图像的三维重建的过程中,结合图像分割算法,一个序列的CT图像会产生多个不同器官的三角形网格,部分器官如骨骼等会含有大量的顶点和三角形面片。运行分割算法和存储大
C2区块位于缅甸中央盆地北部的睡宝次盆内,西部以岛弧带与钦敦盆地相连,东部为分割掸邦高原和中央盆地的Saging走滑断裂,南部以低隆与Pegu-Yoma盆地相隔,面积约为26506km2。睡宝盆地是在中生界基础上发育起来的边缘海弧后叠合盆地,上覆盖层为巨厚的新生界沉积,厚度大于20 km,是主要的油气勘探目的层。目前区块内仅有Sabade-1和AZY-1两口钻井,获得天然气地质发现,勘探程度较低。
随着互联网以不可遏制的速度融入到普通人的生活中以及智能手机、平板等移动手持设备的出现,信息交流的频率和速度不断加快。由于图像所展现出来的信息更加准确、生动,在众多
产品工程变更基本上是无法避开而且肯定会发生的事情,它会在产品的整个生命周期内一直存在,并会让其产品的开发周期变长,开发所需的成本增加。开展这项管理工作,主要的目的并不是为了能够规避变更的出现,而是要有效管控变更过程,增加其解决的速度,降低因为这个原因造成的质量、成本等方面的影响。本文以康明斯中国工厂企业为切入点,探究和讨论企业在产品工程变更管理方面存在的不足之处,研究和分析了其三大难点,即数据和协
在当前大数据和人工智能时代,行人检测的相关研究得到广泛应用,特别是在自动驾驶、视频监控和人员检索等领域。随着摄像机数量的快速增长,获取海量数据变得相对容易,但为每个
语音是人与人之间交流的重要方式,但在现实中语音通常受到噪声的干扰,因此从嘈杂的环境中提取近似纯净的语音成为研究重点。语音增强是语音信号处理的重要领域,用以解决语音