基于深度信息的室内场景分割算法研究

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:songzilang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
室内场景语义分割是图像处理领域的一个重要研究方向,在智能安防、虚拟现实等领域有着广泛的应用前景。随着Kinect等深度传感器技术的成熟应用,基于RGB-D图像的语义分割受到海内外学者的广泛关注和深入研究。相较于传统的RGB图像语义分割,RGB-D图像中的深度图可用于解析和提取目标在三维空间中的位置和姿态信息,有效改善颜色和纹理特征易受复杂环境干扰的问题。然而RGB-D图像中深度数据的处理较为复杂,如何将深度图中的空间信息有效地应用到算法环节或模型结构中是研究的重点之一。针对室内场景下的RGB-D图像语义分割,本文主要工作如下:
  第一,提出了一种基于密度聚类的语义分割算法。首先,通过引入深度图中物体的空间位置信息作为S-DBSCAN算法的相似度度量,使生成的超像素边缘更接近物体在三维空间中的真实轮廓;其次,通过构建超像素平面在空间中的位置和法向量关系进行区域融合,使生成的候选区域具有更丰富的区域级语义特征;最后,通过提取目标区域的姿态、尺寸、颜色和梯度共四类区域级特征并分析比较AdaBoost和随机森林两种特征分类器,使算法实现高精度的区域分类。实验表明,该算法的语义分割精度领先于多数传统语义分割算法。
  第二,提出了一种基于通道注意力机制的RGB-D图像语义分割网络模型。首先,通过设计结合通道注意力机制的编码器结构和解码器结构,使得网络在训练过程中能够自适应地学习和调整特征通道间的权重参数;其次,通过采用focal loss损失函数加强网络对难分样本的学习,使得多类分割任务中的样本不均衡问题得到缓解。实验表明,提出的注意力机制结构和focal loss损失函数能够有效提升网络精度,实验结果达到领先水平。
  第三,提出了一种基于条件随机场的分割后处理算法。首先,通过在条件随机场二阶势能函数中加入像素点在空间中的位置和法向量信息,使得改进的随机场概率图模型更契合物体在三维坐标系下的真实形状;其次,通过设计的标注信息反馈机制,使得细化后的语义标注能够指导超像素过分割环节。实验表明,经过后处理的语义标注准确率提升显著,且分割图视觉效果更好。
其他文献
随着大数据时代的来临,多源信息融合已经发展成为信息决策系统的关键技术之一。然而,由于传感器设备的物理局限性、系统运行的不确定性,甚至是环境的未知动态干扰等问题,导致多粒度信息融合问题日益成为信息融合研究的一大挑战。针对信息融合的理论研究是解决多粒度信息融合问题的有效途径,本文以DSmT(Dezert-Smarandache Theory)为理论框架,以穿戴式人体传感器网络(WBSNs,Wearab
学位
时间序列数据广泛存在于各个应用领域,其预测一直是研究的热点问题。时间序列预测方法的核心就是从数据序列中挖掘出变化规律,并对将来的数据做出估计。随着数据挖掘和机器学习方法的迅速发展,时间序列的预测方法也越来越多,越来越先进。然而每一组时间序列数据都有其独特的变化规律,因此预测方法不具有通用性。针对每类时间序列数据集的特点采用相应的数据处理和预测方法,可以提高预测精度。风速和辐照度时间序列是新能源领域
学位
贝叶斯网络作为一种经典的机器学习算法,具有直观的模型,计算简便,被逐渐应用于数据挖掘的研究中。从贝叶斯网络学习的方向来看,分为结构学习和参数学习,本文主要针对后者进行研究。从学习的目的性来看,分为生成学习和判别学习。在实际分类过程中,由于生成学习与分类目标不一致,导致分类精度下降。为了解决分类精度下降的问题,近年来对判别学习的研究逐渐增加。但判别学习的计算过程较为复杂,处理复杂贝叶斯网络时学习效率
四旋翼无人机因其结构轻巧,造价低廉,灵活性高等优点,已经在国防、商业和农业领域有所应用。为了进一步推广四旋翼无人机的应用,使其更加可靠地给人们的生活带来便利,如何设计高效的路径规划算法和提高轨迹跟踪的精确性是需要重点考虑的两个核心问题。因此本文将从这个角度切入,着重研究了四旋翼无人机动力学模型的建立、基于RRT的路径规划算法、基于干扰观测器补偿的反步轨迹跟踪控制、基于范数优化的迭代学习控制方法。论
学位
图像超分辨率(Super Resolution,SR)是指通过算法提升图像分辨率以突破硬件限制的技术,具有良好的应用前景。近年来,压缩感知和稀疏表示理论在图像去噪,图像重建,图像压缩等领域取得了广泛关注,基于稀疏表示的SR技术相较于传统基于重建等方法具有重建质量高,鲁棒性强等优势。针对上述背景,本文对基于稀疏表示的图像SR重建关键技术展开研究,主要工作及创新点如下:首先,本文阐述了稀疏表示理论基础
学位
数字图像篡改盲取证算法,凭借其不依赖于任何先验信息,仅根据图像本身的信息对图像进行真实性、完整性检测,成为图像取证领域主要研究方向之一。篡改图像由于篡改场景各式各样,篡改对象五花八门,篡改区域没有固定的形状、纹理等特征,因此图像篡改盲取证的难度较大。而现有数字图像盲取证算法大多采用基于图像块训练的方式,效率低下,检测方式固化且对于篡改区域定位问题没有很好解决。因此,本文从语义分割角度出发,将篡改图
学位
近年来,基于深度信念网络(DBN)的滚动轴承故障诊断方法逐渐成为研究热点。然而目前大部分基于深度学习的算法都是采用公式计算特征后再输入到DBN中,需要运用大量的信号处理方法,步骤繁琐、计算复杂;深度模型超参数的选择往往依赖于人工,不能自适应控制模型的建立。针对上述问题,本文提出三种基于深度学习的滚动轴承故障诊断方法,有效降低了计算复杂度,提高了故障诊断精度,具有重要的理论意义和应用价值。本文主要工
学位
无人直升机(UMH)在民事和军事上具有广泛的应用前景,目前在国内外均成为热门的研究领域。飞行控制系统是实现无人直升机自主飞行功能的核心部件,在飞行控制系统研发过程中需要通过硬件在回路的实时仿真试验对飞行控制律、机载飞行控制计算机的硬件接口和软件的状态进行验证。本文基于主从式结构的集成式仿真系统硬件平台,对飞行控制实时仿真系统软件设计的关键技术进行研究,旨在为对象无人直升机的飞行控制系统实现简洁高效
学位
近年来,无人机作为现代战争的新兴力量,在空战中的作用越来越显著,受到了各大军事强国的广泛关注。无人机空战自主决策作为无人机技术的一部分,是提升无人机自主性的关键技术,引起了国内外众多学者的极大兴趣。但是,随着军事科技的不断发展,空战环境日渐复杂,想要在复杂环境下占据空战主动权,必须准确洞察敌方无人机的战术意图。本文在复杂环境中的无人机空战背景下,对基于意图预测的多无人机协同攻防智能决策进行了研究。
学位
近年来,地面无人车在大型设施的巡检领域越来越受到重视。在巡检过程中,需要地面无人车对自身的位姿进行准确估计以确保作业安全、高效完成。室外巡检无人车通常采用的导航手段为利用卫星、里程计与惯性传感器融合进行状态估计,工厂巡检无人车通常采用的导航手段为利用激光雷达或者视觉传感器通过同步定位与构图(Simultaneous Localization and Mapping,SLAM)技术进行状态估计。在使
学位