基于Mask R-CNN改进的图像实例分割算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:shengyu0128
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像实例分割完成的是像素级的实例目标分割任务,是人工智能与计算机视觉领域的重要发展方向,其被广泛应用到各个领域,如工业生产、监控安防和医疗卫生等。目前的图像实例分割模型主要存在两个问题,第一,传统的图像实例分割模型由于图像中实例对象尺寸差异跨度较大,导致目标检测阶段出现误检、漏检等问题,从而使生成的掩码精度较低。第二,传统的实例分割模型在掩码生成阶段,主要是通过汇聚到全连接层的特征信息对像素点进行分类和归属判定。池化操作会导致特征图尺寸下降,在语义分割阶段,使传递给全连接层的特征信息有所丢失,进而导致像素点的类别归属出现偏差,生成的掩码质量低,实例边缘的细节信息不够精细化。本文在现有的实例分割算法框架Mask R-CNN的基础上进行深入的研究和改进,以解决图像实例分割任务中存在目标实例对象尺寸跨度大、生成的掩码质量低且不完整的问题。本文的主要工作内容如下:(1)为了消除实例对象之间尺寸差异较大的影响,本文设计了一种基于分层多尺度注意力(Hierarchical Multi-Scale Attention,HMSA)的特征提取网络,用于在特征提取过程中融合不同尺度的实例对象的特征信息,以提高实例分割精度。该网络能够学会在特定情况下偏爱哪种尺度,学习相邻尺度集合之间的所有相对attention特征信息。通过该特征提取网络获得的特征矩阵既融合了多尺度特征,又具有偏好特性。(2)为了打破卷积神经网络与全连接层之间的限制,解决验证数据与训练数据宽高比例差异较大的问题。针对原始空间金字塔池化结果不精确的现象,本文提出一种优化的空间金字塔池化方法,使得卷积神经网络能够适应多尺度、不同比例的输入,此外在特征金字塔自上而下的路径中通过反卷积操作进行上采样,将局部特征在横向连接结构的作用下与不同尺度空间的特征进行拼接。(3)在生成掩码阶段,将实例特征与相应的预测掩码结合起来对Mask Io U进行回溯,校正mask得分和掩码质量之间的偏差。具体地说,将掩码生成网络提取到的语义特征与特征提取网络中的实例类别特征进行多级融合,提出了一种对实例分割假设进行评分的新方法,这对于实例分割的评价是十分重要的。为了使整个图像实例分割网络的掩码生成网络与掩码质量评估之间形成有效的反馈,利于掩码生成网络的反向传播,使用掩码质量分数与掩码损失函数相结合对生成的掩码质量进行监督和评估,两者之间形成有效的正反馈,使生成的掩码质量在掩码质量监督网络的作用下更加精细化。
其他文献
随着军事现代化的推进,红外探测设备被广泛应用于装备夜视、目标侦察以及导弹拦截等领域。对红外图像中的弱小目标进行识别有利于扩大设备作用范围、争取有利的作战时机,红外小目标探测逐渐成为战场上的一项关键技术。然而,目前主流的红外小目标检测算法主要针对的是天空背景,在特殊物体出现的复杂背景下算法的虚警率较高;常见的深度学习目标检测算法主要针对的是自然图像,并不适合直接用于检测红外小目标。本文充分地总结了前
在军事领域中,可使用对弹药破片进行跟踪的手段,来对所研究的大阵列雷达目标跟踪结果的精确性加以验证。但采用实弹爆破往往面临着成本过高的问题,所以需要通过计算机仿真的手段建立仿真模型,并通过仿真模型反应出的运动情况对破片的运动模型进行建立,以此实现对飞散破片目标的跟踪。在破片目标跟踪方面,由于破片目标具有密度大、数量多的特点,使得对其跟踪存在极大的困难,因此,研究面向破片目标的跟踪技术有着重要的现实意
随着遥感卫星分辨率的提高,遥感技术在国土资源利用、城市环境监测和自然灾害预报等领域得到了广泛应用。分割是遥感图像应用的一个重要方面,同时也是遥感图像研究的重点和热点之一。一般来说,遥感图像含有大量特征,包括光谱特征、形状特征和纹理特征等,若只用其中一种特征,通常很难获得高精度的分割结果,因此如何合理地利用多种特征来进行遥感图像的分割以获得更好的分割效果是一个值得研究的问题。本文从特征提取、特征选择
高光谱图像具有丰富的光谱信息和空间信息,广泛应用于军事、农业、地质勘测等领域。虽然高光谱图像含有丰富的可用于分类的信息,但也存在信息冗余以及“同物异谱”现象,在标注样本有限的情况下,分类模型很难获得一个较好的分类结果。随着遥感技术飞速发展,可以很轻易获得高光谱图像,但精确的地物标注需要大量的人工,如何充分利用高光谱图像的空谱信息,在标注样本有限的情况下,提高模型特征表征能力和泛化能力,实现高光谱图
推荐系统是工业界和学术界处理信息过载的主要手段,其通过分析用户和所推荐项目间的关系,或利用已有用户历史行为记录,帮助用户从海量数据中寻找可能感兴趣的信息。近几十年,推荐系统技术得到了长足发展,基于协同过滤、机器学习、深度学习的模型均已在现实生活中得到了广泛应用,但这些模型表达能力有限,且每次推荐都是按照固定策略,无法适应时刻变化动态的用户兴趣。其次,这些静态模型将每次推荐视为独立过程,没有考虑用户
传统机载预警雷达的主要功能是目标检测和参数估计,采用较窄的带宽就能完成任务。但在未来的应用中,在检测目标后,机载雷达需要获得高分辨率的目标距离像或ISAR图像,以便实现目标分类和识别,因此需要采用更大的带宽。但是带宽的增加意味着系统的时间/距离分辨能力提高,也会给信号处理带来问题:在空域,信号的孔径渡越时间不再远小于信号的时间分辨率,目标信号和杂波信号在阵元间的距离走动不能忽略;在时域,高速目标信
随着信息技术的不断发展,传统有源雷达面临着低空突防、电磁干扰、隐身飞机和高速反辐射导弹等各方面的挑战。为应对这些威胁,各国研究人员不断探索新体制雷达技术,外辐射源雷达便是其中一种。外辐射源雷达是一种无源雷达,本身不具备信号发射装置,依靠非合作辐射源进行被动探测,其系统较隐蔽,不易被敌方摧毁。早期的外辐射源雷达通过FPGA和DSP芯片来搭建信号处理系统,但该方法采用的DSP开发板较多,因此硬件平台较
主瓣干扰给雷达探测带来了严峻的挑战,有效抗主瓣干扰是目前亟需解决的问题。基于数字射频存储器(DRFM)技术的间歇采样转发干扰是一种常见的主瓣欺骗干扰样式,其通过对雷达信号进行低速率的间歇采样转发,使得干扰信号在时域、频域和空域特征上与真实目标回波信号高度相似。传统雷达难以在保留目标信号的同时鉴别和抑制干扰,从而对雷达的目标探测和跟踪构成了严重的威胁。基于上述背景,本文从抗主瓣干扰的角度出发,重点研
点集配准是图像处理和计算机视觉领域中的一个热点和重点方向,在医学图像分析、目标识别与跟踪等方面都有重要的应用价值。点集配准的目标是恢复从模板点集到目标点集的空间变换,使两点集对齐。过程主要分为两步,即确定对应关系和求解空间变换。二者互为前提,交替迭代,直至完成配准任务。由于点集中非刚性形变、噪声、离群点、旋转等干扰因素的存在,导致点集配准算法的精度和效率均受到一定制约。本文以概率模型匹配方法作为基
由海表面的后向散射作用形成的海杂波严重干扰雷达对目标的检测,海面弱目标常常被海杂波所淹没。为了提升雷达对于海面弱目标检测的能力,本文基于某岸基雷达的X波段实测海杂波数据,分析了海杂波的特性,并对海面弱目标检测算法进行了研究。本文主要研究工作为:1、利用实测海杂波数据对海杂波物理散射特性、统计特性、时频特性以及时空相关性进行分析。首先通过分析海杂波的成因,得出海杂波的物理散射模型由布拉格散射、突发散