高效融合运动与表观信息的无监督视频目标分割算法研究

来源 :南京信息工程大学 | 被引量 : 0次 | 上传用户:qq382585541
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
无监督视频目标分割的旨在无需引导的情况下自动分离视频帧中的主要前景和背景,并输出像素级的精确分割。无监督视频目标分割在视频编码、场景理解等领域具有重要意义。随着深度学习的兴起,出现了大量基于卷积神经网络的无监督视频目标分割算法,并取得了重大进展和突破,但这些方法仍然受到复杂场景和模型计算代价的限制。本文从运动估计和外观信息出发,探讨了如何构建双流网络来解决上述问题。成果如下:目前流行的无监督视频目标分割方法利用双流网络融合RGB帧和光流,然而,它们无法处理两个输入模态下的干扰噪声,这可能会严重降低模型的性能。本文建立了输入模态之间的对应关系,利用最优结构匹配抑制干扰信号。给定一个视频帧,从RGB图像和光流估计中提取稠密的局部特征,并将其视为两种复杂的结构化表示。然后,利用Wasserstein距离计算将一个模式中的特征传输到另一个模式的全局最小流,每个流的幅度表示两个局部特征之间的对齐程度。为了将最优结构匹配嵌入到一个可以端到端训练的双流网络中,本文将传输代价矩阵分解为多个小的空间块,并设计了一个可微的长短分解Sinkhorn模块,该模块由一个长距离Sinkhorn层和一个短距离Sinkhorn层串联组成,本文将该模块集成到一个双流网络中。本文的实验表明,在DAVIS-16和FBMS数据集上,运动外观的结构对齐可以产生最先进的结果。在上一个工作的基础上,本文进一步探索了外观与运动信息的相关性,研究了算法的轻量化方法,提出了一种基于空洞局部注意机制的无监督视频目标分割算法。网络由双流网络、多头运动引导模块、多尺度外观自增强模块和多尺度渐进融合模块组成。空洞局部注意力机制结合了注意力机制和卷积的优点,在效果和计算复杂度之间取得了平衡。多头运动引导模块利用空洞局部注意机制从运动特征中提取空间信息,得到多组动态卷积核,对外观特征进行卷积,引导外观特征学习高级语义。多尺度外观自增强模块利用空洞局部注意机制提取外观特征的多尺度信息,获得多组动态卷积核,进行卷积以增强外观特征的语义。编码器提取不同阶段的特征,送入多尺度渐进融合模块,将深层特征逐渐融合到浅层特征中,同时保留浅层特征的细节信息,改善目标分割效果。该算法可以进行端到端的训练,模型参数量和计算量较小,推理速度大幅提高,在DAVIS-16和FBMS数据集上优于同期方法,在较难的FBMS数据集上提升了0.5个百分点。
其他文献
大气细颗粒物(PM2.5)化学组成十分复杂,包括水溶性无机离子和吸光性有机碳(又称棕色碳)等,对人体健康和区域气候变化均有重要影响。虽然针对PM2.5的化学组成和来源已有大量研究,但对棕色碳的化学组成、来源及吸光性质的认识依然有限。硝基芳香族化合物作为棕色碳中重要的化学组成,因为测量技术的限制,对其来源和吸光特性的认识依然不清楚。南京是我国大气污染重点治理地区之一,且该地区冬季高湿天气条件是诱导雾
学位
抗生素的过度使用增强了环境中细菌的耐药性,由此产生的抗生素及其耐药菌污染是目前关注较多的环境问题之一。可见光催化技术因能源可利用程度高而备受青睐。钼酸铋(Bi2MoO6)拥有独特的层状结构和相对较窄的带隙宽度,能够吸收可见光。然而,单纯Bi2MoO6的量子效率较低,光利用率不高。采用离子掺杂和半导体复合是改善光催化材料性能的有效途径。本文以溶剂热法合成Bi2MoO6(BMO),利用溴(Br)离子掺
学位
雾霾事件的频发不仅对环境造成严重污染,还威胁着居民的身体健康。而硫酸盐的快速形成是决定我国细颗粒物爆炸性增长和严重雾霾事件频发的关键因素,其形成机制多样且复杂。最近的研究表明,黑碳也是雾霾期间气溶胶粒子中最关键的成分之一,其主要来源是化石燃料和生物质燃烧,可产生多种活性中间体,对硫酸盐的形成具有一定的催化作用。在本研究中,首先收集工业黑碳并制备不同种类的生物质黑碳。采用元素分析仪测定黑碳的碳、氢、
学位
初中地理教学中,教师应重视情境教学的运用,根据课程的实际情况以及学生的学习特点以及进度制定相应的情境教学方案,促使学生将所学的知识与现实生活产生联系,以实现培养学生学科核心素养的目的。为此,本文基于学科核心素养,对初中地理情境教学提出一些实践建议,旨在提升初中地理教学水平,从而帮助学生更好地成长。
期刊
将层次分析法应用到中学地理情境教学效果评价中,构建了中学地理情境教学评价指标体系,对指标重要性进行排序,建立地理情境教学效果评价模型。以某高中地理教师一节公开课为例,进行情境教学效果综合评价,确定该节公开课的评价等级,并揭示中学地理情境教学中存在的问题,从而促进中学地理情境教学的改进和完善。
期刊
胰腺神经内分泌肿瘤是一种严重威胁人类健康的高度异质性肿瘤,其中约70%为非功能性胰腺神经内分泌肿瘤(NF-p NETS)。对于恶性等级较高的NF-p NETS患者,手术切除是临床上最有效的治疗方法;恶性等级较低的患者,药物治疗更加合适。因此,准确分级是NF-p NETS临床精准治疗的关键。目前临床上确定NF-p NETS等级主要基于对单模态影像数据的视觉评估,依赖于临床医生的个人经验和主观观察分析
学位
脑胶质瘤是中枢神经系统最常见、死亡率最高的原发性肿瘤。低级别脑胶质瘤患者的五年生存率和十年生存率分别为70%和50%,中位生存期约为6.5至8年,然而高级别脑胶质瘤患者的中位生存期仅有14个月。由于不同级别的脑胶质瘤患者预后差异极大,医生需要针对不同级别的患者制定相应的诊疗策略。另外,准确地划分出水肿区域、增强肿瘤区域、坏死区域以及非增强肿瘤区域并尽可能的将其切除能极大地提高患者的生存率。本文针对
学位
电池的储能能力使电动汽车参与智能电网调控成为可能,V2G(Vehicle to Grid)技术可利用大规模电动汽车接入电网的充放电来实现电网的削峰填谷、调频等功能。双向功率变换器作为V2G的核心技术,控制电动汽车与电网之间的双向功率流。传统控制方法下缺乏调频、调压能力,无法应对电网运行扰动。本文针对两级式双向AC-DC变换器,对虚拟同步机(Virtual Synchronous Generator
学位
输电线路的参数辨识一直是电力系统调控分析的基础,实现准确而实时的电网线路参数辨识给电网系统的调度分析提供了很大的帮助,并且对电网的安全稳定运行具有重要意义。现有的电网线路参数辨识算法大部分都采用机器学习方法,但是这些机器学习方法存在一些不足的地方。首先,机器学习算法并没有考虑拓扑结构的约束,把各节点作为孤立节点分开考虑,对于全局节点的特征信息关注度不够,导致出现干扰和噪声时,预测的准确率大大降低的
学位
印刷品表面缺陷会极大地降低印刷品质量,同时人工对缺陷的检测非常地耗时,所以高效自动地完成对印刷品表面缺陷的检测对印刷工业生产具有很高的价值。近年来基于深度学习的缺陷检测算法得到了很大的发展,其性能也远远超过传统算法。但是基于深度的检测方式需要大量人工标注的数据进行模型训练,然而在实际生产过程中,产品的次品率非常低,这就导致我们很难采集到足够数量的缺陷正样本进行模型训练。此外,对缺陷正样本的标注十分
学位