基于改进卷积神经网络的光流预测算法研究

来源 :青岛科技大学 | 被引量 : 0次 | 上传用户:liuyuanshuai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
光流是目前运动图像分析的重要方法和工具,现已发展成为计算机视觉领域的一个重要分支。光流所表示的是空间运动物体,在观察参考平面上像素的运动状态。光流预测算法是利用图像序列中相邻两帧之间的相关性和对应关系,来找到对应像素在时间和空间上的变化,以此计算相邻两帧间目标对象运动状态的方法。光流表达了图像像素的变化,由于它包含了目标运动的信息,因此可被观察者用来确定目标的运动情况。研究光流场的目的就是为了从图像序列中近似得到不能直接得到的运动场。因此对光流信息的研究在图像处理领域有着重要的理论价值。基于变分能量模型的预测方法和基于块匹配的启发式方法是光流预测中最主流的传统预测方法,而这些方法对图像的适应性有限,缺乏泛化性,效率低且操作和计算上较为复杂,不利于复杂图像数据光流的提取。而使用卷积神经网络(Convolutional Neural Network,CNN)可以避免人工构造特征所导致计算繁琐且适应性差的问题,通过海量数据自适应学习所需特征,能够更好得提取数据深层信息,且对不同类型图像数据有着较强的适应性。但由于图像光流预测中存在许多复杂问题,例如遮挡、大位移导致目标搜索丢失以及图像细节特征提取不精确,其采用传统结构的卷积神经网络并不能妥善解决这些问题。因此本文为了针对性解决上述复杂问题,并兼顾算法的普适性,对卷积网络解决光流预测问题进行了研究,主要包括以下工作:(1)深入分析研究光流预测方法特征提取过程及其原理,为了针对性解决光流预测中存在的大位移和图像细节问题,对现有卷积神经网络的特征提取部分进行改进。特征提取部分主要由多个卷积层构成,本文将网络的第一层改为由适应调整能力更强的可形变卷积(Deformable Convolution)与可形变池化(Deformable Pooling)组成的卷积层,提高了网络在图像自适应优化方面的能力,利于捕捉运动轮廓的细节,同时,对帧之间像素大小位移有更强的适应性,尤其是大位移情况下可以提供更大的感受野来捕捉像素的运动。实验证明,采用可形变卷积层的网络能够更好地提取相邻帧的图像细节特征,同时提高对大位移的捕获能力。(2)应对遮挡问题提高光流预测网络的预测能力,关键在于从深层次空间特征中计算相邻两帧的相关性,同时基于光流预测网络的流程特性,本文从卷积神经网络的特征融合部分入手,改进现有基于卷积神经网络的光流预测模型常用的匹配融合机制,引入基于注意力机制的特征关联层。将相邻两帧的深层次特征逐通道叠加后进行通道维度上的重构,最大限度保留有效图像空间特征的同时计算两部分特征的关联性,以便后续的反卷积操作能够更好的预测出精确、清晰的光流。实验表明,上述算法不仅有效提高了光流预测的清晰度,同时较大程度的改善了遮挡问题。(3)在上述针对性解决光流预测的遮挡、大位移以及图像细节呈现等问题的同时,为了保证算法的普适性,又引入了循环优化和网络堆栈策略。其主要原理是将几个结构、特点不同的网络级联在一起形成一个网络堆栈,使各个子网络输出的光流经过多个网络循环优化再组合在一起,起到提高光流预测精度的效果。本文的网络堆栈设置了三种结构和内部模块均不同的子网络,从而使网络可以结合不同子网络的优点和特性,输出最终的优化结果。(4)为了验证本文算法的合理性和优越性,将所提出的基于卷积神经网络的光流预测算法在通用数据集Flying Chairs和Mpi Sintel上进行训练和实验,并与当前主流的光流算法进行精度比对,结果表明所提算法在光流精度方面有所提高。为了全面验证改进算法在遮挡、大位移与图像细节呈现等问题的针对性表现,从数据集中选取相应图像与主流算法进行比较。一方面,对实验数据进行比较,结果表明,Flying Chairs数据集上,本文算法所预测光流和实际光流的平均终点误差为1.75,低于比对算法;在Mpi Sintel数据集中,本文算法的平均终点误差为3.83、1.285,同样低于比对算法。另一方面,对直观图像进行比较,结果表明,本文方法对于存在遮挡、大位移和图像细节呈现等问题样本的预测结果也显著优于比对算法。综上表明,本文模型在针对遮挡、大位移和图像细节呈现等复杂问题上有更高的精度和鲁棒性,也证明了使用可形变卷积和基于注意力机制的关联层来改进卷积神经网路在解决此类问题中的重要作用。
其他文献
近年来ARM安卓已成为市场占有率最高的移动智能终端平台。各类安卓应用层出不穷的同时,应用的规模和复杂程度不断提高。安卓移动终端的交互方式和硬件特性决定了应用必须要充
近些年,我国经济社会实现了跨越式的发展,城市化水平得到了迅速的提高,标志着我国城市化发展开始迈入新的时期,与此同时,城市的高速发展,完善的现代化交通运输体系也随之形成
随着人工智能的发展,液压挖掘机的智能化也在快速发展,这会很大程度地提高了挖掘机的工作效率并且降低了劳动强度和劳动成本,挖掘机还可以平稳高效的完成许多危险动作并且在
当今,塑料制品是现代高科技发展所需的重要新型材料之一,被广泛应用于信息、能源、农业、工业、交通运输乃至航空航天和海洋开发等国民经济各重要领域。然而,吹瓶机作为塑料
六方氮化硼(hBN),是一种人工合成的超宽禁带半导体材料,具有类石墨结构,俗称“白石墨”。其禁带宽度高达6.0 eV以上,本征吸收边约为207 nm,在吸收边附近的吸收系数高达7×105 c
利用湿法烟气脱硫系统协同脱除燃煤烟气中的汞污染物被认为是具有发展潜力的脱汞技术之一。湿法脱硫系统在脱除燃煤烟气中的SO2的同时,能有效的去除烟气中的二价汞(Hg2+),但
视频中的组群行为识别是一项具有挑战性的任务,现已成为计算机视觉领域的研究热点。组群行为相比于单人行为具有更复杂的结构,组群内部之间的干扰、遮挡以及人与人之间的交互
清洁高效核能的开发和推广,将有助于我们应对日益紧迫的能源问题。整个核能系统的中心是核反应堆,核反应堆的安全运行和卸载的乏燃料长期储存离不开中子屏蔽材料。当前中子屏蔽材料的研究集中于含硼钢、铅硼聚乙烯、硼铝合金以及铝基碳化硼等。但含硼钢和硼铝合金中B的添加,会引起晶界析出含硼相,极大降低材料的力学性能;铝基碳化硼中B_4C陶瓷的含量较高,制备和加工工艺复杂;而铅硼聚乙烯等不耐高温老化且耐腐蚀性较差。
水润滑推力轴承被广泛应用在旋转机械设备中,它的主要作用是承担轴向载荷,是保证机械设备安全可靠运行的关键部件之一。水作为轴承的润滑介质与润滑油相比,具有很明显的优点,
由于输出和状态约束普遍存在于实际系统,且约束的破坏往往会造成系统性能退化和系统不稳定,因此约束非线性系统的研究得到了广泛关注.本文讨论了两类约束非线性系统的动态面