【摘 要】
:
光流估计是计算机视觉的核心问题之一,在行为识别、视频编辑、自动驾驶等方面都有着广泛的应用。光流表征着三维空间中运动对象在投影面上像素位移的瞬时状态。传统光流估计方法以变分法为基础,但这类方法的准确率与实时性较低。近年来,基于深度学习的光流估计方法凭借实时性高、结果精确等优点,已成为光流研究领域的主要研究热点。目前,现有基于深度学习的方法缺少视频帧间相关度的分析与利用,为此提出一种基于视频帧间相关度
论文部分内容阅读
光流估计是计算机视觉的核心问题之一,在行为识别、视频编辑、自动驾驶等方面都有着广泛的应用。光流表征着三维空间中运动对象在投影面上像素位移的瞬时状态。传统光流估计方法以变分法为基础,但这类方法的准确率与实时性较低。近年来,基于深度学习的光流估计方法凭借实时性高、结果精确等优点,已成为光流研究领域的主要研究热点。目前,现有基于深度学习的方法缺少视频帧间相关度的分析与利用,为此提出一种基于视频帧间相关度的光流估计方法。首先,采用残差卷积神经网络构建用于挖掘图像深层要素的特征编码器,对连续两帧图像进行孪生特征编码,以提取更利于光流计算的图像特征。其次,对光流场景进行了深入分析,采用光流场景中连续两帧间像素位移不会过大的特点,建立了连续帧间像素的相关度模型,并通过该模型指导连续帧间的稠密视觉相似度计算。该过程中,根据光流场景的特性对特征图进行分块处理,块内特征像素共享位移场景。通过设定位移阈值及相应的强弱相关因子,计算两帧像素间的相关性,以此构建基于相关度的视觉相似性计算模块,输出高分辨率计算结果并采样生成代价体积。再次,以GRU循环神经网络为基础构建迭代更新网络,进行多次迭代更新得到可视化的光流估计结果。最后,在KITTI-2015和MPI-Sintel大型公开数据集上进行实验分析,结果表明,以KITTI-Fl为性能度量时,相较于FlowNet2.0、PWC-Net、以及RAFT(Recurrent All-Pairs Field Transforms for Optical Flow)等均有提升,在EPE(End-Point-Error)性能度量上,与LiteFlowNet2等几种主流方法相比误差更少。除了客观的性能度量外,主观上也能够更好的捕捉图像运动的细节,估计出更精细的结果。该论文有图32幅,表6个,参考文献66篇。
其他文献
黄河流域被称为“能源流域”,存在开发与生态环境矛盾日趋尖锐、资源型经济依赖程度深、发展惯性大等突出问题。进入新时代,面对新形势和新要求,亟须从流域整体视角加快发展理念、产业结构、布局结构、资源经济、体制机制转型,使非化石能源成长为支柱能源,将开发重心进一步向上中游转移,实现二次能源优化发展,继续承担全国重要能源基地作用。按照分区分类分型分策思路,选取上游成长型可再生能源基地、“几”字弯区域稳定型化
多区域多物理场耦合问题在水资源开发、非常规油气藏开采等领域有着重要的应用,dual-porosity-Stokes耦合模型作为一种典型的多场耦合模型具有很重大的研究价值。该耦合模型由多孔介质区域和管道自由流体区域构成,其中多孔介质区域由两个分别控制微裂缝渗流和基质渗流的Darcy方程描述,两种孔隙之间通过质量交换项进行耦合,管道区域则由控制自由流体的Stokes方程刻画,两个区域之间通过交界面上的
在20世纪60、70年代国际共产主义运动内部发生严重分歧的大背景下,一些学者对马克思主义在历史研究中的科学性产生了怀疑,并存在有用实证主义和相对主义观点重释马克思主义的倾向。面对这种情况,波兰马克思主义者亚当·沙夫(Adam Schaff,1913-2006)挺身而出,他在批判各种错误观点的同时,也以马克思主义立场对历史认识论作出重塑,有效地回答了“真理性历史如何可能”这一根本问题。沙夫的工作不仅
煤炭开采在带来经济效益的同时也造成了不容忽视的生态环境问题,产生了大量废弃地,利用化学方法及微生物修复技术进行矿区废弃地改良是目前的研究热点。本研究以黑麦草为供试植物,选取微生物菌剂长枝木霉菌(TL)和废弃资源古龙酸母液(RE)、剩余活性污泥堆肥(AS)为改良剂在矸石山基质、排土场土壤两种不同生境条件下进行盆栽试验。通过不同用量改良剂单施试验确定最佳用量范围,然后进行配施试验,通过测定黑麦草生长生
多目标均衡约束优化问题(Multiobjective Optimization With Equilibrium Constrained,简称MOPEC)的应用遍及工程设计、经济均衡、交通科学、数据挖掘、军事决策等领域,然而该问题在理论分析与求解算法设计等方面的研究存在诸多问题。出于其重要的实际研究价值,采用何种方式求解与如何优化求解过程,近几年引起研究人员的高度关注。在均衡约束优化问题研究中,约
随着信息技术的飞速发展,推荐系统在各种流媒体网站和电子商务平台中应用广泛。现有的推荐系统大多数根据用户的身份信息和长期的历史行为给出个性化推荐。然而,许多应用程序并没有关于用户身份信息和长期历史数据。基于这种情况,传统的推荐算法将不再适用。因此基于会话式推荐系统(Session-based Recommender System,SRS)应运而生,通过用户在当前会话序列中的点击行为给出有效的推荐结果
培养学生统计思维已成为当前国际统计教育讨论的焦点,而教材作为主要的教学资源是培养统计思维的重要载体。采用定量与定性分析结合的方法,基于统计活动视角比较分析人教A版、北师大版、湘教版三版高中新数学教材呈现的统计思维水平和复杂性发现:三版教材都重视“提出统计调查问题”“分析数据”“解释结果”过程,但在“收集或考虑数据”过程提供的学习机会较少;各过程下不同水平的统计思维均有呈现,但水平分布不均衡;都比较
当前,对“跨学科学习”的关注度越来越高。在实践中,教师应立足学科本位,实施跨界学习,促使跨学科教学能力的提升。其间,需要经历多重环节:进行语文单元内重组和跨单元重组的萌芽阶段,基于“学科+”的组合、整合、融合的发展阶段,跨越虚拟与现实、课堂与生活的高级阶段。
分类树由机器可解释的语义组成,为许多web应用程序提供了有价值的知识。分类树已被广泛应用于各个领域,特别在电子商务领域中起着至关重要的作用,用于推荐、浏览和查询理解。例如,在线零售商(如亚马逊)使用分类树进行产品推荐,而网络搜索引擎(如百度)利用分类树来增强查询理解。由于手工构建分类树需要付出巨大的人力代价,并且在构建过程中存在较多主观的因素,因此分类树的质量参差不齐。同时,随着web内容量的快速