基于深度学习的视频语义分割算法研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:guizi663
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的不断发展,计算机视觉逐渐成为人工智能领域重要的研究分支。在计算机视觉研究中,基于图像的语义分割问题研究较为普遍。相对图像而言,视频中蕴含更加重要的时空关联信息。视频语义分割旨在处理连续的视频序列,利用视频帧间关系进行精准分割,在智能监控、汽车自动驾驶、移动端设备开发领域具有重要的应用价值。该文针对视频语义分割中存在的分割精度不足、模型尺寸过大问题展开研究。首先,考虑到图像中小物体分割困难、物体边缘分割不准确问题,提出了基于多尺度的视频语义分割算法。该算法基于全卷积神经网络模型(fully-convolutional neural network,FCN),以视觉几何组网络(Visual Geometry Group Network,VGG)深度卷积网络为基础,采用半监督的方式实现图像内前景和背景的分离,达到持续传递语义信息的目的。算法的关键是结合了在线训练与离线训练来提升模型的总体分割精度。在线训练阶段,给定视频序列第一帧的图像和标签,对其进行微调训练。针对视频序列的帧间关系,对网络的输入新加入额外的掩膜通道,模拟帧和帧之间物体运动的轨迹信息。针对卷积网络下采样丢失精度的问题,对深层特征网络引入空洞卷积,取消了网络的最大池化操作,并采用多尺度特征融合连接方式,将深层特征与浅层特征融合,加快网络的收敛速度和模型的总体分割精度,通过实验验证了算法的有效性、可行性。然后,考虑到生成模型的尺寸过大导致的应用性较差问题,提出了轻量级的视频语义分割模型。利用深度可分离卷积网络设计了一款轻量级的卷积神经网络。此网络与主流卷积网络相比,省去大量的参数和计算,模型所占的内存空间也大幅度减小。这使得深度卷积网络的模型能更方便的应用到实际产品中,提高了深度学习卷积网络在实际应用中的利用率,通过实验验证了算法的有效性、高效性。
其他文献
市政污泥是污水处理过程中产生的固体废弃物,同时也是一种潜在的生物质资源,在水蒸气气氛下其有机组分能转化成有价值的富H2气体燃料。污泥的深度脱水不仅能有效的降低其含水
随着上海科创中心建设步伐加快,金融服务于科创企业的举措不断推出,上海在借鉴国际经验的同时,也在科技金融领域不断实践创新。文章从科技金融的含义、科技型企业的特点出发,
目的探讨糖皮质激素治疗对支气管哮喘患者胰岛素(insulin)及胰岛素受体(insulin receptor)表达的影响。方法选择支气管哮喘患者及健康对照各22例,所有受试者清晨空腹采血,测
基于最优契约理论,为了避免委托代理可能带来的经理人决策偏离股东价值最大化目标,通过有效的契约安排将管理者薪酬与股东财富紧密联系起来,以激励管理者基于股东利益最大化
本文通过对二叉树两种遍历方法的研究发现规律,给出二叉树遍历序列,用这些规律来实现二叉树的还原。
本文通过作者长期对A幼儿园的调研与观察,详细的介绍了A幼儿园在混龄教育实践方面的具体做法.A幼儿园对混龄教育理念的把握及实践尝试,为混龄幼儿创设了更接近真实社会形态的
印刷品是信息的主要载体,生活水平及环保意识的提高,对印品质量提出较高要求。印刷品反射率模型是控制印刷品质量的重要手段之一,目前已有的反射率模型可归纳为几何光学模型
高速公路作为重要的交通基础设施,在国民经济发展中发挥着极其重要的作用。根据国家高速公路网中长期规划,“十三五”期间我国将新建改建高速公路通车里程约3万km,繁重而集中的建设任务对高速公路建设管理提出了更高要求。质量管理是高速公路建设管理的重中之重,而质量评价是质量管理工作的关键环节和核心内容,在质量管理中占有十分重要的地位。但是传统的高速公路工程质量评价大多是针对项目后评价,项目实施的各个阶段性过
针对目前中国环境事故频发、群体性事件增多、环境损害加重和污染风险上升的情况,提出环境污染对渔业损害评估(包括对天然渔业资源、捕捞生产和养殖生产)的指标体系构建以及对
随着学习型社会和终身教育体系的构建,社会在职人员对于大学后继续教育的需求日益迫切。普通高校作为非学历继续教育的主要载体,承载着重要的责任和使命。多年来,我国高校非