复杂场景下视频目标自动分割算法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:yellowerriver
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网基础设施的逐步升级以及移动终端的快速普及,人们可以越来越方便地拍摄和观看视频。视频由于其本身所携带信息的丰富性和生动性,成为了人们生活中重要的信息传播载体之一。不断增长的海量视频数据也带来了如何识别、检索和理解视频内容的需求。如何降低视频内容理解难度,提炼出视频中的关键信息成为当前视频处理领域的重要研究课题。由于视频目标分割的研究目标是有效分割出具有显著性特征的前景目标,所以它在视频摘要、视频检索、动作分析和视频语义理解等领域拥有广泛的应用。当前的视频目标分割算法大多属于自底向上的方法,通过获取并分析视频中颜色和边缘特征、运动信息等底层特征分割出具有显著性特点的前景目标。传统基于人工标注的算法已经不能满足当前大规模视频数据环境下的应用需求。同时,海量视频中包含的场景和拍摄条件是复杂而多样的,使得当前的自动化视频目标分割算法并不能在一些复杂场景中仍保持较好的鲁棒性。针对上述问题,本文提出了两种适用于不同场景的视频目标自动分割算法。主要研究工作和创新点如下:1.现有基于图割的算法容易受到背景噪声和像素点失配的干扰,在一些复杂场景下鲁棒性不佳。本文提出了 一种基于光流场和图割的视频目标自动分割算法,针对上述问题做了改进。在对前景目标分割前,该算法预先对视频全局动作特征进行分析,获得了前景目标的先验知识,减少了背景噪声对算法的干扰。针对像素点失配问题,该算法提出了动态位置模型优化机制,利用前景目标的位置模型增强了分割结果的时域连续性。实验表明,该算法在镜头快速移动、前景目标运动特征不规律等场景下能够获得更加准确和鲁棒的分割结果。2.在一些复杂场景下,现有基到候选目标的算法往往会出现分割结果部分缺失的问题,这一问题的根源在于候选目标过于碎片化以及候选目标间的时域映射关系不够准确。本文提出了一种基于候选目标的改进算法。该算法对原生候选目标进行了时域扩展与合并,不仅改善了候选目标碎片化的问题,还提高了相邻帧间候选目标的时域连续性。为了进一步增强模型时域映射关系的准确性,该算法引入了更多图像特征用于度量模型的边权值。在多个基准数据集上的实验表明,相较于现有同类算法,该算法对背景噪声的抗噪能力更强,在背景环境复杂、水面倒影等场景中分割结果更加完整。
其他文献
目前,视频监控系统的应用已经渗透到了许多领域中,各大企业、银行、公共交通都需要一套稳定、可靠和实时的视频监控系统。应用需求的可靠性和实时性,提高了视频监控系统开发
近年来,随着计算机技术、空间技术和现代信息基础设施的飞速发展,以及虚拟现实(Virtual Reality)、三维仿真(3Dimension simulation)、科学计算可视化等技术的出现,为真实再现客
Flash存储器作为一种新兴的存储设备,其体积小、重量轻、低成本、高集成度、抗震动性好等特点使得它在电子产品领域获得了非常广泛的应用。把Flash存储器应用于嵌入式系统中的
随着经济的迅速发展和人民生活水平的不断提高,房地产业已经发展成为国民经济中的支柱产业,也必将在整个国民经济中占据更加重要的地位。同时,对国家GDP的增长起到了很大的贡献
电网是关系国民经济命脉的基础设施和重要资源。随着我国国民经济的快速发展和人民生活水平的日益提高,人民对电力的需求日益增长,电网投资也在逐年加大,如何合理投资,加快电
随着我国整体经济水平的不断提升和互联网事业的不断普及,计算机的应用对于生产和生活的方式的改变提供了一种新的可能。但是,网络的发展也给入侵者提供了更加便利的条件。入侵
无线传感器网络是一种涉及多门学科的综合网络技术,它能够实现数据采集融合和智能网络应用系统,逻辑上将信息世界和真实世界进行了有效的连接,是一种真正的“普适计算”模式。由
随着人们对于公共安全等问题的不断重视,视频监控被应用到越来越多的场景中,从而带来了海量的监控视频数据。传统人工处理的方式已逐渐不可行,我们迫切需要使用计算机来进行
目前大多数流行的图像搜索引擎,都利用从图像的上下文中抽取出来的文本信息来建立索引。这种机制下的检索结果往往含有大量的垃圾信息,因为文本上下文与检索关键词匹配,不一
目前国内国外市场上存在很多的DCS的DCS软件,组态软件是指集数据采集与过程控制功能于一体的专用软件,随着现在市场工业自动化水平的迅速提高以及计算机在工业领域的广泛应用