论文部分内容阅读
从视频序列中提取前景目标是计算机视觉领域的一项关键技术,也一直是计算机视觉领域中的一个热门研究课题。视频对象分割得到的结果可以用于诸多基于对象的视频应用,例如基于对象的视频编码、基于内容的视频检索、智能视频监控、基于视频的人机交互等等。因此,视频对象分割技术具有重要的研究意义及应用价值。视频对象分割和图像分割都是计算机视觉领域的难点问题。视频对象分割的挑战主要在于:视频数据包含了丰富的时空信息,由于现实场景的复杂性和多样性,很难用一个统一的模型来对视频对象进行建模;视频对象是一种高层语义概念,很难通过计算低层次视觉特征得到高层次语义对象分割,仅利用目前的技术还很难跨越语义鸿沟。早期的视频对象分割方法通常是从局部像素时域进行分析,没有充分地考虑图像的空间相关性,因此很难得到满意的分割结果。虽然近期的一些工作融合了空域信息进行分割,得到了比较精确的分割结果,但是大部分文章在分割时没有考虑场景中的光照、阴影带来的影响。另外,这些视频对象精确分割方法的计算复杂度都比较高,很难达到实时应用的目的。本文主要针对融合时空信息进行分割的关键技术进行研究,结合全局运动检测、背景建模、阴影检测、和马尔科夫随机场分割技术,提出了有效的视频对象分割框架。在此框架基础上构建的分割系统能够高效的提取单目摄像机拍摄的视频中的前景对象,得到平滑准确的对象轮廓,并且可以消除物体投射的阴影。论文的主要工作有:(1)提出了一种全局运动检测方法。为了使本文的方法能用于PTZ摄像机,实时检测摄像机运动,本文提出了边缘变化率的概念进行全局运动检测,方法计算简单而且精度很高。(2)提出了使用初始前景区域减小计算量的方法,首先使用高斯混合模型来对背景建立模型并获得初始前景区域,然后采用连通区域分析和分层聚类方法得到一系列前景区域,分割算法仅仅在这些初始前景区域进行,本文提出的加速算法可以极大的减小分割的计算量。(3)提出了利用“四分图”并结合最大化后验概率-马尔科夫随机场进行视频对象分割的框架。首先使用背景模型和阴影检测为每一个区域生成一个四分图,分别代表前景、背景、阴影、未知区域,阴影区域也参与学习背景颜色模型,从而在分割时能将阴影区域自动标记为背景。为了保证分割结果的时域连续性,本文使用历史分割结果作为新的训练样本来更新前景模型。(4)结合提出的方法,本文开发了一个视频对象分割实验系统,并针对不同类型的视频序列进行了大量实验,实验结果表明了本文方法的有效性。