论文部分内容阅读
从视频序列中分割出视频对象对于第二代编码标准而言是一个非常重要的步骤,是基于内容的视频应用的基础,这些应用包括基于内容的视频检索、面向对象的视频压缩和编辑、智能人机交换等方面。视频对象分割效果的好坏将直接影响后续的视频应用。 尽管人们对基于对象的视频编码做了大量的研究工作,但到目前为止,还没有一种通用的方法能够有效地将物体模型从景物中分割出来。 本文通过对现有的视频序列中运动对象分割算法的研究,提出了一种灵活可变的算法来实现视频序列中运动对象的自动分割。 首先,在时域分割中获取单帧图像的运动区域,摒弃了直接用帧差或者二次帧差图做变化模板的做法。其基本思想是:利用二次帧差求交集得到单帧的运动信息;阈值化得到帧差掩模图像;为了得到紧凑的结果,利用二次扫描及形态学操作来修正仿真结果作为单帧运动区域,该运动区域是带有部分不精确边缘的掩模图像。其中阈值化过程所需要的阈值可以通过LHS(最小1/2抽样法,least half samples)方法得到,该方法可以及时地产生自适应阈值,是实现自动分割的关键部分。 然后,空域分割中采用形态梯度算子获取单帧边缘信息。帧图像经形态梯度处理后,物体边缘附近的像素点强度提升并抑制了非边缘的像素点强度,从而使图像帧中的边缘完整提取出来。 最后,将时域分割与空域分割结果结合,可以消除运动区域中多余的部分。经二次扫描得到准确的运动对象掩模图像,进行填充即可得到分割出的运动对象。 该算法的重点集中在时域分割上,摒弃一些常用的计算量较大的方法,就降低算法的复杂度、节省运算时间以及提高算法通用性、灵活性等方面做了一定的探索,并取得了一定的进展。总结而言,该算法具有以下突出特点: (1)较好的灵活可变性,这是本算法一个最突出的特点。根据视频序列的背景复杂度的不同,可以采用部分或者整个算法过程来实现运动对象的分割。 对于背景简单的视频序列,完全可以只利用算法中的时域分割部分来进行运动对象的提取。即使在只使用时域分割方法的情况下,对于运动区域的获得