论文部分内容阅读
随着多媒体的迅猛发展,人们对视频编辑、视频编码、视频交互等多媒体应用提出了新的要求。自从MPEG-4提出了视频对象编码的概念以来,视频对象分割引起了人们的广泛关注。视频对象分割目前主要集中在像素域。虽然在像素域中进行视频对象分割可以获得较为准确的分割结果,但计算量一般较大,难以满足实时分割要求。鉴于实际应用中存储和传输的视频序列大多为压缩格式,如果将压缩格式的视频序列解码到像素域,再进行传统的像素域视频对象分割,无疑会进一步加剧视频对象分割的计算复杂度。
压缩域已经包含了视频对象分割所需的一些基本信息,如空域信息(DCT系数)、时域信息(运动矢量)等;此外,压缩域中的信息以块为单元,待处理的信息量大大减少,有助于快速进行视频对象分割。从压缩域中直接分割视频对象,有望获得比较准确的分割结果,同时满足实时处理要求。MPEG是目前常用的视频编码标准之一,基于MPEG压缩域的视频对象分割,不仅具有重要的理论意义,还具有广阔的应用价值。本文重点研究了基于MPEG压缩域的视频对象分割。
1.提出一种基于纹理分布的MPEG域运动对象分割算法。首先根据I帧低频DCT系数重建得到低分辨率图像,在该低分辨率图像上进行改进的JSEG纹理分割,得到纹理一致的区域;然后对稀疏的运动矢量场进行累加和致密化处理,再进行中值滤波,可获得较为准确和致密的运动矢量场;最后根据运动矢量的幅度信息区分背景与运动对象。
2.提出一种MPEG域视觉关注度对象的分割算法。提出一种场景纹理分析方法,并根据纹理复杂情况采用合适的参数进行区域生长;然后采用快速统计区域生长方法,得到色彩与运动一致的区域:最后结合由位置、运动矢量和清晰度组成的改进的视觉关注度模型,分割出视觉关注度对象。相对于运动对象分割模型,视觉关注度对象分割模型不但利用了运动信息,还充分利用了拍摄者的先验知识,可以获得较完整、更符合语义的视频对象。