论文部分内容阅读
MPEG-4是基于对象的多媒体数据压缩编码国际标准,属于基于内容的第二代活动图像标准。MPEG-4具备广泛的用途。MPEG-4是十分开放的标准,对视频分割、比特率控制和编码技术等开放的部分,允许竞争和改进。MPEG-4涉及的关键技术包括图像分析和分割技术和编码技术,当前成为研究和开发的热点。本论文针对MPEG-4涉及的关键技术进行研究。主要完成的工作分为两大部分:其一,面向MPEG –4的视频分割方法和算法部分。探讨了从自然视频系列中得到VOP的典型方法和算法,分别从方法的思想、算法内容和步骤、算法的优缺点进行分析。提出了基于时空信息的自动分割法,并详细论述该算法的过程。时间分割利用运动特征和多帧特征,实现了前景快速和慢速运动部分的分割,同时克服了遮挡、噪声和物体边界不精确的运动估计等导致错误分割。空间分割利用图像单帧的灰度信息将图像分割成不同的区域。融合时空信息分割发挥了时间分割提供运动VOP的粗略掩码和空间分割提供VOP精确边界的优势,同时克服了时间分割提供太粗糙边界,从而导致不精确的分割的缺点和空间分割经常将VOP分割为多个区域,从而导致过分割的缺点。VOP模型初始化简单实用。VOP模型更新能跟踪旋转、变形和静止的VOP。镜头检测实现完整的视频系列中VOP的分割。其二,面向MPEG –4的视频编码方法和算法部分。针对自然视频系列中的VOP的形状、纹理和运动信息的编码,分别进行研究。包括:面向MPEG –4的VOP的形状编码方法和算法部分。探讨了当前典型的形状编码方法和算法,分别从方法的思想、算法内容和步骤、算法的优缺点进行分析。提出了改进的四叉树多分辨率的形状编码法,用相关系数来控制四叉树的复杂度,进一步提高形状编码效率,帧间形状编码的运动估计仅在有效搜索区域进行,极大提高搜索效率,使得基于四叉树的形状编码成为完善和更具竞争力的算法。面向MPEG –4的VOP的纹理编码方法和算法部分。探讨了典型的纹理编码方法和算法,分别从方法的思想、算法内容和步骤、算法的优缺点进行分析。面向MPEG –4的VOP的运动估计和补偿部分。探讨了典型的运动估计和补偿方法和算法,分别从其思想、算法内容和步骤、算法的优缺点进行分析。提出了利用块特性的自适应十字搜索模式运动估计法。充分利用VOP的块的特性,不同的块采用不同的运动估计策略。首先,VOP的边框内块分三类。当前块为VOP的透明块时,不进行运动估计,由解码端直接生成。当前块为VOP的边界块时,参考帧不填充,边界块间的SAD计算采用二值平面值计算。当前块为VOP的模糊块时,模糊块的SAD计算采用灰度值计算。其次,对进行运动估计的块,先排除静止块,对运动块,采用自适应十字搜索模式。利用块特性的自适应十字搜索模式运动估计法极大地提高了搜索效率,同时计算量显著减少,并且具备较好的峰值信噪比,是一种较有潜力的运动估计和补偿算法。MPEG-4和具体应用紧密相连,针对特定的应用开发的核心技术和产品还需进一步展开研究和开发。