论文部分内容阅读
H.264/AVC是由ITU-T和ISO/IEC联合制定的新一代国际视频编解码标准。相对于以往的视频标准,其具有技术方面的先进性、研究方面的开放性和应用方面的国际性等特征,因而引起了国内外专家学者的广泛关注和研究。但是,现有研究结果表明:H.264/AVC的高性能是以高复杂度为代价的,其高复杂度的算法导致整个视频编解码的运算效率大幅度下降。这已不能最大限度的满足人们对实时视频的需求,严重阻碍了其在实时视频方面的推广和应用。而运动估计技术是视频编解码中的关键技术,同时也是最耗时的一个模块。因此,提高运动估计的搜索效率就成为改进视频编解码性能的关键所在。目前,如何在保证视频编码精度的前提下,最大限度提高运动估计的搜索速度已成为视频领域的研究热点。一直以来,各位专家学者为提高运动估计的搜索效率进行了不懈的努力,先后提出三步法(TSS)、六边形搜索(HEXS)、菱形搜索算法(DS)、UMHexagons算法、EPZS算法等快速运动估计算法。其中,UMHexagonS算法吸收了多种运动估计算法框架的优点,可以在保持较好的率失真性能和视频质量的情况下,有效地提高视频编码效率,因而受到了人们的广泛关注。因此,本文拟以UMHexagonS算法为切入点,在研究运动估计原理和运动估计关键技术的基础上对运动估计算法进行多方面改进,试图在提高运动估计算法性能的方面有所突破。本文首先介绍了H.264/AVC的整体架构和关键技术,然后分析了运动估计的基本原理和几种经典的快速运动估计算法。最后,在对UMHexagonS算法进行深入研究的基础上,提出了改进的算法。具体而言,在充分利用了视频序列本身的特征(运动特征、纹理特征)和物体的运动规律基础上,本文从以下四个方面对UMHexagonS算法进行了改进:1.匹配准则,求和绝对误差准则(SAD)的匹配模板采用统一的方形模板与物体本身的运动规律不符,并且违背了事物是多样性的统一规律。改进的匹配准则充分结合自然界物体的运动规律,使得匹配模板选取更加科学。2.预测搜索起点,首先根据运动矢量的时空相关性来判断当前块的运动类型。然后针对不同的运动类型选择不同的预测算法,如果当前块是运动较小的类型,以(0,0)为搜索起点;如果当前块是运动较大的类型,则根据运动矢量的空间相关性来预测搜索起点。3.搜索范围,从视频图像的运动幅度、搜索范围的选取原则和当前预测块的块类型三个方面来综合确定动态搜索范围,大大提高了搜索速度。同时为了保证视频编码精度,考虑最小搜索窗口来避免陷入局部最小。4.搜索策略,根据像素点间的空间相关性,基于统计结果设计了提前中止算法;根据运动矢量的中心-交叉偏置分布特性和当前块的纹理特征对搜索模板进行自适应改进。最后将这四个方面的改进技术集成到原UMHexagonS算法中,选取多种测试序列对整体改进算法进行性能测试,从客观数据和主观效果综合对改进算法的性能进行分析。实验结果表明:改进的算法与原UMHexagonS算法相比,在视频质量几乎不受影响的前提下,大大减少了编码的复杂度,大大提高了编码效率。因而,其可以有效满足实时视频的需要,并且可以应用于模式识别、视频检索和智能监控等其他视频领域。