基于H.264/AVC的快速运动估计算法研究

来源 :上海师范大学 | 被引量 : 0次 | 上传用户:cainubaijiazi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
H.264/AVC是由ITU-T和ISO/IEC联合制定的新一代国际视频编解码标准。相对于以往的视频标准,其具有技术方面的先进性、研究方面的开放性和应用方面的国际性等特征,因而引起了国内外专家学者的广泛关注和研究。但是,现有研究结果表明:H.264/AVC的高性能是以高复杂度为代价的,其高复杂度的算法导致整个视频编解码的运算效率大幅度下降。这已不能最大限度的满足人们对实时视频的需求,严重阻碍了其在实时视频方面的推广和应用。而运动估计技术是视频编解码中的关键技术,同时也是最耗时的一个模块。因此,提高运动估计的搜索效率就成为改进视频编解码性能的关键所在。目前,如何在保证视频编码精度的前提下,最大限度提高运动估计的搜索速度已成为视频领域的研究热点。一直以来,各位专家学者为提高运动估计的搜索效率进行了不懈的努力,先后提出三步法(TSS)、六边形搜索(HEXS)、菱形搜索算法(DS)、UMHexagons算法、EPZS算法等快速运动估计算法。其中,UMHexagonS算法吸收了多种运动估计算法框架的优点,可以在保持较好的率失真性能和视频质量的情况下,有效地提高视频编码效率,因而受到了人们的广泛关注。因此,本文拟以UMHexagonS算法为切入点,在研究运动估计原理和运动估计关键技术的基础上对运动估计算法进行多方面改进,试图在提高运动估计算法性能的方面有所突破。本文首先介绍了H.264/AVC的整体架构和关键技术,然后分析了运动估计的基本原理和几种经典的快速运动估计算法。最后,在对UMHexagonS算法进行深入研究的基础上,提出了改进的算法。具体而言,在充分利用了视频序列本身的特征(运动特征、纹理特征)和物体的运动规律基础上,本文从以下四个方面对UMHexagonS算法进行了改进:1.匹配准则,求和绝对误差准则(SAD)的匹配模板采用统一的方形模板与物体本身的运动规律不符,并且违背了事物是多样性的统一规律。改进的匹配准则充分结合自然界物体的运动规律,使得匹配模板选取更加科学。2.预测搜索起点,首先根据运动矢量的时空相关性来判断当前块的运动类型。然后针对不同的运动类型选择不同的预测算法,如果当前块是运动较小的类型,以(0,0)为搜索起点;如果当前块是运动较大的类型,则根据运动矢量的空间相关性来预测搜索起点。3.搜索范围,从视频图像的运动幅度、搜索范围的选取原则和当前预测块的块类型三个方面来综合确定动态搜索范围,大大提高了搜索速度。同时为了保证视频编码精度,考虑最小搜索窗口来避免陷入局部最小。4.搜索策略,根据像素点间的空间相关性,基于统计结果设计了提前中止算法;根据运动矢量的中心-交叉偏置分布特性和当前块的纹理特征对搜索模板进行自适应改进。最后将这四个方面的改进技术集成到原UMHexagonS算法中,选取多种测试序列对整体改进算法进行性能测试,从客观数据和主观效果综合对改进算法的性能进行分析。实验结果表明:改进的算法与原UMHexagonS算法相比,在视频质量几乎不受影响的前提下,大大减少了编码的复杂度,大大提高了编码效率。因而,其可以有效满足实时视频的需要,并且可以应用于模式识别、视频检索和智能监控等其他视频领域。
其他文献
人脸检测与跟踪技术是计算机视觉和模式识别领域的一个研究热点,在智能人机交互、智能游戏控制、虚拟现实以及基于内容的压缩编码等方面都具有广阔的应用前景。近年来随着视频
MIL-STD-1553B总线是上世纪70年代由美国军方提出的最先应用于军用航空领域的具有可确定性、传输可靠的数据总线标准,主要应用于信息需要在总线终端之间通过数字通信通道传输
随着通信技术和传感器技术的发展,无线传感器网络在医学领域发挥着越来越重要的作用,无线体域网(WBAN)技术应运而生。无线体域网和传统的无线传感器网络尽管有很多相似之处,
目前,相关技术在水声信号处理中得到广泛的应用,而浅海信道条件下水下声信号的相关性是水声信号检测与估计的重要基础。本文主要对浅海信道条件下宽带声信号的相关性进行了仿真
Turbo码作为一种高性能的信道编码,以其优异的性能及逼近Shannon容量限的编码方式,在通信领域得到了广泛应用。本文对Turbo码的编译码原理及其硬件语言实现进行了深入的学习
相比于传统的直接存储转发的路由方法,网络编码允许网络的中间节点参与编码,从而可相应提高网络的吞吐量、可靠性、安全性等。但是传统的基于路由方法的网络安全机制并不适用
传统的物理层安全通信只研究信息的安全传输或者系统的能量消耗,而这两者相互冲突且越来越难以满足人们对无线通信系统的高要求,因此寻求有效均衡两者的方法成为无线通信系统
识别视频中人类的行为动作是计算机视觉重要任务之一,其目标是从视频中提取、分析和表述人体行为动作信息。受人脑视觉机理启发下,深度学习框架使得机器学习取得巨大进展,也
正交频分复用(Orthogonal Frequency Division Multiplexing:OFDM)技术具有较高的频谱利用率和较强的抗多径衰落特性,是第四代通信系统中的主流技术。作为一种多载波调制技术
人类的大脑活动时会产生电位的变化,脑电信号可以记录到这种变化,这是大脑神经细胞活动所产生的电信号在大脑皮层的总体反应。不同的年龄段、性格、职业和身体健康状况的人会