H.264编码关键模块并行算法设计及其在CUDA上的实现

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:da_yu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视觉是人类获取信息的主要途径。视频作为视觉信息的载体,其数据量大,难于传输和存储,因此开发高效的视频编解码算法一直是学术界和工业界的关注点。从第一代视频编码标准H.261到H.264及现在的高效视频编码(HEVC),学者和工程师们不断的优化设计各种编解码算法,期望以更小的计算复杂度达到更高的压缩效率。H.264优秀的视频压缩效果以及良好的网络适应性使其成为应用最为广泛的视频编解码协议,但H.264优越的编码性能以计算复杂度的大幅度提高为代价,于是如何提高H.264编码计算效率成为研究的热点问题。现代计算机正在朝着多核、众核的方向发展,基于多核、众核的并行计算以及并行算法设计也是方兴未艾。GPU是一种众核处理器,原来用作图形渲染,近些年来也被广泛的应用于通用并行计算。2007年英伟达公司推出了计算统一设备架构(CUDA)以及与之配套的CUDA-C程序设计语言,推动了GPU并行计算的发展。将视频编码算法映射到GPU上实现已经成为提高H.264编码算法计算效率的一个重要方向,如何设计适合GPU的H.264并行编码算法成为问题的关键所在。本文在研读H.264协议和串行编码算法的基础上,充分挖掘GPU的众核计算能力,完成了H.264中若干关键模块的并行算法设计与实现,其中包括:为树状结构运动估计设计一种全并行运动估计算法;为H.264关键模块P帧设计了并行计算帧间预测和帧内预测的梯状并行运动估计算法;为H.264中B帧预测设计了并行计算前向预测和后向预测的B帧预测并行算法;为H.264并行视频编码器关键模块码率控制设计了适合于CABAC熵编码的码率控制算法。本文设计的所有并行编码算法均在GPU上通过CUDA编程进行了实现,并进行了大量的实验。实验表明本文所设计和实现的并行算法能够在保持视频重建质量的前提下大幅提高H.264并行编码器的计算效率,能够实现对1080p视频的实时编码。
其他文献
随着人们对信息安全需求的不断提高,基于密码与证件的传统安全技术已经不能满足人们的要求。生物特征具有唯一性、不易丢失和依赖于人体的特点,因此生物特征识别技术的出现为
光时分复用(OTDM)与密集波分复用(DWDM)是提高光纤通信容量的有效途径。随着云计算、在线视频、智能电视等新兴技术的快速发展,人们对带宽的需求呈爆炸性增长。因此,提高光通
无线体域网是新一代的无线网络,在医疗、救援、军事等领域有着非常广泛的应用前景,它的主要组成单元为传感器节点,负责数据信息的采集、处理和传输。传感器节点通常是由电池
近年来,随着无线通信技术的飞速发展,无线网络已经广泛应用于人们生产、生活的多个领域。传统无线网络中,一个节点一般只安装一个网卡(或接口),所有节点的接口都工作在相同的
摘要:随着人们越来越依赖互联网获取资源和信息,互联网所承受的压力与日俱增。从用户角度来讲,相同区域的用户在网络数据传输上存在着时间和地域的相关性,当区域中的用户访问
随着全球变暖,病虫害的发生给冬小麦产量和品质带来了巨大损失。冬小麦生长过程中主要遭受病虫害(包括条锈病、白粉病、蚜虫等)和水肥胁迫等影响。如何及时监测和正确区分不
摘要:无线移动通信系统中对于无线信号处理的实时性要求很高,传统的信号处理设备都是基于硬件平台的DSP或FPGA上实现的,但由于DSP平台系统开发的信号处理模块多数是非开放性的
电池荷电状态(SOC)的估算是电动汽车电池管理系统中的核心问题,也是技术难点之一。准确的估计SOC不仅对提高汽车整体性能和电池寿命效率具有重要意义,还有保证安全驾驶和降低运行成本的作用。本文针对磷酸铁锂电池SOC的估计算法进行了研究。通过对当前各种动力蓄电池SOC的估算方法进行比较和分析,选取卡尔曼滤波方法进行估算。对磷酸铁锂电池工作原理、结构及特点作了简单介绍。分析了电池的电压特性、内阻特性及循
随着互联网的迅速普及和爆炸性发展,其体系架构原始设计方案中的缺陷和弊端逐渐显露出来:现有互联网难以根据实时网络状态动态适配网络资源,导致网络传输效率低下、网络服务方
摘要:随着我国高速铁路的快速发展,其运营里程已经成为世界第一。高速铁路让旅客的出行变得更加便利,可以预见在未来越来越多人将会选择高速铁路作为他们的出行方式。因此,高