HEVC编解码算法的CUDA优化

被引量 : 22次 | 上传用户:jiajiadedaan1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人们对标清视频、高清视频的需求越来越高,H.264/AVC视频编码标准已经不能很好的满足网络以及人们的需求,ITU与MPEGE国际化组织成立了JCT-VC(Joint Collaborative Team on Video Coding)小组,专门研究制订新一代的视频编码HEVC(High Efficiency Video Coding)也称为H.265,其目标是比H.264/AVC High Profile视频编码标准节省50%左右的码率。JCT-VC于2010年召开了第一次会议,目前大部分工作都已经完成,并计划于2013年发布最终的标准。HEVC的编码性能比H.264/AVC的性能有了很大的提高.性能的提升是以增加复杂度为代价换来的。由于高度的复杂度,其实时编码性能的应用受到了限制,有必要对其进行进一步的优化,提高其编码速度,本文着眼于GPU(Graphic Processing Unit)方向对其研究加速,对HEVC标准的应用推广有重要意义。本论文研究和实现了HEVC视频编码器的CUDA(Compute Unified Device Architecture)优化,在充分研究了CUDA结构的特性,把运算量大、耗时的部分比如自适应插值滤波器(AIF, adaptive interpolation filter),以及EPZS(Enhanced Predictive Zonal Search)快速运动估计部分放到了CUDA里面实现。EPZS算法实现过程中,我们用PU(Prediction Unit)小块的SAD(Sum of Absolute Difference)值合成PU大块的SAD值。此外,HEVC运动估计中编码单元LCU(Largest Coding Unit)最大可以到64×64,最小块为4×8和8×4的大小,最大块与最小块的差距非常大,当视频序列运动比较剧烈的时候误差较大,为此,通过研究调整起始搜索点,让所有的分块起始搜索点尽量接近真实搜索点。实验结果表明:通过修改HEVC框架并利用CUDA加速AIF可以明显的减少编码时间,整体编码时间加速比可达1.25左右(即编码时间减少25%左右);在EPZS运动估计加速比方面,运动较小的序列编码时间加速比在7倍左右,运动中等以及偏大的序列编码时间加速比在17倍左右。AIF模块与EPZS两个模块整合后整体编码时间平均加速比达1.5以上(即编码时间缩短一半)。
其他文献
2008年国际金融危机过后,国际经济政治的秩序发生了较大变化,不稳定因素增多。在这样的环境下,中国作为一个迅速崛起中的经济大国受到国际社会越来越多的关注,而作为对外经济联系
随着我国社会经济、汽车工业和城市化、城镇化的快速发展,我国城镇居民人均汽车保有量迅速增加,而城市交通网络条件改善缓慢,交通拥堵逐渐成为制约城市居民出行的瓶颈。同时
在以间接金融为主的甘肃,银行信贷资金实至名归的成为其国民经济发展血液,支撑着该地区的经济增长。但资金作为一种资源与生俱来具有稀缺性,因而,不断提高信贷资金的配置效率
自1987年《中华人民共和国民法通则》生效、民事侵权正式进入司法审判之后,以侵害名誉权、隐私权和肖像权等人格权为由起诉记者和新闻单位的案件——即“媒体侵权”持续增多,
随着我国医改的不断深入,公立医院薪酬制度的改革迫在眉睫。针对医务人员普遍认为所获得薪酬小于付出、公立医院薪酬制度缺乏顶层设计、公立医院相关政策有待完善、绩效考核
苏区或革命根据地,是中国共产党在土地革命战争时期实行局部执政的实验田。由方志敏、邵式平、黄道领导创建的闽浙皖赣苏区(又称赣东北或闽浙赣苏区),在中华苏维埃运动史上有极
车联网管理平台是中国电信车联网系统中的中枢管理平台,本文的主要工作是对该平台的空中服务功能和统计管理功能进行设计实现。在互联网、计算机等信息技术飞速发展的今天,在
随着科学研究、通信技术、IT技术的快速发展,电信业务的数据量急剧增长,而电信行业间日益激烈的竞争也使电信运营商更加需要注重网络和服务的质量来提高行业竞争力。如何从大
1965年,美国科学家扎德(L·Zadeh)提出了“模糊集”(fuzzy sets)的问题,从此产生了一系列的新学科:模糊逻辑学、模糊数学、模糊语言学等。随着模糊语言学的兴起,人们逐渐认识
随着无线通信技术的快速发展,移动互联网已成为互联网时代的重点发展领域,也必然成为未来信息化时代的发展趋势。在互联网时代,电信运营商因未抓住发展机遇从而沦为互联网时