论文部分内容阅读
随着数字视频技术的日趋成熟以及图像图形技术、计算机视觉技术的快速发展,3D视频以其真实的视觉体验受到了人们的广泛关注,但是其庞大的数据量给视频的传输和存储带来了极大的压力,所以为了实现对3D视频的高效压缩,同时保证视频质量,视频编码联合工作组在2D视频高效性能编码标准(High Efficiency Video Coding,HEVC)的基础上制定了新一代高效立体视频编码标准(3D High Efficiency Video Coding,3D-HEVC)。3D-HEVC采用的是多视点加深度图的编码格式,在HEVC的基础上引入了多种新技术,以提高对3D视频的高效压缩,但是在帧内编码中仍然存在着计算复杂度较高的问题,对3D视频的普及有着一定的阻碍。所以本文针对3D-HEVC中的帧内编码优化方法进行研究,以实现帧内编码计算复杂度的降低,这对3D视频的普及具有重要的意义。本文在深入研究了HEVC以及3D-HEVC的框架、基础知识和编码技术的基础上,对3D-HEVC中的帧内编码方法进行优化和改善。本文主要研究内容和创新点总结如下:针对帧内预测时深度图进行四叉树递归划分导致的计算复杂度较高的问题,本文提出了一种基于深度学习的帧内深度快速选择算法。首先,搭建了适用于3D-HEVC深度图最优深度预测的FSCD-CNN(Fast Selecting Cu’s Depth-Convolutional Neural Network)模型,然后将该网络模型和最大编码单元(Largest Coding Unit,LCU)的递归划分相结合,对LCU最优划分深度进行预测,最后根据预测结果提前终止自上而下的四叉树划分过程以及DMM(Depth Modeling Mode)模式探索过程。本文算法相比3D-HEVC编码平台平均减少了42.58%的编码时间,BDBR平均降低了0.036%,同时和当前几种流行的算法相比,节省时间平均提高了15%左右,在保证质量的同时实现了对3D-HEVC中的帧内编码的优化和改善。针对帧内预测时整体LCU四叉树递归划分导致的计算复杂度较高的问题,本文提出了应用决策树的帧内快速选择算法。首先,搭建了适用于3D-HEVC纹理图最优深度预测的机器学习模型,然后将该模型与纹理图LCU的四叉树划分过程相结合,利用纹理图编码的空间相关性和纹理复杂性等特征,对当前纹理图LCU的最优划分深度进行预测,根据预测结果,提前终止纹理图LCU的划分过程,最后利用深度图与纹理图的相关性以及深度图的特性,提前终止该深度图LCU的递归划分过程以及DMM模式探索过程。实验结果表明,本文算法相比于3D-HEVC编码平台平均节省了37.05%的编码时间,而BDBR仅增加了0.41%,和当前流行算法相比,平均节省了7.35%以上的编码时间,在保证质量的同时有效的实现了对3D-HEVC中的帧内编码的优化。