论文部分内容阅读
超高清(Ultra-high definition,UHD)视频具有高分辨率、高帧率、广视角和宽色域等特征,能够为用户提供高质量的视觉体验,成为目前多媒体技术发展的主要方向之一。但是随着UHD视频业务的迫切需求和推广应用,UHD视频的传输和存储都面临着巨大的挑战。目前,UHD视频编码技术发展迅速,编码压缩效率进一步提高,但编码复杂度也大幅增加。基于UHD视频的低复杂度编码以及感知编码技术成为目前研究的热点。本文就此展开以下四个方面的研究:(1)提出了一种联合多特征的未来视频编码(Future video coding,FVC)快速算法。算法联合FVC编码过程的多个感知编码特征的后验概率信息,估计当前编码单元的划分方式,通过提前终止若干编码单元的划分来节省编码时间。此外,针对单个特征贝叶斯分类不准确的问题,本文结合多个特征的后验概率信息。实验结果表明,在随机接入(Random access,RA)配置、低延迟P帧配置和低延迟B帧配置下,本文提出的算法在保证视频主观质量的前提下,平均减少35.7%、25.6%和26.7%的编码复杂度,而BDBR只仅仅增加了4.3%、3.1%和2.89%。(2)提出了一种基于信息熵滤波的恰可察觉失真(Just noticeable distortion,JND)感知视频编码(Perceptual video coding,PVC)方案。首先,通过主观实验,建立了基于10比特位深UHD视频图像的变换域亮度掩蔽效应模型。同时针对UHD视频图像的广角度带来的观看视角不固定的特点,设计了基于变换域的显著性权重因子。其次,考虑到不同图像纹理区域中JND阈值的差异性,设计了高斯微分熵滤波器,用于控制不同纹理区域中JND阈值的强度。最后,将本文提出的JND模型嵌入到高效视频编码(High efficence video coding,HEVC)的变换/量化编码过程中,利用JND阈值抑制变换系数来降低编码码率。为了更有效地实现JND抑制作用,在率失真优化(Rate distortion optimization,RDO)过程中引入失真补偿因子和失真补偿控制因子来控制失真程度。实验结果表明,所提出的PVC方案在视频主观质量损失可以忽略的情况下,在低延迟(Low delay,LD)配置下平均节省了32.98%的码率,RA配置下平均节省了28.61%的码率。与HEVC编码平台相比,在LD和RA配置下的平均编码时间分别增加了12.94%和22.45%。另外,与其他PVC方案相比,所提出的PVC方案主客观质量更高,码率节省更多,同时编码复杂度更低。(3)提出了一种基于感知噪声信道模型的PVC方案。首先建立了视觉抖动模型,用于模拟外部环境改变引起的视觉抖动,并将视觉抖动的刺激信号作为边信息进行传输,在此基础上建立了感知噪声信道模型。然后,利用因子图模型提出了基于消息传递算法的视觉抖动量化步长估计算法。在保证可靠传输和不可感知特性的前提下,得到视觉抖动量化步长。同时,利用该量化步长,计算视觉抖动及其噪声。最后,在编码的RDO过程中引入感知噪声权重因子,并设计了基于HEVC的PVC方案。同时,为了更有效地控制不同编码量化参数下的不同失真补偿程度,在RDO过程中引入了失真补偿控制因子。实验结果表明,所提出的PVC方案在LD和RA配置下分别节省码率为35.93%和24.93%,并保证了视频的主观质量。与原始编码平台相比,在LD和RA配置下,平均编码时间分别增加了13.53%和19.26%。与其他PVC方案相比,提出的PVC方案可以获得更高的主客观视频质量,节省更多的码率,同时具有更低的编码复杂度。(4)提出了一种基于感知噪声贝叶斯网络(Perceptual noise bayesian network,PNBN)的自适应JND模型的PVC方案。首先,根据主观实验提出了基于10比特位深UHD图像的像素域亮度掩蔽效应模型。同时利用主观实验,改进了非线性可加掩蔽模型(Nonlinear additivity model for masking,NAMM)的参数,使模型适用于10比特位深UHD图像。然后,基于PNBN动态地估计满足基于图像混乱度的视觉抖动量化步长范围内和边信息译码准确率条件的视觉抖动量化步长。利用该量化步长计算视觉抖动及其噪声,并建立了基于视觉抖动噪声的JND模型。该JND模型同时考虑了亮度掩蔽和纹理掩蔽效应,可以根据图像中的不同纹理区域,自适地调整纹理掩蔽效应强度。最后,将改进的NAMM模型和基于PNBN的自适应JND模型分别嵌入多功能视频编码的RDO过程中,并引入感知噪声权重因子和失真补偿因子。实验结果表明,在全帧内配置下,基于PNBN的自适应JND模型和基于NAMM模型的PVC方案分别节省码率25.17%和12.79%,同时两种PVC方案都保证了编码后视频的主观质量。由于基于NAMM模型的PVC方案采用了对像素域残差编码单元的抑制预处理,与原始编码平台相比,平均编码复杂度降低了33.28%,而基于PNBN的自适应JND模型的PVC方案编码复杂度增加了19.38%。另外,与其他PVC方案相比,基于PNBN的自适应JND模型的PVC方案可以获得更高的主客观视频质量,节省更多的码率,同时具有更低的编码复杂度。