论文部分内容阅读
离散余弦变换(DCT)在图像和视频编码领域得到了非常广泛的应用。DCT使用的实数矩阵存在缺点,整数离散余弦变换(ICT)被提出,用整数数值的矩阵来近似实数矩阵,解决了两个问题:一是正反变换都是整数,不存在运算精度误差问题;二是整数矩阵乘法可以用加法和移位运算实现,极大地降低了运算复杂度,提高了编码速度。
H.264视频编码标准使用整数离散余弦变换作为编码器的变换方法,整数变换矩阵是由(12,10,6,3)变换基生成的。但由于其是对离散余弦变换实数矩阵的近似,所以不可能在所有的条件下对所有的图像或视频应用都是最优的,往往会受视频序列特性和量化步长的影响。除了标准中的(12,10,6,3),还有很多性能较好的变换基并未引起注意,也没有被H.264标准化过程中的草案提及。
本文搜集了一些公认较好的和新提出的变换基,首先通过数学模拟计算出理想化条件下各个变换基的变换效率,并以此为依据有针对性地对变换效率较好的变换基进行实际视频序列测试。在实验的基础上,从以下角度进行了分析:(1)量化步长和视频序列哪个因素对变换基的变换性能影响比较大,哪个是主导因素;(2)寻找不同QP范围内性能最优的变换基;(3)忽略SNR差异,寻找在某QP范围内有较大码率下降的变换基,但SNR的差异不应造成主观视觉质量的恶化;(4)不满足κ<,1>≥κ<,2>≥κ<,3>≥κ<,4>的变换基与H.264标准中的比较是否具有较好的性能。
本文提出了"变换基自适应"和量化步长是影响变换基变换性能的主要因素的新观点,并驳斥了一些错误观点。"变换基自适应"是指在某个条件下或范围内应用性能最优的变换基,这样可以在总体上获得最好的性能。(10,9,6,2)、(6,6,3,2)和(5,6,4,1)是本文发掘地具有某方面最优性能的变换基,"变换基自适应"的依据则是以QP为条件,最后提出了优化H.264编码器性能的方案。