论文部分内容阅读
随着多媒体技术的发展,人们对于视频分辨率的要求越来越高,2K、4K甚至8K的视频都将在不久的将来普及,为了解决这些庞大的视频数据的存储和传输需求,视频编码标准应运而生。而目前最新的视频编码技术基于香农信息论,通过搜索多种编码模式,从中寻找最优的编码方式,而这一过程需要引入大量的计算来提高精确度,但目前随着计算量的提升,其效果提升却趋于平缓,说明基于这一编码思想的编码方式已进入发展的瓶颈期,寻找一种效果和计算量之比较高的编码思想对于未来编码技术的发展显得尤为重要。而根据目前其他学科对于人眼系统的研究,人眼的某些特性可以被用于视频编码领域。近年来,研究者们结合视频内容和人眼系统的某些特性提出了视觉感知编码这一思想。该思想追求的是视频的感知保真度而非传统信号处理领域内的像素保真度,在保持一定视频主观感知质量的前提下能大幅度地降低码率,为目前视频编码技术发展的窘境提供了一条重要的发展出路。本文从人眼感知失真的角度出发,提出了一种包含多域最小可感知失真模型和编码抑制策略的视觉感知编码算法。首先,本文介绍了多域最小可感知失真模型中传统的和新型的空频域最小可感知失真模型。然后对于多域最小可感知失真模型中的时域部分,本文通过主观感知实验实测时间频率和时域调制因子的关系,建立了一种全新的时域调制因子模型。再之后,对于编码抑制策略,本文介绍了一种基于块感知失真概率的评估标准,之后基于这一标准提出了一种全新的基于块感知失真概率的编码抑制策略。最后,为了验证本文提出的算法的有效性,本文基于HEVC官方标准测试模型HM16.9搭建了嵌入视觉感知编码算法的编码系统,在该系统上实现本文提出的算法并同时加入实现另外两种目前较新的视觉感知编码算法来进行横向对比。最后的实验结果表明,在视频感知质量可接受的前提下,本文提出的感知编码算法平均降低码率13.6%,同时横向对比另外两种算法,结果表明本文感知编码算法中的时域最小可感知失真模型可以有效去除视频中运动物体的视觉冗余部分,同时算法中编码抑制策略可以明显改善视频的主观感知质量。今后可基于算法的复杂度、最小可感知失真模型的精度等方面进一步的深入研究,并结合目前的研究成果在算法的复杂度、最小可感知失真模型的精度等方面进行进一步的优化。