论文部分内容阅读
随着互联网的快速发展,图像和视频这种能直观生动地表达信息的信息载体分布在了互联网中的每一个角落。人们对于高分辨率图片和视频的需求随着显示终端的发展越来越强烈,但由于过去采集的图像或视频分辨率较低,或是由于带宽以及存储资源受限,导致了图片、视频的分辨率不足,无法满足人们的需求,这些情况都需要采用某种技术来提高图片和视频的分辨率。超分辨率图像重建(Super Resolution Image Re-construction,SRIR)是一种能够通过软件算法,将已有的低分辨率(Low Resolution,LR)图像转换成高分辨率(High Resolution,HR)图像的技术。相比于通过硬件获取高分辨率图像,基于软件的算法具有成本低、操作简单且方式多样等特点。因此,研究图像超分辨率重建及其在视频编码中的应用具有较好的理论和实际应用价值。针对此问题,本文在图像超分辨率算法研究的基础上,提出一种基于正则化锚定邻域回归的改进超分辨率算法,并将其集成到现有的HEVC编码框架中,实现一种基于该超分辨率算法的视频压缩编码框架。具体来说,本文的主要工作及创新点如下:(1)提出基于正则化锚定邻域回归的超分辨率算法。基于稀疏表示的超分辨率算法需要在重建过程中计算稀疏系数,从而导致重建速度过慢,锚定邻域回归算法虽通过邻域映射的方式达到快速重建的效果,但这种基于稀疏字典的超分辨率算法通常缺乏对字典训练阶段的优化,从而影响算法的重建效果。为此,本文提出了基于正则化锚定邻域回归的超分辨率算法,简称Reg ANR。在字典训练阶段,算法通过对更新字典原子的误差项增加正则化约束,使字典原子在训练时快速收敛,提高稀疏字典的性能,进而达到良好的重建结果。实验结果显示,相比于其他主流的基于稀疏字典的超分辨率算法,Reg ANR算法在图像重建阶段得到的图像质量更佳,算法在图像重建速度方面也十分具有竞争力。(2)在以上工作的基础上,提出了一种基于超分辨率的视频压缩算法。主流的视频压缩编码标准都是利用视频数据在时间和空间上的冗余特性对视频进行编码,而忽视了视频中存在的大量先验信息。在带宽或存储受限的情况下,需要对视频进一步压缩,而基于学习的超分辨率算法可以充分学习视频中的先验信息,因而可将原始视频下采样以降低码率。为此,本文创新性地提出了基于超分辨率的视频压缩算法。算法将下采样后的视频进行编码传输,在解码端对解码后的视频进行超分辨率重构,进一步大大压缩了视频。对比试验表明,下采样后的低分辨率视频经过HEVC编解码,Reg ANR算法的超分辨率重建效果远超Bicubic算法;在保持相同码率的情况下,本算法的重建效果优于直接HEVC编码。