论文部分内容阅读
随着近年来视频像素的不断提高,业界对视频压缩算法提出了更高的要求,HEVC是当前比较先进的一种有损压缩算法,在H264视频编码框架上做了进一步的修正,能够在相同的性能下节省近一半的压缩码率。虽然HEVC在相同的性能下,具有更好的压缩比,但是过长的编码时间,导致其无法应用于实时视频处理领域。本文通过对人类视觉系统ROI特性的分析,利用数学模型量化了人类视觉系统的ROI特征,并使用量化后的关注系数来修正HEVC的四叉树划分模型,算法最终通过对NROI区域的快速编码,实现了对HEVC压缩算法的提速。经过实验测试,本算法能够在不影响用户感受的情况下,提升30%左右的编码速度。总体而言,本文的研究工作主要包含以下几个方面:1.以HEVC视频压缩算法为基础,通过对HEVC混合编码框架的分析,给出了利用人类视觉系统的关注特性来提高HEVC编码速率的可能性。进而从眼球的结构特征和眼动仪的测试数据两个方面对人类视觉系统的关注特性进行了分析,得到了人类视觉系统在视频的位置特征、纹理特征以及运动特征三个方面存在的倾向性,为后续对人类视觉系统的关注特性进行建模提供了理论依据。2.针对业界普遍采用单一的ROI因子来对人类视觉系统关注特性进行建模的这一缺陷,本文通过对视频的位置特征、纹理特征以及运动特征的分析,验证了这些特征能够对人类视觉系统的关注特性造成影响,并在此基础上利用数学模型对这三种特征进行量化,采用量化后的关注系数来表征人类视觉系统的关注特性。通过与其他三种同类ROI算法进行比较,本文的算法具有更强的鲁棒性。3.考虑到HEVC视频压缩算法在编码速率上的缺陷,本文利用构建的人类视觉系统关注模型修正了HEVC的四叉树划分方式,对于NROI区域,算法分配更小的CU深度,以减少编码时间,而对于ROI区域,算法分配更大的CU深度,以保留视频细节。通过这两方面的工作,本文的算法能够在不影响用户主观感受的情况下,节省30%左右的编码时间。4.针对标准的视频质量评价算法无法对视频ROI特性进行评价的缺陷,本文提出了一种基于位置特征的视频质量评价算法,算法由于利用眼动仪的测试数据来拟合人类视觉系统的关注特性,所以能够对视频的ROI特性进行更准确的评价。接着使用提出的评价算法对包括本文算法在内的四种算法进行测试,测试结果进一步验证了本文提出的算法在人类视觉系统的ROI模型建立方面存在更大的优势。