论文部分内容阅读
高性能视频编码(High Efficiency Video Coding,HEVC)算法是在H.264/AVC基础上发展的最新一代编码技术,相较于H.264/AVC可降低50%以上码率,但HEVC在降低码率的同时却增加了编码复杂度,而随着视频分辨率和数据量的提高,视频中存在更多的视觉冗余,人眼视觉关注机制更利于滤掉冗余信息。因此,基于感兴趣区域(Region of Interest,ROI)的高性能视频编码算法研究对降低编码复杂度和提高输出视频质量具有重要意义。传统Itti算法在提取ROI方面存在提取的ROI信息缺失、ROI检测不准确及提取的ROI边缘定位模糊问题。因此,针对传统Itti算法存在的问题,本文对Itti算法进行改进来提取视频帧的ROI。首先在Itti模型提取原有三个特征的基础上,基于空域提取纹理、形状特征,解决融合后图像存在信息缺失和ROI边缘定位模糊的问题;基于时域提取运动特征,解决检测ROI不准确的问题。然后,在归一化等操作下生成亮度、颜色、方向、纹理、形状和运动共六个单特征显著图。最后,基于信息熵融合理论结合设计的算法自适应获取每个单特征显著图的权重,提高融合后显著区域的精度。最终完成视频ROI的有效提取。在HEVC帧内预测算法中,CU的四叉树划分和35种PU预测模式的选择增加了不必要率失真代价的计算,导致HEVC算法复杂度较高。因此,针对HEVC帧内预测算法存在的问题,基于ROI采用设计的算法对帧内预测算法进行优化改进。首先,基于ROI采用降维的思想结合设计的CU深度判决算法和判断准则确定当前CU的最终划分深度,提前终止CU的划分,实现降低帧内预测算法复杂度。其次,基于ROI引入二维离散傅里叶变换(Two-dimensional discrete Fourier transform)并结合设计的PU预测模式选择算法确定当前PU的最佳预测模式,降低不必要率失真代价的计算,进一步降低帧内预测算法复杂度。HEVC的JCTVC-K0103码率控制算法对目标码率分配存在比特权重估计不准确、忽略人眼主观观测机制和参数更新阶段计算量较大的问题。为此,针对K0103码率控制算法存在的问题,提出基于感兴趣区域的JCTVC-K0103码率控制优化算法。首先,采用CTU层分配的比特作为时空域复杂度分配的权重,实现CTU层比特权重的重新分配。然后,基于ROI采用设计的算法对目标比特分配权重进行再分配,使输出视频更符合人眼视觉关注机制。最后,引入拟牛顿法对参数模型进行更新,降低参数模型更新过程的计算量。利用本文提出的方法对来自JCT-VC提供的数据进行实验对比分析,实验结果表明:本文提出的方法能够准确、客观的实现降低编码复杂度、提高输出视频质量和使输出视频更符合人眼视觉关注机制,完成基于感兴趣区域的高性能视频编码算法的优化,可为高性能视频编码算法的研究工作提供一定的参考。