论文部分内容阅读
近年来,计算机视觉等理论的发展给视频编码的研究工作带来了新的启发。从主观评价角度出发,根据人的视觉特性重点关注视频中的特定区域的信息、提高编码效率和编码结果的质量是一个极具希望的研究思路。在这样的研究背景下,如何有效的动态检测和编码感兴趣区域(ROI)逐渐成为人们研究的焦点和热点。感兴趣区域(ROI)处理技术是基于人的视觉特性提出的:人眼在观看视频的时候,对图像不同区域的关注程度不同。一般ROI区域表现为运动,纹理,颜色,亮度,对比度,形态等特征方面的视觉显著,本文引入了静态图像显著图的生成来检测视频序列ROI区域,编码阶段优先保证ROI视频质量,在保证码率基本不变的前提下达到更好的主观效果。本文研究主要分为三个阶段:一、ROI检测阶段:基于视觉注意机制中的谱残差和相位谱的方法对视频序列的每一帧都进行显著度检测(SaliencyDetection),生成显著图,并对谱残差方法进行了改进,采用相位谱的方法节省了将近1/3的计算复杂度;二、ROI预处理阶段:对每一帧求得时空显著图(Spatio-temporal SaliencyMap),并进行二值化、腐蚀、膨胀以及区域检测等一系列的图像处理算法,作为ROI的预处理,框出矩形ROI区域,并且标注好每一帧的图像头ROI信息内容描述扩展字段,为下一阶段的编码做准备;三、ROI编码阶段:引入感兴趣区域标识框架,对这些检测出来的ROI区域进行编码阶段的特殊处理,梯度量化,同时进行质量可分级的码率控制,来解决ROI误报率的问题,能够在保证非感兴趣区域质量可接受的条件下,根据用户需求,分等级地调整感兴趣区域的质量。实验结果给出了ROI检测结果的平均命中率在0.45~0.65之间,较以往的算法有显著的提升,证明了本ROI检测算法的准确性,ROI编码的实验结果SSIM评价也有较大幅度的提升,达到了预期的目的。综上所述,本文算法能对一般的监控视频序列中感兴趣区域先检测然后编码,改进了以往只对有限和特定标注好的区域无法动态ROI检查之后再编码的方法,最终能够在保证在码率基本不变的情况下,达到提升ROI区域质量的目的。