论文部分内容阅读
屏幕编解码技术是一种针对屏幕内容编码的特殊的视频编解码技术。在现代远程教育中,教师在上课时需要录制电脑屏幕并传输给远程终端。所以屏幕编解码技术被广泛应用于在线课堂等远程教育模式。先前的研究根据屏幕内容把屏幕图像序列归为快速运动和慢速运动两种场景,并对不同的场景采取不同的码率控制方法。但其在两个方面存在不足。一是在场景切换时会因为场景判断算法的滞后性而引起主观质量的严重下降。二是在快速运动场景下,针对混合场景屏幕内容的编码具有一定的局限性,往往会因为分配给关键帧的目标比特数不足而引起关键帧画面模糊。针对场景判断算法的滞后性问题,本文通过在编码开始前预存并分析若干帧,从而获取场景切换时当前帧的准确信息,以减少画面质量的损失。混合场景屏幕内容是指同时含有视频播放和静态文字图形的场景。针对先前研究在编码混合场景屏幕内容时的不足,本文利用人眼对屏幕中不同内容的敏感度不同这一特性,提出了一种新的码率控制方法。我们还实现了一个视频区域识别算法,它能够根据Mirror Driver提供的变换区域识别出屏幕中视频窗口的位置。这样,我们可以将屏幕内容划分为视频区域非视频区域。结合视频区域识别算法,新的码率控制方法在x264已实现的CRF(固定质量因子)搭配VBV(视频缓存检验器)模式下分别在帧层和宏块层采用如下方法实现了优化:对于帧层,若当前帧为P帧且在I帧周围一定范围内,则该帧采用P_SKIP模式降低非视频区域的帧率用以补偿I帧的整体质量,提高屏幕视频序列的整体视觉效果。对于宏块层,则根据当前宏块所处区域(视频区域或非视频区域)来对宏块量化参数QP及其波动范围作一定的调整以达到提高整帧的主观质量的目的。实验表明,新的码率控制方法获得主观评价的评分要高于x264原本的VBV+CRF模式40%。