论文部分内容阅读
视频通信以其直观生动等特点在多媒体通信中占有非常重要的地位,而随着多媒体技术的发展,视频压缩编码技术日益成为计算机通信领域中倍受关注的问题。压缩效率是在码率、图像质量和计算复杂度之间的一种折衷,因此,不同图像/视频质量评价体系下可得出不同效率的编码方法。目前的视频压缩编码算法都是在均方误差最优的条件下设计的,但早在上世纪七十年代就有学者提出均方误差并不能很好地符合人眼视觉特性。虽然多年来不少学者研究基于人眼视觉系统的图像/视频客观评价模型,但由于人眼视觉系统的复杂性,并没有一个算法能脱颖而出取代目前仍广泛应用的均方误差或峰值信噪比。
目前,有学者提出一种新的图像质量评价方法——结构相似度,它计算简单且比均方误差能更好与人眼视觉特性相吻合。因此,本文从图像结构相似度的角度对视频编码算法进行了一些研究,主要工作如下:
1.简要介绍了视频编码的发展现状,介绍人眼视觉模型的研究现状以及图像质量客观评价方法的发展。对最近提出的结构相似度图像质量客观评价法进行了深入研究,并通过实验和理论分析说明结构相似度比均方误差更好地符合人眼视觉特性。
2.研究H.264帧内预测编码并提出两种改进算法。一种是基于结构相似度的率失真优化算法,另一种是基于结构相似度的快速帧内预测算法。
3.研究H.264帧间预测编码方法并提出两种改进算法。一种是针对全搜索运动估计的基于结构相似度的帧问预测算法,另一种是针对快速搜索的基于结构相似度的改进预测算法。
理论分析和实验证明,本文提出的四种基于结构相似度的算法都能在保持视觉质量前提下减少码率或节省编码时间。