论文部分内容阅读
视频信息是人类获取外部信息的重要载体之一,已经在人们的生活娱乐、可视会议、视频检索、远程教学等领域得到了广泛应用。然而视频信号的数据量巨大,必须对其进行压缩编码。另外,随着人们视觉品质要求的提高,立体视频越来越受到人们的追捧,它具有强烈的立体感和真实感,但它的数据量成倍的增加,需要更多的带宽资源,不利于信号的通信、传输和存储。 运动估计是消除视频图像间的时间冗余的一项重要技术,基于块匹配的运动估计在各种视频编码标准中得到了广泛的应用。块匹配法只考虑了物体在水平、垂直方向的平移运动,没有考虑物体的旋转、缩放、映射以及摄像机的相对运动等,因此预测性能受到了一定程度的影响。针对块匹配算法的不足,提出了一种基于模式识别的运动估计算法,并将其应用到了立体图像视频编码中。主要研究内容包括: 首先,为了对现有的一些经典块匹配法进行深入的了解掌握,阐述了运动估计算法实现的基本思想,并对一些经典的块匹配法原理及实现步骤进行了详细介绍,通过对六组不同运动性质的标准测试序列进行实验仿真,比较了各种算法性能的优劣。 然后,针对块匹配法的不足,提出了运动模式识别算法。运动模式识别是基于无监督自组织映射(SOM)算法来实现的,对传统SOM聚类算法进行了三方面的改进:(1)为了提高码矢与信源匹配程度,提出了具有二维输入三维输出网络结构的三维SOM算法。(2)为了降低获胜码矢再次成为响应码矢的可能,在计算失真测度的过程中引入了频域敏感因子。(3)为了降低失真测度的计算复杂度,使用了一个距离不等式判据对失真测度进行修正。通过对两组视频序列进行测试,仿真结果表明:相比运动估计补偿算法,基于三维SOM的运动模式识别算法具有更好的预测编码性能,且重建图像的主客观质量都有所改善。 最后,将改进的三维SOM算法应用到了立体图像和视频的编解码中,实验结果表明:基于三维SOM算法运动估计得到的重建图像具有很好的峰值信噪比(PSNR)和主观质量,验证了运动模式识别算法在立体图像视频编解码中的可行性。