论文部分内容阅读
随着Internet普及和数字音视频技术发展,出现了许多新的网上服务,例如网络电视、网络游戏、网上求医和网络教育等。可以预见,传统电视将很快被网络电视所取代,人们收看电视将从传统被动接收频道(即直播应用,或PUSH应用)转变为主动选择内容(即点播应用,或PUSH应用)。为了适应用户需求和应用模式的变化,在网络电视领域,就需要研究音视频流化、可靠组播、音视频内容的结构化分析、基于内容的音视频信息检索等技术。 本论文以网络电视的两种基本应用方式—直播应用和点播应用为主线,研究了网络电视所涉及的若干关键技术。本文在研究视频内容的结构化分析,视频流化传输的基础上,对其中的一些关键技术,如:镜头边界检测、视频流中的运动分析、视频可扩展编码、错误隐藏、视频转码等问题做了深入研究,提出了一些新的思想和方法。具体内容包括: 1.提出了压缩域中叠化(Dissolve)镜头的快速检测算法:由于叠化镜头是发生镜头切换的两个相邻镜头在时间和空间上的融合,叠化镜头是各种类型的镜头切换中最难检测的一种。本文根据叠化镜头内部预测帧误差能量分布特点和运动矢量分布特点,采用滑动窗口方法,提出一种在压缩域中检测叠化镜头的新算法,它可以准确地定位出大部分叠化镜头。 2.提出了压缩视频流中主要运动的定性分析算法:根据运动矢量的分布特性、运动矢量之间的相对关系特性等,提出了一种压缩视频流中主要运动的定性分析算法。实验结果表明该算法具有速度快、精度高、鲁棒性好等特征,非常适合于视频信息检索方面的应用。 3.实现了基于频域的视频可扩展编码方法:将视频数据根据重要性划分成不同的层,分别用不同服务质量的信道传送是提高视频流化传输质量的一个有效方法。本文对MPEG-2标准推荐的频域可扩展编码方法一数据分割(Data Partition)方法进行了部分改进,减小了数据分割所带来的数据冗余,并给出了一个基本层和增强层数据同步的具体方法。 4.提出基于镜头边界检测的时空自适应错误隐藏算法:时域错误隐藏计算开销小,隐藏效果好,是常用的错误隐藏方法。但是在镜头的边界,时域错误隐藏会失效。本文提出一种新的错误隐藏算法,它利用视频解码器在解码过程中得到的副产品信息,判断当前发生错误的帧是否是镜头边界。如果当前帧是镜头边界,则使用空域错误隐藏方法;如果不是边界,则使用时域错误隐藏方法。试验结果证明,所提算法具有速度快,系统开销小、隐藏效果好等优点,非常适合于