基于ROI的可伸缩视频编码技术研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:lanshi2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展和新型的多媒体业务出现,多媒体的应用环境变的越来越复杂,网络异构化以及终端设备多样化对传统视频压缩编码技术提出挑战。针对传统视频压缩编码技术不能满足未来应用需求的现状。联合视频组提出了一种新型的视频编码方法,即可伸缩视频编码(SVC,Scalable Video Coding)。可伸缩视频编码的编码器将原视频序列编码成一个基本层码流和一个或者多个增强层码流。当传输带宽有限时,编码端只发送基本层的数据,而接收端解码出来的视频质量也只是达到人们所需的基本要求。而当带宽足够大时,编码器则发送基本层和包含额外信息的增强层数据。利用基本层和增强层的数据解码,接收端能得到较好视频质量。本文在对H.264/AVC和SVC的关键技术研究的基础上,对基于感兴趣区域的可伸缩视频编码的方法展开了研究工作。   本文首先对H.264/AVC和SVC的关键技术进行了分析,在简要的介绍了H.264标准的特性后,重点研究了H.264中的FMO(Flexible Macroblock Order)技术。并详细描述了可伸缩视频编码中的关键技术,为本论文后续研究提供了理论基础。   然后,对运动目标的检测技术进行了研究。结合感兴趣区域的理论基础,并在C平台上对感兴趣区域的检测技术进行了实现,并分别采用改进基于块的帧间差分算法和基于宏块的运动矢量信息检测运动区域算法进行仿真测试,取得了预期的效果。   最后,将感兴趣区域与可伸缩编码技术结合起来,在JSVM平台上实现了基于ROI的可伸缩视频编码算法。先对ROI区域的宏块进行可伸缩视频编码,而非ROI区域的宏块被跳过。这样,将更多的带宽分配给ROI区域,即使带宽降低,ROI区域的图像的客观质量不会明显下降。然后,采用FMO技术与可伸缩编码技术结合的算法,该算法先用FMO技术将视频序列里的每一帧分割成前景和背景区域,然后再进行可伸缩视频编码,将更多的码流分配给前景区域,而背景区域只分配少量的码流,当网络带宽下降时,前景区域的主客观质量可以保持不变,只是背景区域的图像质量会下降。这两种算法都达到了基于感兴趣区域可伸缩编码的目的。
其他文献
车辆的爆发式增长和无处不在的信息需求将通信网络与交通网络紧密结合起来,车载通信网由此应运而生,并成为一个研究热点。车辆间的通信形成了一种自组织的、结构开放的车载自组
随着第三代移动通信系统的研究和正式商用,无线网络的发展也逐渐凸显出其优势。但是,3G时代的来临还并不能立马宣告2G时代的结束,无论是从网络服务质量的需求上或是现网用户数占
随着低密度奇偶校验码(Low Density Parity Check Code,LDPC)被重新发掘出它具有非常好的误码率性能以及编译码较简单的潜能之后,已经成为继Turbo码之后另一种纠错编码的关注重
随着人工智能技术的蓬勃发展,作为人机交互接口的语音识别技术也受到国际各界学者的广泛重视。目前商用的语音识别系统在室内高信噪比环境下已经取得了较高的识别率,但对于室外
气体传感技术被广泛应用于工农业生产、环境监测、医疗卫生以及军事等领域。传统的非光学式气体检测仪虽然可以达到较低的检测限,但是很容易受其它气体成分的交叉灵敏,而且其
线控转向系统是一种新型转向系统,取消了方向盘与转向轮之间的机械连接,可灵活设计其角传递和力传递特性,对提高汽车的操纵稳定性、驾驶舒适性和主动安全性有重要意义。路感
RFID技术是一种非接触式的自动识别技术,主要由阅读器、标签和天线三部分组成。随着技术的进步,RFID应用领域日益扩大,现已涉及到人们日常生活的各个方面,并将成为未来信息社
随着图像处理技术、模式识别、自动控制以及计算机视觉等领域的高速发展与进步,视频监控系统被广泛应用于军事安全和民用安全领域。多摄像机系统具有监控范围大、监控角度广的
全光存储和缓存是光分组交换网络在解决输出端数据竞争问题、实现全光路由的关键技术,如何使光波群速度减慢来实现光存储和光信息处理已经成为近年来国内外研究的热点问题之