基于内容多媒体应用的语义视频对象提取及评价

来源 :上海大学 | 被引量 : 0次 | 上传用户:jtgdz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的视频压缩编码标准MPEG1/2和H.26x都采用基于帧的技术,不要求对场景进行分割。它们能获得较高的压缩比,并在许多领域得到了广泛的应用。随着多媒体信息的日益丰富,人们不再满足于对视频信息的简单浏览,而要求提供基于对象的操纵、交互等功能。为此,MPEG-4引入视频对象的概念,以支持基于对象的交互性和可分层性。MPEG-7则对各种媒体对象进行统一和规范化的描述。按照MPEG-4的校验模型,视频序列必须先分割成具有语义意义的视频对象,然后对其运动、形状和纹理分别进行编码。视频对象的应用价值主要有:对不同的视频对象按其对视觉重要性分配不同的码率,可提高压缩编码效率;支持对象可分级,在较低的网络带宽时获得更好的视觉效果;用视频对象来组织视频内容,能实现基于视频内容的存储、交互和查询等功能。 然而,MPEG-4尽管引入了视频对象的概念,它并没有指定从视频序列获取视频对象的具体方法。一方面,视频对象的语义一致性难以通过视频的低级物理特性来建模,使得针对各种视频序列的通用视频对象分割算法是一个尚未解决的经典难题;另一方面,针对特定的应用,往往可以利用先验知识设计相应的算法。 本论文重点研究MPEG-4框架下的从视频序列中分割出视频对象的方法和技术,以及其在基于内容多媒体中的应用。研究目标是:对特定类型的序列如头肩序列,算法满足实时性要求;对背景静止的序列,全自动分割算法取得较好的分割效果;对复杂背景和前景运动视频序列,采用半自动分割算法,要求得到较好的分割质量,而且人机交互简单。具体地,本文研究的主要内容和贡献包括: 提出了两种全自动的视频对象分割算法。第一种采用背景记录和变化检测,主要由预处理、背景记录、背景缓冲、变化检测和后处理等几部分组成。它不需要诸如运动估计、特征空间分析等计算量大的操作,并能有效去除阴影和光照变化造成的影响。它能够生成背景信息,支持MPEG-4的精灵编码。第二种是一种基于时空分割融合的视频对象提取改进算法。时间分割基于变化检测,其关键的阈值选取是通过直方图分析得到的。空间分割是本算法的核心,采用基于小波变换的分水岭变换算法。 提出了一种半自动的视频对象分割算法。为方便用户定义初始对象轮廓,提出了一种修杨高波基于内容多媒体应用的语义视频对象提取及评价 改的智能剪.它通过引入边界框、简化代价函数和改进搜索策略等,可提高优化路径搜索速 度约6一8倍,而几乎不损失分割精度,完全满足半自动分割算法对初始对象轮廓勾勒的要求。 为克服对象跟踪过程中的误差积累,按视频对象的刚性、非刚性以及全局、局部直方图比较 进行视频分解得到后续帧的视频对象。由于视频分解以及人工参与,它可以在很大程度上解 决遮挡问题,取得了比COSTZll AM更好的分割效果。 针对目前的视频分割算法大多数难以满足实时性要求,采用了一种新的计算体系结构, 即将细胞神经网络引入视频对象分割.细胞神经网络是一种非线性模拟电路,由大量胞元组 成,且只允许最邻近的胞元间直接通信。由于它具有的高度并行的实时处理能力和机理类似 于人类视觉系统,特别适合于图像处理等领域。然而,与传统的CISC处理器相比,CNN只 能利用一些简单的基于像素的函数,有相对狭窄的指令集一尽管有很高的速度。因此,基于 O四体系结构的视频对象分割算法的关键是充分考虑到经胞神经网络的特点,将复杂的视频 分割算法分解为一些CNN胞元能够完成的低级操作。论文提出基于彩色边缘变化检测的视频 分割算法。所有的模板都是3x3的线性模板,并能在CNN的模板库中得到,因此,其易于CNN实现。 本文提出了一种客观的存在参考分割时分割算法评价方法。视频分割算法往往只适合特定的应用,其性能依赖于具体的序列。目前,视频分割算法的性能评价以对己知序列的分割结果的主观评价为主,尚没有一种广泛接受的客观评价方法。视频分割算法的评价是重要的,它有助于针对具体的应用选取合适的算法并设置恰当的参数,以及有利于通过融合各种算法的优点发展新的算法;而且,自动分割算法采用性能评价作反馈可改进分割性能。空间精确度通过相对前景面积、位置、边界像素距离以及像素分类来进行,并将其按对人类视觉系统的重要性线性加权。而时间一致性反映分割算法分割各帧时的稳定性,它通过空间准确度的变化‘来刻画。实验证明,其评价结果与主观评价结果一致,而且计算量小。 综上所述,本论文系统地研究了MPEG4框架下的语义视频对象分割问题,根据具体的问题提出了满足实际需要的全自动、半自动分割算法,并探讨了在存在参考分割的情况下客观地评价视频分割算法性能的方法。
其他文献
利用现有网络条件,提供良好的视频质量,是面向通信传输的视频系统需要长期面对的问题。本文研究的重点是在IP网络环境变化的情况下,实时有效地控制视频质量,保证给终端用户提供良
目的探讨颈部坏死性筋膜炎(cervical necrotizing fasciitis,CNF)的病因、诊断和治疗,从而提高外科医生对坏死性筋膜炎的认知度。方法回顾性分析上海交通大学医学院附属仁济
<正>痛风(gout)是由于嘌呤生物合成代谢增加,尿酸产生过多或因尿酸排泄不良而致血中尿酸升高,尿酸盐结晶沉积在关节滑膜、滑囊、软骨及其他组织中引起的反复发作性炎性疾病。
会议
结合北京植物园现有情况,通过对水系工程的可行性、自然景观的创造以及水系工程的生态保护等方面的论述,阐述了水系工程的实施,对合理截流雨水,创造适合水生、湿生等植物的生
摘 要:中医早在《内经》即已有外感风邪引起感冒的论述,如《素问·骨空论》说:“风者百病之始也,……风从外人,令人振寒,汗出头疼,身重恶寒。”本文将浅要谈谈中医如何治疗感冒。  关键词:中医;治疗;感冒  感冒,俗称伤风,是感触风邪或时行病毒,邪犯卫表,引起肺卫功能失调,临床表现以鼻塞,流涕,喷嚏,头痛,恶寒,发热,全身不适等的一种外感病。本病四季可发,尤以春冬为多。轻者为感受当令之气,称为伤风、冒
如今,网络已成为每个人都无法离开的主要生活方式。“半小时全省知道,一小時全国知道,两小时全世界知道。”这是一位省级领导面对如今网络媒体所发表的感慨。微博、微信、各种公众号、短视频等新兴媒体的兴起,给社会注入了强大的生命力,但同时也给传统媒体(报纸、电台、电视台)带来不小的竞争和压力。与此同时,也带来了很多问题,特别是网络媒体假新闻层次不穷,还有一些自媒体打着监督的晃子,行谋利益之实,这使媒体的公信
CDMA 自组织网络作为一种高保密性、高性能的无线网络,在军事、抢险及商业领域中具有广阔的应用前景,然而CDMA 技术与自组织网络的结合仍然面临许多严峻的挑战。本论文探讨了
摘 要:本文立足于现实分析学生参与性学习对高中音乐鉴赏教学的重要性,然后针对高中音乐鉴赏学生参与性教学现状及存在的问题提出一些有效措施,以期对高中音乐教学的发展贡献有一定的积极意义。  关键词:高中音乐;教学;参与性  学生参与性教学是新形势下提出的一种新型教学理念,意在激发学生对音乐鉴赏课程的兴趣,从而主动参与到教学中,以自身的音乐体验为标准对音乐鉴赏课程进行感受,这种教学理念对于高中学生学习音
护理关怀能力不是与生俱来的,需要教育的引导和经验的积累才能逐步形成
建立在四川丰富人文基础上的四川饮食资源,是一个不可多得的宝藏。本文在对四川饮食资源充分分析基础上,从旅游资源开发的角度,提出了建立川菜资源博物馆,设立川菜质量标准体