若干关于图像与视频的编辑与合成技术的研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:ppl_fox
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数字技术的发展,数字图像与视频在工业自动化、影视后期制作等领域,逐渐得到了广泛的应用。图像和视频的编辑与合成是图像和视频处理的一项重要技术,而传统的图像和视频的编辑与合成方法是相互之间彼此独立的处理过程,且需要人工利用多种设备进行大量的繁复操作。近年来,抠图(matting)、颜色转移和匹配以及前景消除等图像和视频的编辑与合成技术得到了广泛的研究和应用,并在多种应用中取得了一定良好的效果,但这些方法只是提供了初步的解决思路,仍然无法普遍适应地处理具有各种特征的图像和视频。   传统的图像和视频编辑工作主要目的是由用户从大量的图像和视频片断中寻找合适的部分进行手工裁剪和拼接的直接操作。虽然近年提出的抠图(matting)技术可以精细地处理每帧图像的内容,并可以描述后续的合成过程,但这种方法需要采用某些额外的处理来粗略确定源图像中的前景区域或背景区域,以构造下一步合成工作的材料;而传统的颜色匹配过程则完全需要经验丰富的美术师来手工对每一幅图像或视频中的帧进行色调、亮度等参数的调整,尽管基于数字设备的颜色匹配处理可以完成整体性的色调拟合,但只能针对包含单一场景的图像进行处理;传统的前景消除是电影后期处理中的一个重要手段,主要由美术师手工来逐帧完成,尽管一些技术可以针对特定的前景进行半自动的移除处理,但是有受前景特征影响的局限性。因此,作为当前研究的热点,图像与视频的抠图、颜色匹配、前景移除等技术仍然需要进一步的改进和提高,其处理的效率和效果对图像和视频编辑与融合在各领域的应用有十分重要的意义。   本文面向影视后期制作和家庭视频娱乐等应用领域,对图像和视频的抠图(matting)、颜色转移和匹配以及前景消除等技术在特定领域的应用展开研究,试图减少用户的交互操作量,同时保证高质量的图像和视频编辑和生成效果。为此,本文进行研究和探索的方面包括:一、降雨和降雪环境下视频的雨雪前景移除;二、研究便捷的抠图方式,探讨利用附加信息对不连续区域的半透明前景对象进行抠图的方法;三、探索便捷的层次化结构的颜色匹配技术,使得用户可以方便地校正图像和视频局部区域的颜色属性。   基于上述目标,本文主要的研究工作包括了如下的内容:一、提出了一种基于时间滤波器的视频中降雨和降雪前景移除的方法。通过分析降雨和降雪环境所具有的独特光学特征,可以发现视频中的雨雪总是具有显著超过背景的亮度,同时,雨雪在空间中的分布具有广义静态的特性。基于这两个基本事实,我们提出了利用时间滤波器在时间轴上来寻找视频中非雨雪场景的互补信息的方法。这种方法关键在于设计对亮度敏感的时间滤波器形式以及时间滤波器所需的滤波周期长度,为了进一步保证时间滤波器的处理效果,必要的滤波处理效果评价标准也是算法设计的一个部分。因此,时间滤波器形式、滤波周期确定方法、滤波效果评价标准是这一工作的三个组成部分,而这三个部分也构成了视频中雨雪移除处理过程的三个步骤。   二、提出了一种基于附加信息的抠图(informed matting)方法。现有的抠图方法很少考虑视频中不连续区域的处理,基于降雪视频环境的光学特征,我们提出了一种利用额外背景信息进行降雪类半透明对象抠图处理的方法。降雪环境的视频可以获得移除雪花前景后的背景信息,这一附加信息可以提供降雪前景在视频中区别于背景的突出特征。我们通过在闭形式抠图算法中加入对背景信息的处理来获得对抠图过程的附加约束,使得闭形式抠图方法简化了求解过程中的未知量。进一步地,利用视频中背景与前景的梯度差异来指导对雪花形成的不连续区域进行自动的三分图构造,从而实现了闭形式解抠图的方法在降雪视频中对雪花前景的抠图处理。   三、提出了一种基于层次化结构的颜色匹配方法。现有的颜色匹配方法大多是对图像进行整体性的颜色分布测量,对场景组成复杂的图像之间的颜色匹配常会出现颜色扭曲的现象,而复杂场景图像的构成显然是由多个成分较单一的区域组成的,因而对复杂图像进行区域分解后再进行区域间颜色匹配是一个合理的处理方式。我们利用层次化分割对图像进行区域分割并形成具有层次化结构的树状结构,通过定义树状结构之间的构成形式,对颜色匹配图像之间的区域特征相似性进行比较,以寻找目标图像与参考图像局部匹配的最佳区域。在此基础上,我们利用颜色概率分布转移的方法在图像的不同区域上进行局部颜色匹配以实现保持目标图像视觉特征的目的。
其他文献
微粒群优化算法(Particle Swarm Optimization,PSO算法)源于对生物界鸟群群体运动行为的研究,通过群体间个体的合作与竞争来实现对优化问题的求解,是一种群智能优化算法,由于它的原
学位
近年来,随着WWW的迅猛发展,XML成为数据交换事实上的标准,XML数据的应用也越来越广泛。例如:在金融领域,网络安全,制造领域,监控检测领域等。随着研究的加深,对于基于半结构
现代社会的信息化和网络化给人们的生活带来了方便快捷,但随之而来的信息安全隐患也日益明显,加密技术则是解决这一问题的有效方法。2001年11月26日,美国国家标准技术研究所(
胃脘痛(胃痛)是一种上腹近心窝处发生疼痛的疾患,是临床中的多发病。胃镜检查是诊断胃病最常见、最准确的方法,胃脘痛胃镜下表现呈多态性。因此,本文基于胃镜图像对胃脘痛特
作为传统加密方法的有效补充手段,数字水印技术被认为是解决数字化时代数字作品版权保护的一个重要手段,并成为信息安全领域的一个研究热点。数字水印技术是指在数字化的多媒
近年来,作为软件应用的一种重要方式,web服务发展迅速,许多web服务提供相同的功能。服务组合的含义就是把多个小粒度服务组合为一个大粒度服务,它是用户利用多种多样的web服
随着大数据时代的到来,用户对信息搜索的精确度和效率提出了更高要求,而传统的搜索引擎存在着一定的不足。聚类检索是对搜索引擎的返回结果聚类,然后将提取的标签和类簇呈现
随着互联网和信息技术的不断发展,文本形式的非结构化数据正在不断的增加。文本分类技术能够有效地对文本数据进行组织和处理,广泛地应用在各个领域。文本分类的预处理、特征
并行测试技术是ATS (Auto Test System)在进一步降低测试的时间、削减测试的成本的趋势下新兴的一项技术,它正以不可比拟的优势成为下一代ATS发展的热点。在运用并行测试技术
随着三维模型的大量产生,三维模型检索技术逐渐受到学者们的广泛关注。其中比较主要的检索方法是基于内容的三维模型检索,而基于内容的检索技术的核心是特征提取。本文在借鉴