2D-3D视频系统中深度图传播算法的研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:lsh19
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
立体视频技术不断发展,将在娱乐、医疗、教育等方面发挥重要作用。与传统2D视频相比,3D视频能够更加真实展示场景画面,给观众带来沉浸式体验。3D显示设备数量的快速增长导致消费者市场对3D片源需求非常迫切。优质的3D片源短缺已经成为制约3D视频产业发展的重要因素。2D-3D视频技术是一种高效制作3D片源的方式。此外,2D-3D视频技术可以将经典的传统2D视频生成3D视频,产生巨大的商业价值。目前,商用化的2D-3D视频制作主要依靠人力,制作周期长。半自动2D-3D在保证深度图质量的同时,可以有效地降低人力成本。半自动2D-3D技术利用人机交互给出关键帧的深度值,通过深度图传播算法得到其余帧的深度信息;最后通过虚拟视点合成技术得到最后的3D视频。深度图传播算法是在半自动2D-3D系统中的重要步骤,针对现有算法的不足,提出了两种改进的深度图传播算法。本文提出了基于结构优先的深度图传播算法。目前基于运动矢量和双边滤波的深度图传播算法对运动估计误差敏感以及在遮挡区域容易带来深度传播误差。针对这两方面问题,结构优先的深度图传播算法利用视频的时域连续性设计了两种不同的深度传播策略。视频帧分成一致性区域和非一致性区域。在一致性区域使用位移双边滤波算法得到深度传播结果。在非一致性区域,错误的运动估计和物体遮挡的发生,基于运动的深度传播算法会带来传播差错。非一致性区域深度的空洞填充问题被定义为马尔科夫随机场估计问题,用改进的结构优先置信传播算法求解。张量投票算法被用来预测空洞区域的结构显著性。利用结构显著性信息,本文提出的结构优先的置信传播算法可以提升置信传播算法计算效率,保护深度图结构性。基于张量投票的深度图传播算法首先生成稀疏点集的深度信息,通过基于张量投票的插值算法得到完整的深度图。张量投票算法在两个方面发挥作用。利用四维张量投票算法,排除特征点集合中的错误匹配,保证利用运动信息估计的像素点的深度估计的可靠性。其次,通过张量投票算法计算得到高维空间的局部平滑结构,建立位置、运动和颜色特征与深度信息的相关性。进一步,令输入特征投影到切面空间中,在稀疏点集的邻域内进行深度值插值,得到稠密的深度图。基于张量投票的深度图传播算法在前景物体快速移动和遮挡情况下都能够可靠的估计深度信息。实验结果证明,基于张量投票的深度传播算法相较于现有的算法有明显的性能提升。
其他文献
合唱指挥的重要职责就是带领合唱团或乐队向观众传达音乐作品的核心思想。合唱指挥主要通过肢体语言向队员传递信息,指挥通过这些身体语言将情感和思想传达至队员处,从而形成
新中国成立初期,虽然没有提出过文化软实力概念,但却是我国文化软实力发展最快、影响最大的历史时期之一。新中国成立之际,把新文化放在与新经济、新政治同等重要的战略地位加以
讨论苛化液配制的原理,以及如何确定灰乳与碱液的体积比,以降低精盐水中Mg^2+、Ca^2+的含量,并推导出苛化液中NaOH、Na2CO3浓度的计算公式,并根据这些公式指导精制除Mg^2+、Ca^2+的自
当下基层政党建设如何开展,已经成为中共执政的核心命题。中国的社会变迁为中国共产党的政党建设提供了基础的社会背景,而要实现执政党的党建使命,就要转变传统基层党建的封
目的:建立可溶性共刺激分子CD80的免疫放射分析方法(IRMA),探讨其临床应用。方法:①采用Iodogen法进行抗CD80单抗10D9的125I标记,分别改变Iodogen的用量、抗体的用量、125I的
<正>预计到2020年,新能源汽车累计产销量将达到500万辆,动力电池报废量将超过24.8万吨,全社会将面临动力电池"报废潮"在今年的政府工作报告中,有一个产业被三次提及,那就是新
《阅微草堂笔记》的文化意蕴存在着明显的二律悖反:一方面,作为比较开明的封建官僚,纪晓岚的思想观念中时常闪烁着民本主义思想的光辉。另一方面,对封建礼教的维护,又使他在《
通过对教练员在社会中所扮演的角色进行分析,使之找准角色定位,清楚角色规范———职业道德,从而更好地去扮演自己的角色。
目的研究亚胺培南联合头孢派酮舒巴坦治疗多重耐药鲍曼不动杆菌与单药应用头孢哌酮舒巴坦治疗多重耐药鲍曼不动杆菌的疗效比较。方法将ICU收位的46例感染多重耐药鲍曼不动杆