论文部分内容阅读
光场通过记录场景的光线信息描述场景,提供场景信息的新型参数化描述,可有效支持焦距重调、场景深度估计、任意视点的显示及绘制等特殊应用。因此,光场获取及应用研究成为计算机视觉及计算机图形学等领域学者关注的热点之一。 目前,光场获取设备主要是通过组装或改造传统光学相机获得,目的是使之能够记录光线的角度信息,称为光场相机。光场相机的研究集中在光学元器件设计以及重构算法两方面,然而光场数据的高维结构导致获取数据量庞大,因此如何设计有效的压缩采样并高质量重建原始光场成为光场相机的研究热点之一。为此,本论文在压缩感知理论指导下,结合光场数据特性,对光场相机设计、光场重建算法以及针对特殊对象“手势”的表面光场重构等关键问题进行了深入研究。论文成果及创新点如下: 1.一种基于编码光圈的高分辨率光场获取方法 提出了一种新的光场获取模型,其核心为基于角度和空间维度多路复用压缩获取采样光场,并利用压缩感知原理进行后计算重建光场。该方法用较低代价获取较高角度和空间分辨率的光场,实验结果表明,该方法相比已有光场相机有较高的重建质量。 2.一种基于张量字典的动态光场重建方法 针对特定场景以图像集合形式记录的光场在角度和空间维度上具有良好结构的特性,以及基于张量形式表示的计算能够更好地利用数据本身结构属性的特点。本文提出了一种基于张量字典的动态光场重建方法。该方法适用于任何基于掩膜的压缩感知光场相机获取数据的重建,且由于只需要单张压缩采集图像即可重建光场,因此适合面向动态场景的光场获取,另外由于张量字典数据量较小更有利于动态光场数据的存储和传输。 3.基于稀疏多视点视频手势的表面光场获取 表面光场是三维网格结构顶点发出的任意光线的辐射度函数,有助于减少深度场效应。表面光场采样时需要相对少的相机数目,且允许相机设置在逼近表面以外的任何区域。基于此,本文针对手部运动的刚性特点,给出一种基于稀疏多视点视频获取特定手势表面光场的方法。该方法改进Laplacian网格变形技术,实现一般三维手模型到多视点图像对应特定三维手模型的变形,避免了直接扫描模型的操作复杂、模型粗糙、数据量大等缺点。任意视点及任意时刻手模型绘制的实验结果表明,基于多视点视频获取手势表面光场的方法是有效的。 4.面向高维空间对象分类的乘积Grassmann流形上嵌入式最小二乘方法。 光场数据包含了丰富的角度信息,不仅对建模绘制有效,对分类也是有效的。基于此,本文针对张量形式数据表示,将其转化成乘积Grassmann流形上的点以挖掘其结构特征,并提出乘积Grassmann流形上的嵌入式最小二乘方法,给出分类策略。以视频为例验证所提方法是有效的。