论文部分内容阅读
随着视觉信息采集硬件设备和计算机计算能力的不断提升,计算机视觉技术在国家安防、无人驾驶、辅助医疗、精准农业及影视娱乐等领域被广泛应用。通过计算机视觉信息对周围环境精确感知和理解,已经成为人工智能时代科学研究的重要课题。突破传统投影成像,恢复场景三维结构;对感知到的三维点云数据精确分类;增加多光谱感知,提供物质谱信息。这些高维视觉信息的感知成为了智能决策的重要输入信号。然而,受成像环境的复杂和成像技术的固有缺陷等因素的影响,获得高分辨率的数据时更容易引入噪点,高维视觉信息的低质严重影响后续理解和决策。针对视觉信息的精确三维结构重建、三维点云视觉信息分类、高光谱图像精确重建三个重要高维视觉信息感知问题,本文在现有的信号稀疏表示及恢复的工作基础之上,结合高维视觉信息自身特点,以低秩高维视觉信息恢复为主线,建立了一个完整的高维视觉信息精确感知研究框架。本文分别实现了高维视觉信息的张量表示及稀疏度量、矩阵低秩的多视角三维模型精确重建、基于几何特征的三维点云视觉信息精确分类、张量低秩的高光谱图像精确重建。主要工作和创新点包括以下几个方面:1.提出了利用张量核范数为稀疏度量的高维视觉精确恢复思路。分析了现有的矩阵稀疏为先验的信号恢复模型,并对稀疏模型的不同求解算法进行分类总结。对于更高维的视觉信号,依据张量保结构、方便建模等优势,本文使用张量表示高维视觉信号,通过张量奇异值分解度量张量稀疏,以实现高维视觉信息的恢复。2.提出了基于矩阵低秩的三维模型重建方法。充分利用连续变量假设的变分能量泛函点云估计模型,调解不同模型参数,生成多组点云数据,这些数据包含了丰富的模型点云信息(单独一组数据仅细节丰富,或者仅整体平滑)。将多组点云数据构造低秩矩阵,建立精确点云提取的低秩矩阵恢复模型,运用加速近邻梯度算法(APG)求解模型,得到了模型的精确三维点云数据。3.提出了基于几何特征的点云数据精确分类方法。根据树木点云数据固有几何特征,树干类似柱状,地面似平面状,树叶似小平面。我们利用几何特征直方图作为描述子,训练了支持向量机为分类器,实现了三维点云数据的精确分类。4.提出了基于图正则的张量低秩分解的高光谱图像去噪方法。分析高光谱图像的非局部相似性和光谱相关性,用张量低秩约束光谱图像的光谱相关性,用图正则约束光谱图像的非局部相似性,建立了图正则的高光谱图像去噪模型。应用乘子交错方向算法(ADMM)实现了模型又快又准的求解。该方法是流行学习和张量分解的最新结合,也是矩阵恢复模型在张量的自然推广。上述理论和算法在标准数据库测试和实际拍摄数据集中均取得了良好的结果,可以实现高精度、高完备的三维模型重建,三维点云数据的精确分类,严重污染的高光谱数据精确恢复。本文提出的低秩优化的三维重建方法在Middlebury数据集测评结果排列前三,基于几何特征的三维点云精确分类在公开数据库中比CRF方法提升5个百分点,图正则的鲁棒张量低秩分解的高光谱图像去噪方法在公开数据库和实拍数据实验中比经典的BM4D分别提高了0.17db(PSNR)和 0.02(SSIM)。