【摘 要】
:
随着三维点云技术的发展,人们不再满足于二维平面图像,开始向三维领域发展。深度相机可以从场景中获取三维信息,因此被广泛应用于需要更可靠三维信息的人机交互(HCI)和增强现实(AR)。由于深度相机由于其精度的提高并且变得更加便宜和流行,以至于可以部署在智能手机上,研究人员开始积极研究利用深度信息的三维计算机视觉。与深度相机拍摄的深度图像(称为2.5D信息)相比,研究人员试图将深度图像转换为三维点云或通
论文部分内容阅读
随着三维点云技术的发展,人们不再满足于二维平面图像,开始向三维领域发展。深度相机可以从场景中获取三维信息,因此被广泛应用于需要更可靠三维信息的人机交互(HCI)和增强现实(AR)。由于深度相机由于其精度的提高并且变得更加便宜和流行,以至于可以部署在智能手机上,研究人员开始积极研究利用深度信息的三维计算机视觉。与深度相机拍摄的深度图像(称为2.5D信息)相比,研究人员试图将深度图像转换为三维点云或通过多个捕捉设备捕捉三维点云表面。本文直接使用三维点云作为输入数据从而获取三维信息,避免了二维信息与三维信息之间的映射。同时相比于传统的二维卷积神经网络,我们采用对三维数据处理性能更好的图卷积网络(GCN)作为三维头部姿态估计的网络主干。本文还提出了一种基于三维可变模型(3DMM)的三维人脸重建和三维人脸对齐方法。我们不采用三维可变模型参数作为监督,而是利用三维头部姿态和三维人脸关键点来形成三维人脸重建和对齐的约束条件。本文的主要工作和贡献如下:1.本文提出了一种基于深度神经网络和三维点云的头部姿态估计方法。与现有的以二维彩色图像或二维深度图像为输入的方法不同,本文采用由深度生成的三维点云数据来估计三维头部姿态。为了进一步提高头部姿态估计的鲁棒性和准确性,本文将头部姿态的三维角度按5度区间划分为36类,并采用多层感知器(MLP)对估计角度处于每一类的概率进行预测。传统的头部模型构造迭代方法计算量大,存储开销大,但本文提出的方法以经过下采样的三维点云为输入,结合图卷积神经网络(GCN),具有计算量小、计算效率高等优点。在Biwi-Kinect头部姿态数据集上的实验结果表明,本文提出的方法在头部姿态估计方面取得了很好的效果,在精度上优于现有的头部姿态估计方法。2.本文还提出了在头部姿态引导下的人脸重建,并只使用三维人脸关键点和三维头部姿态作为监督。现有的基于三维变形模型(3DMM)的方法大多是在采用单个或多个图像作为输入,并使用三维可变模型的所有系数参数作为监督进行学习。然而,提供三维可变模型参数标注的数据集很少,精确的三维模型的获取也很不容易。为了解决这一问题,我们提出了一种姿态引导的人脸重建方法,该方法可以在不受形状和表情系数参数影响的情况下回归精确的三维人脸模型,我们采用三维人脸关键点和三维头部姿态作为约束条件。与上述的形状和表情三维模型参数不同的是,利用现有的最新方法,可以从在自然环境中采集到的图像中准确地估计三维人脸关键点和头部姿态,这意味着它们更容易获得。在300W-LP和AFLW2000-3D数据集上的实验结果表明,本文提出的方法成功地从单个彩色图像输入重建了精确的三维对齐人脸模型,三维人脸关键点的归一化平均误差(NME)达到了最先进的水平,同时在没有任何三维数据标注的Celab A HQ数据集上的进一步实验证实了我们提出的方法在自然环境中采集到图像上的可行性。
其他文献
病原微生物的防控工作已经成为我国卫生部门十分重视的一项工作。我国目前微生物鉴定工作存在的问题有:手工操作多、主观判断多、自动化程度低、微生物数据信息共享闭塞、国外市场垄断微生物检测核心技术等。针对以上问题,本文对病原微生物样本孵育拍照和后续处理的业务进行了调研与分析,设计并实现了病原微生物样本处理及孵育拍照系统的软件平台。本文通过对微生物检测业务的流程进行分析,分析了系统的功能需求,详细阐述了系统
无人机因体积小、成本低、部署灵活等独特优点在信息感知、情报侦察等众多领域内得到广泛应用。作为获取空间数据的重要手段,无人机中蕴含海量的高价值数据,致使它成为被攻击的主要对象之一。这一点可以从过去二十年中公开的无人机安全事件中得到证实,其中最著名的莫过于伊朗截获美军无人机事件。在无人机系统中,无人机数据链路的安全至关重要,它作为无人机机载端与地面控制端通信的纽带,为无人机的运行及各项任务的执行提供了
图像识别相关的深度学习技术在近些年取得了快速的发展。图像识别技术使机器具有了感知环境、识别物体的能力,极大推动了现代工业智能化的发展,可以看到有越来越多的相关应用相继落地。对抗样本通过在原始图像中添加人眼难以察觉的细微的扰动信息,就可以使深度学习模型产生错误的判别结果。对抗样本的存在给深度学习算法和模型造成了威胁,甚至影响了实际中相关深度学习应用的安全。特别是在自动驾驶、人脸识别和金融等对安全性要
近年来,物联网已经从一个新兴概念发展成为了现今社会的热门话题。物联网的应用场景已经不知不觉的渗入了人类社会的各个角落,同时伴随着嵌入式计算机系统、传感器器件、射频识别技术、近场通信、Wi Fi和Zig Bee等技术的进步。其中射频识别被认为是改变生活质量最有潜力的技术之一。电子标签与阅读器在超高频频段进行通信无需物理接触,读写效率高,结构简单,部署方便,能够适应各种应用场景的需求。然而受到硬件功耗
图像融合将来自多个传感器的图像进行组合,最终获取一幅信息更完整的图像。图像融合技术在医学领域主要应用于临床诊断,通过将病变部位的多模态图像进行组合,有利于医生更加准确地进行病变部位定位,提高诊断准确率。本文研究了基于反卷积神经网络自适应变换的CT/MRI医学图像融合算法。论文研究内容如下:提出了基于反卷积神经网络的图像自适应变换方法。为获得待融合图像的最佳变换,利用高斯方向滤波器设计具有不同截止频
唐19-12断块馆陶组具有构造幅度低、砂层薄、横向变化快等特点,本文对地震资料进行了攻关处理,在此数据基础上开展了精细构造解释,通过层控网格层析速度建模,运用变速成图技术,重新落实了唐19-12断块低幅度构造。通过钻井证明,运用该技术落实的构造形态与真实构造形态吻合度高,为唐19-12断块后期的勘探开发工作提供了技术支撑和井位部署依据。
水下无线光通信系统(Underwater Wireless Optical Communication,UWOC)拥有更高的数据速率,更低的时延和更好的安全性等特点,作为一种应用于军事和工业领域的关键技术受到广泛关注。但是UWOC也存在诸多问题,光束在水下信道传播时会受到海水吸收、散射效应以及海洋湍流效应的综合影响而产生严重的衰减。为了提高通信质量以及延长传输距离,可以采用信道编码等技术,同样也可
区块链是一种去中心化的分布式账本平台,作为分布式数据存储、对等网络、共识机制、密码算法等技术的集成,具有去中心化、可溯源、不可篡改等特点。近些年来,应用场景多元化的需求助推了区块链技术的迅速发展,逐步诞生了以比特币、以太坊、超级账本为代表的区块链平台,其系统安全性主要由经典密码学中基于大数分解或是离散对数问题的公钥密码算法和哈希函数提供保障。然而,随着量子计算机的问世,上述主流区块链平台均面临着以
遥感图像的语义分割是遥感图像处理中的一种重要方法,它能为后续的图像识别和场景理解提供必要的基础。遥感图像分辨率大且场景比较复杂、目标尺寸差异大和存在易混淆的物体,这些都会给分割的任务带来更多的挑战。针对上述的这些问题,本文的主要研究内容如下:(1)提出了基于多尺度自适应权重信息流融合算法(MWFNet)用于遥感图像语义分割。为了解决遥感图像的目标多样性和尺寸差异大的问题。提出多尺度编码模块,使用5
在现代战争中,军用飞机扮演着越来越重要的角色。面对严峻的防空环境,作为博弈的一种有效手段,飞机突防技术也趋向于综合化、复杂化和智能化,突防难度越来越高。设计优良的突防航路可以有效缩短航路长度,提高突防成功概率,为作战任务的成功实施提供保障。因此,对突防航路规划技术的研究需求变得越来越迫切。本文针对复杂防空环境下的突防航路规划问题,通过分析不同典型威胁源的特性并建模,生成威胁数字灰度地图。根据飞机进