【摘 要】
:
近年来,随着社会发展与科技进步,2D图像物体检测在许多方面取得了很大进展。然而,在自动驾驶或增强现实(AR)的许多应用中除了获得2D边界框之外,还需要3D理解。目前随着在移动设备和自动驾驶车辆上3D传感器的普及,许多3D数据被获取和处理。因此,对于3D的理解也就变得格外重要。本文主要研究三维物体检测,它是对物体类别进行分类,并估算物理对象的三维边界框。目前3D物体检测常见的其中一种方法是基于二维驱
论文部分内容阅读
近年来,随着社会发展与科技进步,2D图像物体检测在许多方面取得了很大进展。然而,在自动驾驶或增强现实(AR)的许多应用中除了获得2D边界框之外,还需要3D理解。目前随着在移动设备和自动驾驶车辆上3D传感器的普及,许多3D数据被获取和处理。因此,对于3D的理解也就变得格外重要。本文主要研究三维物体检测,它是对物体类别进行分类,并估算物理对象的三维边界框。目前3D物体检测常见的其中一种方法是基于二维驱动实现的,在实际场景检测中有很大局限性。比如光照、遮挡、信息表达单一等问题。为了解决点云密度不均匀导致点特征丢失问题,点云特征提取的不够准确性问题,以及边界框预测不准确的问题,本文研究了点云分割的网络框架,多视图融合的网络框架,以及在特征提取过程增加注意力机制的网络框架。主要研究内容如下:1、针对RGB-D数据的三维物体检测中采用均匀采样点云进行训练导致在实际场景下点云准确率下降的问题,本文提出用Point Conv网络进行检测,来解决部分关键点云特征的丢失问题。本文提出的方法在充分考虑了输入点的排列不变性情况下,使用直接计算点云的神经网络更有利于点云进行分割。同时考虑到Point Net缺少对局部特征的提取,缺乏识别细粒度图案和应用到复杂场景的能力,以及在采样时未考虑密度信息。现实场景中的点云往往是疏密不同的,Point Conv网络正是通过增加密度稀疏区域的权重,让稀疏区域的关键点不丢失,从而让点云特征输出更准确,因此,采用Point Conv网络进行3D实例分割和3D边界框评估,可以得到更准确的结果。2、针对受到串行结构的影响,3D边框估计的结果严重依赖于2D检测的问题,本文提出将Res Net网络提取的RGB图像特征和Point Net网络提取的点云特征进行融合,应用到3D实例分割模块,通过以上方法来提高3D物体分割和3D边界框评估的准确性,解决2D检测可能出现漏检现象导致3D点云数据的不准确性问题。融合网络将使用Res Net网络提取的图像特征和由点云通过Point Net网络产生的相应点云特征作为输入,然后将这些特征进行融合。融合特征的过程相对提高了特征的准确性,并对某些特征加以补充,很大程度上解决了3D边框估计的结果严重依赖于2D检测的问题。3、针对输入的点云数据出现光照与遮挡情况导致特征提取不准确问题,以及最大池化方法破坏点云的信息结构,导致局部特征表达能力弱的问题,本文提出了一种基于卷积注意力机制(Convolutional Attention Mechanism,CAM)的3D物体检测方法。CAM首先在传统特征提取网络结构的第一层和最后一层添加注意力机制,然后将不同层的特征信息进行融合,最后进行归一化操作。CAM实现局部与全局信息融合的同时,显著提高了在光照和遮挡场景下物体检测的准确性。
其他文献
窄带物联网(Narrow Band Internet of Things,NB-IoT)作为实现万物互联的一个重要通信技术,旨在为低吞吐量、低功耗和远程通信的大规模物联网设备提供无缝连接。NB-IoT构建于蜂窝网络,只消耗大约180k Hz的带宽,可直接部署于GSM网络或LTE网络,实现网络的平滑升级,以降低部署成本。在传统的异构蜂窝网络中,由于宏基站和小基站之间存在功率方面的差异,大多数用户经常
物联网(IoT)在过去十年中获得了极大的普及,随着连接设备的增加,物联网越来越多样化。以物联网为中心概念的产业现在已经无处不在。物联网的最终目标是引入即插即用技术,为终端用户提供易用性、远程访问控制和可配置性等功能。从互联网出生之时,TCP/IP协议逐渐成为互联网最重要的基础设施,然而IPv4协议存在地址不足、移动性及安全性等问题,IPv6是解决IPv4问题的改良式方案,IETF提出了基于IPv6
科技的革新与提高、移动智能终端的快速升级以及定位技术的不断完善,使得LBS得到了迅猛发展,用户终端在享受便利的同时也面临着隐私泄露的风险。为满足车辆的高速移动、系统的储存负担等性能要求,提出一种符合兼容车联网环境的基于LBS的车联网隐私保护算法性能评价指标和可调节的评估策略。为解决现有车联网环境下位置隐私保护算法缺少一种具有普遍适用性性能评估方法的问题,满足隐私保护度和位置服务质量之间的自适应平衡
世界四大粮食中,马铃薯被专家称为可以拯救人类的粮食。其分布区域十分广泛,但目前在马铃薯的智能分选方面仍处于研究阶段,大部分地区依旧利用人工分选手段。在生产过程中,马铃薯品质会严重影响马铃薯深加工产业的实际效益,而对马铃薯进行品质分级,是进行工业化生产的重要前提之一。现有的机械分级方式大都容易对马铃薯的表面造成二次伤害,针对现有情况,开发出一种无损于马铃薯品质的快速分级方法,对目前来说尤为重要。本文
随着云存储与互联网技术的飞速发展,多媒体数据传输及保存不再成为限制语音交流广泛使用的瓶颈。然而,云端作为不可信的第三方平台,极易受到隐私泄露的威胁。如何保证用户在数据安全得到保证的前提下,如何从海量的语音数据中高效地实现密文语音检索,受到众多学者的广泛关注。论文主要利用混沌系统理论、能量规整谱系数(PNCC)、语音感知哈希、Mobile Nets V3模型等技术,对密文语音检索系统所涉及的语音加密
随着现代机械加工技术的不断进步,机械行业不再满足于单纯的“能加工”,而是要求高精度、高效率的加工过程,加工方式也逐步向着自动化、智能化方向迈进。铣削加工是重要的机械加工手段,加工过程中,铣削工艺系统的动刚度与切削颤振密切相关,对加工精度和工件表面质量有着重要影响。目前国内外学者通过有限元仿真和解析计算在一定程度上均得以实现动刚度的获取,然而在有限元建模时,所建模型难免与实际工况有所出入,而解析计算
随着移动技术的发展以及网民数量的增长,互联网中的信息与日俱增,文本数据是这些信息最主要的表现形式之一。从海量文本数据中提取和使用有价值的主观信息是如今自然语言处理领域中非常受欢迎的研究课题。其中,对文本中隐含的主观情感倾向性进行分析研究,可以为用户推荐、舆情分析等领域提供有益的指导。现有的文本情感分析方法尽管取得了一定的成绩,但仍存在一些缺陷:依靠情感词典判断情感极性,其准确性过于依赖词典质量的好
计算机视觉领域的一个重要分支是目标检测,在以智能监控和无人驾驶为代表的人工智能新兴应用领域中,对目标检测任务的要求是实现现实图像中各类物体的边界提取、分类以及识别等。随着卷积神经网络的快速发展,基于深度学习的目标检测研究成为一种实现检测高精度和高准确率的重要手段。目前常见的目标检测算法通常需要像素级的标注信息来训练网络模型,但像素级标注信息的获取是劳动密集型的且容易受条件的限制使目标特征淹没在噪声
数据维度相关性分析一直以来是数据分析领域的研究重点,随着大数据在当今社会各个应用方面的快速发展,数据信息量出现了指数式增长,数据维度也越来越高,维数灾难成为了亟需解决的问题。数据可视化将数据用图形化的方式进行直观的展现,可以很好的帮助用户进行数据分析,并通过图形描述可以直观判断几个数据维度间存在何种相关关系。但是传统的可视化方法难以解决维数灾难的问题。一些数据挖掘方法虽然可行,但是难以把过程具象化
车联网作为智能交通系统的重要基础,通过建立车辆和基础设施之间的网络,实现信息的收集和分发。然而,由于无线通信及车联网自身的特征,使其面临一些安全威胁,如消息可靠性,隐私泄露等问题。若不加以防护和管理,将带来严重后果,因此,对车联网安全机制进行研究具有十分重要的意义。近年来,区块链广泛应用于智能合约、智能运输、供应链、数据管理、信任评估等多个领域,其快速发展为车联网安全领域提供了新的方向。本文在借鉴