【摘 要】
:
自动驾驶是智能交通与人工智能技术融合的交叉领域,旨在实现无人操控的智能化车辆行驶,往往需要结合多种人工智能技术。最早应用在自动驾驶系统中的技术为基于二维图像的目标检测技术,然而粗粒度的推理任务在应用中无法准确预测物体的真实形状,并且相机图像的局限性也增加了预测的不确定性。因此,探究鲁棒的三维点云数据形式结合细粒度的实例分割推理任务对自动驾驶技术的研究具有重要意义。本文的研究内容便是自动驾驶场景下基
论文部分内容阅读
自动驾驶是智能交通与人工智能技术融合的交叉领域,旨在实现无人操控的智能化车辆行驶,往往需要结合多种人工智能技术。最早应用在自动驾驶系统中的技术为基于二维图像的目标检测技术,然而粗粒度的推理任务在应用中无法准确预测物体的真实形状,并且相机图像的局限性也增加了预测的不确定性。因此,探究鲁棒的三维点云数据形式结合细粒度的实例分割推理任务对自动驾驶技术的研究具有重要意义。本文的研究内容便是自动驾驶场景下基于点云的实例分割方法。实例分割是对目标进行实例级语义分割的精细化推理,需要在像素级语义分割的基础上根据位置信息进一步区分物体所属的不同实例,能够在场景中准确描绘出不同实例物体的边缘轮廓。现有的主流点云实例分割方法通过将点云场景投影在二维图像上应用深度学习的方法实现。虽然此类方法已经取得了一些进展,但其中仍存在一些问题。首先,室外场景点云稀疏且背景噪声复杂且庞大,目标显著性极低,直接进行细粒度推理十分困难,正视图投影还会造成轴向物体之间的混叠遮挡现象。此外,在室外点云数据中存在大量困难样本,导致点云实例分割平均准确度仍处于较低水平。本文针对以上问题进行研究,具体地:(1)本文首先提出一种基于视柱投影的点云实例分割算法模型,并提出一种两阶段点云实例分割的算法框架,通过结合点云目标检测与语义分割实现精细化的点云实例分割。为了增强点云目标物体的显著性,本文首先采用目标检测算法对场景进行初步的理解,通过保留感兴趣区域的点云视柱滤除大部背景噪声,便于进行精细化的实例分割。将提取的视柱进行编码与球面投影,对视柱点云进行格式化,由于视柱内最多只包含一个物体,因此基于视柱的投影不会造成物体的混叠。接着通过轻量级的二维卷积神经网络实现高效的精细化实例分割。本文提出的基于视柱投影的两阶段模型通过结合物体的位置信息与语义信息实现高质量的实例分割,在公开数据集上的实验表明所提算法的性能可以超出当前国际最优的方法。(2)本文进一步针对点云困难样本的实例分割进行研究,提出基于三维点的实例分割模型,有效的提升了点云困难样本的识别与分割。为增强困难样本的特征表达能力,本文提出采用直接对原始点云提取三维特征的网络结构进行实例分割,通过逐点级分辨率的网络直接提取物体的语义结构特征,可以避免投影导致的物体拓扑结构损失。具体地,首先通过交叉验证感兴趣视柱提取模块滤除噪声提升目标物的显著性,同时引入同分布的负样本增强分割网络的泛化性。然后,通过带有多分类焦点损失函数的点云分割模块对视柱内点进行精细化的识别与分割,并聚焦于挖掘困难样本的特征。实验结果证实了所提方法的有效性,可有效增强点云困难样本在实例分割中的识别能力。本文提出的两种点云实例分割模型在实验对比中均超过目前国际最优算法,根据其不同的特性两种算法有各自的适用情境。基于视柱投影的实例分割模型在较简单的点云场景中可以实现高效率的实例分割,而基于三维点的实例分割模型通过精细化的特征提取以及较高的计算代价实现了更精确的点云实例分割。
其他文献
当前,中国面临着人口老龄化程度不断加深的问题,老年人口占全国总人口的比例持续增长。老年人的生活照顾、日常护理、健康保健等问题引起了越来越多人的关注,养老问题已经成为社会热点问题。近年来,在我国政策鼓励和扶持养老产业的背景下,实现养老服务智能化、信息化已经成为一种趋势。随着“大数据+”模式和相关技术的发展,智慧养老这一理念也逐渐兴起和普及。电动养老床系统基于电动推杆和控制设备,能够有效降低护理人员的
近年来,随着5G、IEEE 802.11p、LTE-V2X等无线通信技术逐渐成熟,节点具备在高速环境下低延时性、高可靠性传输信息的能力,车联网成为人们研究的热点。然而,车联网在帮助车辆感知路况、制定行车方案、规避风险的同时,其智能化、网联化的特点也存在一系列安全问题,诸如存在Sybil攻击、重放攻击、虚假消息攻击的风险。本文主要针对车联网中的身份认证问题和信任管理问题展开研究,主要工作如下:在车联
根据调查显示,我国人均耕地面积只有1.64亩,仅为世界水平的50.52%。耕地面积少,加之农作物生长异常会降低产量,并影响农民收入和农作物期货市场。为了及时获知农作物的异常情况,需采用高效的方式采集农作物长势信息。本文利用农作物异常生长时,叶表面温度异常变化的特性,通过无人机配备红外传感器,使用红外热成像技术检测植株冠层温度,预测农作物异常问题。尽管无人机搭载的红外摄像机能够高效地获得农作物冠层温
车联网是建设智慧交通的重要基础,在提升道路安全和提升通行效率方面具有极大的优势,然而,传统车联网的可扩展性较差,配置不够灵活,已经无法满足于新型车联网的发展需要。软件定义车联网架构的提出能够有效解决上述问题,即在车联网中引入软件定义网络(Software Defined Network,SDN)的思想,同时还为车联网带来了可编程性和可扩展性,满足了未来不断增长的车联网应用服务需求。SDN的引入带来
盾构隧道设计过程中需要考虑水压力的影响,因此明确水压力计算方法具有较为重要的工程价值。隧道设计时水压力的计算方法通常分为折减系数法、解析法、数值分析法三大类,本文对每类方法的研究进展和不足进行了归纳总结:折减系数法和解析法一般适用于稳定渗流的简单情况;数值计算法适用范围广,但可推广性不强;并建议后续对复杂条件下隧道衬砌外水压力计算方法进行深入的研究,以便更好地应用于实践中。
太原西山地区煤矿众多,煤炭开采时间长,产生的煤矸石占用了大量的土地资源。随着对西山地区生态环境的治理,部分煤矸石污染场地重新被用于工程建设。目前,大部分的对煤矸石的研究主要集中在煤矸石中的微量有毒有害元素释放以及这些有毒有害元素在土和水体中的富集,并未对受煤矸石污染前后土体的宏观物理力学性质、微观结构及污染机理进行研究。本文主要以太原西山矿区官地矿煤矸石及矸石堆周围黄土为研究对象,通过X荧光光谱分
近年来智能监控、人机交互、智能家居、自动驾驶等领域的发展对于人物及其行为的检测与跟踪的研究提出了需求。识别和跟踪人体的骨架结构是人物动作分析的重要基础,目标检测与跟踪技术也迎来了新的发展需求——人体姿态估计与跟踪。姿态估计要求准确识别和定位图像中人体骨架关键点的位置;姿态跟踪则是利用视频中前后帧的关系检测和跟踪视频中的人体关键点。本文主要研究在自主识别目标人物基础上的单人姿态估计与跟踪,即利用目标
为保障广州地铁某区间盾构隧道正穿上软下硬灰岩地层高速涵洞桩基过程中高速涵洞的安全,选取3种不同加固处理方案进行综合比选后,采取斜向旋喷桩+筏板+复合地基加固处理方案。利用三维有限元对桥梁桩基沉降进行计算预测分析,并与盾构掘进施工监测数据进行比对分析判断。理论计算分析及施工监测结果表明:1)多角度全方位旋喷加固地层可有效避让既有桩基;调整排泥量、控制地内压力及控制喷射注浆引起的地基隆起与下沉等成桩特
数字散斑干涉(DSPI,Digital Speckle Pattern Interferometry)作为一种全场非接触式光学测量技术,在物体形变、位移、振动等物理量测量方面具有广泛的应用。而散斑干涉图像处理作为数字散斑干涉测量的关键一环,对形变测量精度、测量量程具有重要影响,因此对散斑干涉图像处理技术的研究十分重要。本文介绍了数字散斑干涉形变测量基本原理以及散斑干涉图像处理基本方法,对散斑干涉图
唇语识别是一种可以仅根据说话人的唇部运动状态中预测出说话人说话内容的技术,在计算机视觉和自然语言处理的交叉应用中具有极其重要的意义。比如在嘈杂环境中或远距离交流时唇语识别可以使用视觉信息预测说话人试图表达的内容,并可以与音频识别配合增强识别的准确率。唇语识别也可应用于音视频对齐,利用视觉特征与听觉特征的序列匹配实现对音视频的修正。另外,唇语识别还可以被应用于抵抗重放攻击的活体检测器,作为其他生物特