【摘 要】
:
在机器人视觉系统中,如何对带有旋转的运动物体进行快速准确检测和轨迹预测具有很重要的研究意义以及应用价值;乒乓球机器人自上个世纪80年代以来就吸引大量研究者深入研究,在当下的技术背景下,随着AI技术的发展,对乒乓球机器人的研究具有更广阔的前景。本文聚焦于乒乓球机器人的视觉系统,以旋转乒乓球为研究对象,深入探讨深度学习在乒乓球机器人视觉系统中的可行性,并且在七自由度库卡机械臂实物系统中进行验证。本文制
论文部分内容阅读
在机器人视觉系统中,如何对带有旋转的运动物体进行快速准确检测和轨迹预测具有很重要的研究意义以及应用价值;乒乓球机器人自上个世纪80年代以来就吸引大量研究者深入研究,在当下的技术背景下,随着AI技术的发展,对乒乓球机器人的研究具有更广阔的前景。本文聚焦于乒乓球机器人的视觉系统,以旋转乒乓球为研究对象,深入探讨深度学习在乒乓球机器人视觉系统中的可行性,并且在七自由度库卡机械臂实物系统中进行验证。本文制作了可用于深度学习网络训练的乒乓球数据集。在双目视觉系统下,采集了实验室环境下不同光照背景下的乒乓球数据以及通过网络获取2000张比赛场景下的乒乓球图片数据,在此基础上对部分图像进行了一些预处理工作以增加数据集的丰富度。对于每张图片都进行人工标注标签信息供网络学习。最后构造了8000多张乒乓球图像数据,为后续的工作打下了基础。本文设计了基于特征融合网络的乒乓球目标检测网络。在特征提取网络中采用跨层连接网络(CSPNet)加强卷积神经网络的学习能力并且减少了网络的参数量以提高网络检测速度;针对现有网络对乒乓球这类小目标检测精度低定位能力差的问题,本文采用了特征融合网络,在特征金字塔网络的基础上再增加一个自下而上的连接,最后用自适应池化法融合各个特征图的特征信息,将上层语义信息丰富的特征层与下层富含目标位置信息的特征层连接起来进行特征融合,增强网络对小目标的定位能力。由于本文的网络只需要对乒乓球目标进行检测,而单张图片中乒乓球目标较小,造成训练成本的浪费,因此本文提出了一种新的数据增强方法,训练时将每张图片中的乒乓球复制多份,基于现有数据进一步增加了数据集的丰富度。在经过网络结构调整优化后,本文的网络可以完成在不同背景及光照条件下对乒乓球的实时跟踪和准确定位。本文搭建了基于LSTM的旋转乒乓球轨迹预测网络。通过将LSTM网络进行堆叠可以实现对乒乓球运动轨迹的预测任务,并且满足了实时性和一定的准确性。对于不同类型的旋转球,在其运动轨迹中都有着其特定的轨迹变化规律可循;因此,本文尝试根据乒乓球的飞行轨迹来反推出乒乓球的大致旋转类型。本文将乒乓球运动分解为三个坐标方向的运动,通过获取到的乒乓球前五个时刻的三维坐标信息来计算乒乓球在三个坐标轴方向上的运动速度,通过速度与设定的阈值的比较来判断其大致旋转的类型,对不同旋转类型的球控制机器人末端关节以特定的角度击球,对于乒乓球机器人的击球成功率有有效提升。相对于传统的物理模型,本文的网络具有更高的抗干扰能力和精确度。最后本文在七自由度库卡机械臂实物系统中对本文的研究方法进行实物验证。
其他文献
为推动掘进工作面的智能化发展,提升掘进装备自主导航技术,分析了目前悬臂式掘进机导航定位技术面临的问题,详细列举分析了各类悬臂式掘进机导航定位技术的研究现状,如光电导航、惯性导航及多传感器融合等。其中光电导航又细分为全站仪、激光指向仪、空间交汇、iGPS、超宽带、视觉导航几个部分,并分别对各类悬臂式掘进机导航技术进行了归纳总结。最后通过分析悬臂式掘进机导航定位技术的应用与未来发展趋势,对未来悬臂式掘
任务型对话客服系统包含自然语言理解、对话状态追踪、对话目标决策和自然语言生成等四个模块。多数的任务型对话客服系统使用的技术是通过管道的形式组合这四个模块进行训练,如果组成管道的某个模块训练结果发生变化,依赖于此模块训练结果的下个模块会受到连带影响,为了获取更好的模型效果,一般需要重新训练整个管道的所有模块,这导致系统的可扩展性比较差。传统的任务型对话客服系统使用基于规则的方法进行处理,导致对话系统
热电材料可以用于将低品位热能转换为电能,从而引起了人们的广泛关注和研究。根据电荷载流子的不同,热电材料可以分为电子型热电材料和离子型热电材料,其中对于常规的半导体或导体等电子型热电材料而言,其塞贝克系数通常较低(~μV K-1),同时它们还存在成本高、元素稀缺、机械柔性差、毒性高等缺点,严重阻碍了其在热电转换应用中的发展。近年来,离子型热电材料因其比电子型热电材料具有更高的塞贝克系数而引起了人们的
无人车的安全性备受关注,但真正安全的无人驾驶还任重道远,尤其是夜间无人车面临更多的挑战。夜视图像相比于可见光图像缺少色彩信息,对比度低、细节纹理特征少,加大了无人车在夜间做出正确决策的难度,易发生交通事故。而场景预测可以辅助无人车利用预测的夜视图像提前进行决策,从而降低因决策不及时发生交通事故的风险。因此,研究夜间场景预测对夜间无人车的行车安全具有重要意义。目前场景预测网络多见于可见光,夜间场景较
根据香农采样定理,传统的奈奎斯特信号采样通常需要较高的采样率,这样才可能实现信号的高质量重构。但是,高采样率往往会导致复杂的计算以及冗余的数据传输。新近出现的视频压缩感知可以使用低于奈奎斯特采样定律所要求的采样率,因此在高维信号的压缩传输等领域具有很大的应用潜力。视频压缩感知信号的重构算法是近年来研究的重点,在各类文献中主要有四类视频重构算法:(1)独立地重构每帧;(2)使用三维信号处理方法重构整
图像作为一种极为重要的信息载体,其质量直接影响着人们了解与传播信息。特别在医学领域,医生的诊断情况与图像质量紧密相关,因此对医学图像进行去噪处理是必要的。以肺部CT图像的去噪处理为例,其要求在去除噪声的同时要对原始图像中的病灶等信息进行完好的保留,而传统图像去噪算法在这方面还存在一定的不足。相较之下,基于小波变换的图像去噪方法是一种更先进的技术,其中小波阈值去噪是最常用的方法之一。人工免疫系统(A
针对煤矿井下掘进机器人位姿感知精度低、远程监控效果差及智能控制难度大等问题,通过分析机器视觉在煤矿掘进机器人中的应用情况,从掘进机器人位姿视觉检测、远程视频监控、数字孪生驱动控制和智能协同控制等方面进行深入探究,提出煤矿掘进机器人位姿视觉测量原理和方法,结合远程视频监控技术,实现对掘进机器人地面远程控制,并对其应用效果加以分析与总结。同时,为进一步提升掘进机器人智能化程度和远程控制可靠性,利用数字