论文部分内容阅读
近年来,机器人在人类社会中扮演着越来越重要的角色,尤其是移动机器人正慢慢融入人们的日常生活。然而不论是室内使用的扫地机器人,还是在户外使用的外卖机器人、快递机器人、巡逻机器人等都面临着避障问题,它们的应用场景中不仅有静态的障碍物,还往往有人、动物以及其它交通工具等动态的障碍物,避开静态以及动态障碍物是对移动机器人的基本要求,也是机器人领域研究的一个核心问题。本文首先针对动态环境下的移动机器人避障问题提出了一种基于深度强化学习的端到端的动态避障算法。该算法提出了一种新型策略网络,该网络创造性地将处理文本时序信息的长短期记忆单元与处理图像信息的卷积层相结合构成新的特征提取网络。在此基础上本文设计了新型的奖赏函数,结合增加正则项的近端策略优化,经过训练得到了优化的避障策略模型。该算法输入为激光雷达扫描数据、目标位置坐标参数以及机器人本体的速度信息,基于这些参数可直接输出用于机器人灵活避障的速度指令,在本文仿真实验部分中设置的多种复杂仿真环境的综合平均避障成功率可达70%以上。硬件部分创新性地使用3D激光雷达与超宽带定位系统相结合的导航避障传感系统,同时优化了传感器的连接与供电方案,使得传感器得以顺利部署在莱卡狗机器人上。然后将基于深度强化学习的避障算法在该机器人上进行了多行人动态避障实验验证,证明了该算法可以灵活地避开动态障碍物,具有很强的实际应用价值。本文针对基于深度强化学习的算法可解释性较差,以及传统动态窗口法在动态障碍物环境下避障成功率较低的问题,还提出了一种基于动态窗口法的新型动态避障算法。该算法采用了由机器人本体到目标点距离增量和最小障碍物距离相结合的新型评价函数和新约束条件,提高了动态窗口法在速度空间中对最优速度的选择能力。该算法在本文仿真实验所设定的仿真环境中避障成功率依据障碍物数目的不同提升了约5%-20%不等,且大大缩短了机器人到达目标点的时间。硬件部分采用深度相机与超宽带定位系统相结合的导航避障传感系统,并将该算法在莱卡狗机器人上进行了真实场景下的实验验证,明确了该算法的可行性与实用性。本文最后对这两套动态避障系统的硬件、算法和实验进行了对比分析总结,为该领域的进一步研究提供了参考借鉴。