论文部分内容阅读
随着人工智能领域的快速发展,计算机视觉以及机器人领域先进技术的发展和进步已经对许多工业生产和社会服务做出了巨大的贡献,移动智能体的自主能力成为了一个研究热点。移动智能体要做到完全的自主,首先需要具备对周围环境信息的感知能力、动态环境分析能力以及对危险的判断和执行能力。人类的视觉判断速度是非常快的,并且精确度也很高,这使得人类在一瞬间就可以做出正确的判断。在日常生活中,人类看一眼视频、眼前场景或者图像,就可以从中获取物体位置以及它们的类别等信息,这样快速准确的识别能力使得人类可以完成复杂的视觉任务而不需要过多的下意识的思考,比如驾驶时很少有意识的长时的思考,而是可以快速准确的根据现场环境做出正确的判断。因此对于自主智能体来说,具有速度快、精确度高的多目标识别算法尤为重要,好的算法模型可以使自主智能体在执行任务时快速准确的感知周围环境,并结合系统内的辅助传感器做出正确判断,因此,对于自主移动智能体,实时性与准确性也就成为重要指标。为此,本文针对多目标识别系统展开研究与实现,研究并对比目前几种典型的深度学习目标识别算法,通过改进网络结构与算法优化,应用于移动智能体的自主导航中,主要研究内容如下:(1)以多目标识别模型为研究对象,研究分析目前主流的目标识别算法与网络结构,通过实验综合分析各个算法及网络结构的优点与不足,以及其对于自主移动智能体整体系统的实用性。(2)针对端到端的目标检测YOLO模型进行优化,并改进网络结构,降低复杂场景下多目标标识别的漏检率,提高小目标识别精度。(3)研究TensorRT技术,通过TensorRT对神经网络进行优化,并结合目标平台参数,具有针对性的对训练好的多目标识别模型进行优化部署,大幅度提高多目标识别系统的推理预测速度,提高系统识别效率及系统实时性。(4)研究机器人操作系统(Robot Operating System),通过ROS平台构建系统内通信方式以及分布式系统,实现本文最终多目标识别系统的构建与部署。最终通过实验结果分析,优化之后的基于深度学习的多目标识别模型能够有效的完成实时多目标识别及定位功能,具有更好识别效果,并且推理速度具有明显的提升,可以达到实时识别的要求。