【摘 要】
:
多机器人系统在各个领域有着广泛的应用,通过多机器人系统的群集控制实现大量自主个体的协同工作且保证其安全变得至关重要。受到生物群体行为的启发,本文对多机器人群集控制问题展开研究,针对传统群集控制算法需要建立精确模型和控制律设计工作较为繁琐的缺点,采用深度强化学习的方法实现多机器人群集控制。首先,针对多智能体深度确定性策略梯度算法学习效率低下、收敛速率慢的缺点,本文引入了优先经验回放机制,提出了强化学
【基金项目】
:
国家重点研发计划(2017YFC0803300); 国家自然科学基金(编号:61773393,U1813205);
论文部分内容阅读
多机器人系统在各个领域有着广泛的应用,通过多机器人系统的群集控制实现大量自主个体的协同工作且保证其安全变得至关重要。受到生物群体行为的启发,本文对多机器人群集控制问题展开研究,针对传统群集控制算法需要建立精确模型和控制律设计工作较为繁琐的缺点,采用深度强化学习的方法实现多机器人群集控制。首先,针对多智能体深度确定性策略梯度算法学习效率低下、收敛速率慢的缺点,本文引入了优先经验回放机制,提出了强化学习算法PER-MADDPG。该算法基于时序差分误差的更新方式,设计了经验优先级评估函数,优先采样重要性更高的经验,从而提高了算法的学习效率。通过实验验证了论文所提出的PER-MADDDPG有更快的收敛速率,并且利用该算法能够实现多机器人的群集控制。其次,传统MADDPG算法并未充分利用多机器人系统存在的结构信息,导致群集任务完成率不高,并因采用了集中训练分散执行的方式,导致其可扩展性不强。针对这些问题,本文提出了一种全分布可扩展性强的图卷积强化学习方法。该方法把群集中的每个机器人当成一个节点,通过图卷积神经网络提取多机器人群集中存在的拓扑结构信息,由此能够隐式地表达出群集中机器人之间的相互作用并学习合作策略,经过图卷积层聚合得到的特征向量长度是固定的,与邻接机器人的数量无关,因此该方法能够解决以往多智能体强化学习算法可扩展性较差的问题。实验结果表明所提出的图卷积强化学习方法具有良好的可扩展性。最后,由于图卷积强化学习只把机器人当做图中的节点而没有充分考虑环境中存在的障碍物,导致多机器人对环境的理解不足。针对该问题,本文提出了考虑环境信息的图卷积强化学习方法,将多机器人群集任务环境中存在的障碍物也当做节点纳入到图结构中,从而使机器人充分考虑环境对群集控制的影响,进而更有效地避开障碍物。相应的仿真实验结果表明,该算法使得机器人群集对障碍物的躲避能力进一步提高。
其他文献
拜占庭各个时期的土地关系存在诸多值得深入研究的问题。在拜占庭早期,土地劳动者中出现了新的"隶农"阶层,他们源于自由农地位的下降和奴隶地位的上升。自由农群体依然存在,他们和隶农遭受诸多剥削,逐渐依附于大地主阶层。拜占庭统治者为了保证税收资源,打击大地主吞并土地的行为。地主与农民之间剥削与被剥削的关系,以及中央政府与大地主阶层为了争夺土地资源而发生的矛盾,贯穿于整个拜占庭历史。围绕土地关系,拜占庭中晚
随着经济、军事力量的增长,我国海洋权益保护的需求不断增长。着力提升海洋装备水平对于建设海洋强国的目标具有重要意义。无人艇以其高速机动性和快速反应能力在军事和民用领域取得了广泛应用,对于加强海上活动监管、守护海域安全具有重要意义。深度学习技术的快速发展为无人艇自主化、智能化水平的提升创造了有利的条件。本文以提升无人艇的环境感知能力为出发点,重点对深度学习目标检测技术开展研究,致力于提升无人艇平台视觉
目前车辆检测、人脸识别、行人检测与跟踪、遥感图像检测、无人驾驶等有关计算机视觉的研究已取得了较好的实际应用效果。在国防建设领域,对武器装备进行自动识别的需求逐渐增加。对于海上舰船目标,以往都是借助雷达等设备进行跟踪监测,以及使用卫星遥感图像来侦测识别,但这些方法都无法辨别出具体的舰船类型和舷号,不足以针对性的对某艘舰船进行实时监察与行迹分析等后续任务。因此,依托于当前计算机视觉研究的成果,基于深度
7—8世纪是晚期罗马帝国向中古拜占庭帝国转型的最后阶段。法律编纂呈现了帝国统治者的治理理念,反映了转型过程。《民法大全》在适用中面临法学传承、语言等难题,是转型前“罗马困境”的缩影。7—8世纪的法律编纂,弱化罗马法的部分原则,吸纳希腊法和不成文法,同时实现全面基督教化,基督教信仰成为立法精神、法律渊源和法条内容等。该时期拜占庭统治者在坚守罗马帝国名号和威权的前提下,放弃或淡化了传统理念中的拉丁区域
雷达辐射源信号的分选与识别是电子战的重要组成部分与关键环节,一直是国内外学者的研究热点。近年来,随着雷达体制的升级与雷达信号技术的发展,电磁环境变得日益复杂,同时伴随各国电磁保密意识增强,提前获得非合作雷达辐射源的标签与调制方式等信息也越来越困难,这些对传统的雷达辐射源分选方法和手段带来了严峻挑战。针对上述问题,本文提出了使用无监督深度学习算法提取信号特征,并采用合适聚类算法完成非合作雷达辐射源信
大量的云层覆盖严重影响卫星遥感影像的地物判读,为有效提高资源利用率,云检测已成为分析卫星遥感影像数据的首要工作。高空间分辨率遥感影像能够精确观察小空间尺度上的地表细节,但与此同时也对云检测技术提出更为严苛的要求。大多数高空间分辨率遥感影像仅含有红、绿、蓝、近红外四个波段,传统需要依赖大量特定波段的云检测算法难以对其发挥优势。因此,本文在研究国内外相关云检测算法的基础之上,结合深度学习技术提出具有普
在通信对抗领域中,如何对通信辐射源个体进行准确识别一直以来是一个重点研究问题,是目标侦察系统亟待解决的关键技术之一,它依照通信发射器设备的物理层特性差异来分类识别不同的辐射源个体。通信辐射源个体识别技术对于通信网络结构的分析、目标威胁等级的评估和战术战略的决策等方面都有着关键性作用。在日益复杂的电磁环境下,传统的通信辐射源个体识别方法存在的自适应性不足和鲁棒性差的问题,导致其不能满足现代战场环境下
2001年5月,昆曲被列为“人类口述的世界非物质文化遗产”名录,其传承六百年的文化价值得到世界认可。在这种背景下,国家和政府开始制定政策大力保护昆曲文化,以免昆曲逐渐消失在大众视野中。为了快速建立起大众对于昆曲的文化印象,设计师们从昆曲的众多文化元素中提取最为明显的视觉符号,进行设计并不断强化。虽然达到了最初的目的,但随着时间的推移,也让人们产生了严重的视觉审美疲劳,这为昆曲的有效传承带来了莫大阻
对北美地区中密度纤维板产能进行分析,并描述北美国家中密度纤维板工厂变化情况。
<正>联合国粮农组织(FAO)和联合国欧洲经济委员会(UNECE)联合发布《林产品市场报告(2021—2022年度)》。该报告提供了联合国欧洲经济委员会区域(欧洲、北美、中亚和西亚国家)市场的全面分析,范围涵盖了原木、锯材、人造板、纸、纸板以及木浆,通过政策分析,评估主要趋势和驱动因素,其中人造板情况如下。