基于增强学习的Flocking集群协同控制算法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户：tangtieming1983

【摘要】

：

【作者】

：

肖剑

【出处】

：

电子科技大学

【发表日期】

：

2020年07期

【关键词】

：

Flocking集群协同控制算法群体行为仿生多智能体协同搜索系统多组群多智能体互抗系统可变权值的分布式协同Q-learning算法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

群体协同任务是动物界中一种普遍行为,这种协同的群体行为大大提高了动物在猎物搜索、捕食以及御敌等方面的作业效率。人类同样存在着类似于动物群体协同作业的任务或需求,并期望以一种智能化的方式得以实现。因此,对动物群体行为的仿生研究对人类开展群体智能的研究具有重要指导意义。Flocking集群协同控制算法是一种典型的基于动物群体行为仿生的群体控制算法,目前已有大量的关于基于Flocking集群协同控制算法的群体控制的研究,但对于群体与群体之间相互作用的仿生研究相当少。增强学习作为一种智能体自主学习算法,对提高人工群体(如:多智能体系统)的智能程度以及群体任务的作业效率具有潜在的价值。由于增强学习算法的智能性使得人工群体智能更加接近于生物群体智能。因此,本文主要的研究目标是针对动物界中典型的捕食行为:狼群捕食羊群,并基于增强学习与Flocking集群协同控制算法,对捕食过程中的狼群协同搜索以及狼群与羊群互抗进行仿生研究,并根据仿生模型建立多智能体协同搜索系统与多组群多智能体互抗系统。在多智能体群体协同搜索的研究过程中,本文主要研究自由区域下的多智能体搜索算法的非最优搜索问题,提出了一种基于增强学习的分布式多智能体区域协同搜索算法。为实现增强学习在多智能体协同搜索系统的应用,本文设计了一种γ-信息地图。基于γ-信息地图,本文将连续的区域搜索过程转化为离散的γ点遍历过程,并同时保证了无死区搜索。当智能体的通信覆盖整个目标区域时,通过学习整个区域的搜索过程,智能体能够获得全局最优搜索策略。在通信无法覆盖整个目标区域的情况下,智能体能够获得局部最优搜索策略;此外,基于本文所提出的搜索算法,智能体通过离线规划的方式可获得全局最优搜索路径,根据规划的路径实现最优的搜索。仿真结果表明,本文所提出的区域搜索算法所需时间接近最理论优值,并且区域搜索效率明显优于基于Anti-flocking的多智能体协同搜索算法。在多组群多智能体互抗系统中,通过对Flocking集群协同控制算法中的势能力的重新设计,实现对狼群与羊群互抗过程中的运动的模拟控制。另外,基于Flocking集群协同控制算法设计了一种羊群模型的躲避算法,实现了羊群模型协同地躲避捕食者并保持群体的完整性。本文设计了一种相对极坐标系,实现将连续的互抗环境离散化,并在这种离散的环境下,实现增强学习在群体互抗中的应用,构造出一种连续-离散的混合的多组群多智能体系统。基于分布式增强学习算法,实现了狼群的自主决策,仿真结果表明了该互抗系统的可行性。为了实现狼群之间中各单体之间在搜索与互抗过程中的学习经验的有效共享,加快学习算法的收敛速度,并减少传统的协同学习算法因经验共享而带来的通信量,本文提出了一种可变权值的分布式协同Q-learning算法,并在理论上证明了所提出的分布式协同增强学习算法的收敛性,最后通过仿真实验证明了算法的稳定性。

其他文献

基于直观想象素养的高一函数教学策略研究

近年来,“核心素养”一词成为了新一轮教育改革的关键词,教育应该培养学生能够适应终生发展、社会发展需要的必备品格和关键能力。只有真正落实培养了学生的数学核心素养,才

学位

直观想象素养高一函数教学策略测评

高铁客站站前广场景观地域性表达探究

眼下全国各地多处高铁客站工程都处在如火如荼的建设中,在全球一体化总体趋势的冲击下,高铁客站站前广场工程中也出现了高度雷同,地域性缺失的不良现象。文章从景观地域性影

期刊

站前广场景观设计地域性表达station squarelandscape designregionalexpression

当代俄罗斯儿童文学中的后现代特征

本文将苏联解体前后俄罗斯本土作家所创作的儿童文学文本作为主要研究对象,通过对大量儿童文学作品的阅读、筛选、分析和整理,对其所表现出的后现代主义特征进行归纳和总结。儿童文学与成人文学具有同等重要的地位,对俄罗斯后现代主义的研究不应将儿童文学排除在外。以哈尔姆斯为首的先锋团体“现实艺术协会”(ОБЭРИУ)被认为是在俄罗斯儿童文学中运用后现代主义手法的鼻祖。奥斯捷尔、乌斯宾斯基等儿童作家继承了前辈的创

学位

后现代主义儿童文学荒诞解构互文性

隐伏导水陷落柱快速判识与超前探查治理技术

根据唐家会出水点的水量、水位、水温、水化学场一致性的原理,判别出61101掘进工作面突水水源为深部强富水奥灰水,通道为隐伏导水陷落柱(定性)。为此,封堵了出水巷道、防止出

期刊

导水陷落柱突水水源判别超前探查治理技术water-diversion subsided columnjudgment of water invasionr

坝上地区生态河道景观设计研究

河流在大千万物中发挥着抚育多类种生命、让地球饱有生机和活力的重要作用,人类得于存在和不断成长壮大的源头也是河流,河流也是地球生生万物必不可缺的一分子,更是满足地球

学位

坝上地区河流生态修复景观设计鸳鸯河综合治理

河津固镇瓷窑址金代四号作坊出土瓷盘初探

山西地区是中国北方重要制瓷区之一,在金代少数民族统治时期,制瓷业的发展继承了北宋的繁荣局面。河津窑作为晋南地区重要的瓷窑址之一,制瓷历史悠久,唐代已有瓷器烧造,宋金

学位

固镇瓷窑址金代四号作坊瓷盘工艺特征

Logistic回归和ROC曲线分析多项肿瘤标志物在鉴别良恶性腹水中的意义初探

目的:通过分析良恶性腹水中的肿瘤标志物(CEA、CA125、CA19-9、AFP),意在得到其单独鉴别良恶性腹水中敏感性和特异性以及临界值,并通过CEA、CA125、CA19-9联合检测建立Logist

学位

Logistic回归肿瘤标志物联合检测诊断模型

基于增强学习的Flocking集群协同控制算法研究

其他学术论文