基于自适应动态规划的多智能体一致性控制方法研究

来源 :中国科学院大学(中国科学院大学人工智能学院) | 被引量 : 0次 | 上传用户:fskfxx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算技术、通信技术和控制技术的快速发展,多智能体的分布式协同控制在学术界受到了密切的关注。其中一致性控制是多智能体协同控制中一种很常见的控制问题,其目的是为了让处于同一个通信网络中的所有智能体的状态达成一致,完成同一个设定的目标。目前在多智能体协同控制中常见的控制技术有比例积分控制、模糊控制、模型预测控制等,这些方法仅仅考虑了系统的稳定性,无法实现能耗的最小化。自适应动态规划算法在保证系统稳定的基础上,求解了系统的最优控制,性能指标函数相较于传统控制方法有了显著的提升。自适应动态规划算法是自动化领域为了求解最优控制而诞生出的一种多阶段决策方法,该算法利用神经网络来近似非线性复杂系统的数学模型,为许多行业的智能化升级提供了理论支撑。自适应动态规划对于解决多智能体一致性控制这种复杂的非线性问题,具有消耗能量小、控制效果优、计算能力强的优点,优势十分明显。本文通过自适应动态规划规划算法来解决多智能体的一致性控制问题,主要研究工作如下:(1)针对一类输入受限的多智能体系统,提出了基于自适应动态规划算法的一致性控制方案。本文通过在性能指标函数中引入非二次泛函,将饱和多智能体控制问题转化为优化问题。通过性能指标函数可以构造出哈密顿-雅克比-贝尔曼方程,为求解该方程引入了策略迭代算法,并且对迭代算法的稳定性做出了分析,使得算法具有可行性。为了拟合本地性能指标函数,设计了在线神经网络控制器,对相应的哈密顿-雅克比-贝尔曼方程给出表示方法,并采用梯度下降法得到权值的自适应更新律,使得算法能够顺利运行。(2)针对外界干扰下的多智能体系统,设计了最优一致性控制算法。首先在跟随者的动力系统方程中加入了干扰项,随后又在其效用函数中,加入了干扰项的二次型函数。为了求解扰动影响下的一致性最优控制,需要同时考虑控制输入和干扰项的影响,基于非零和微分对策理论,实现纳什均衡。最后在仿真阶段,增加了与理想状态下实验结果的对比,以直观体现出本章算法的实现效果。(3)针对同时具有外界干扰和输入受限问题的多智能体系统,为其设计了分布式一致性最优控制方案。结合输入受限和外界干扰下的多智能体系统最优控制中的各自的性能指标函数,定义了这类系统的性能指标函数。设计李雅普诺夫函数,并求出了系统稳定性条件。最后的仿真实验中,在保证系统稳定的前提下,加入了一个外界扰动,同时考虑控制输入的限制条件,得出了稳定的仿真结果,实验结果验证了算法的有效性。
其他文献
近年来我国经济发展处于经济新常态时期,去杠杆调结构,转换增长动力,成为了中国经济发展的新目标。基于这种情况各级政府通过设立政府投资基金引导资本市场上的资金流动来为解决资本投资“市场失灵”和企业融资难的问题的提供新途径。然而,政府投资基金在引导社会资源的效率如何?促进增长动力的效率如何?这些问题不仅对提高政府投资基金效率、促进企业健康成长具有十分重要的现实意义,还对政府投资、资源配置等理论的研究产生
电子商务交易中,消费者拥有个人信息权,且这一权利在电子商务领域具备特殊性:在大数据背景下的电子商务交易中,消费者的个人信息已成为行业发展的基础性资源,会被经营者大范围收集,且可以通过用户画像手段具象消费者人格。这就导致保护消费者个人信息权面临的挑战贯穿个人信息收集和利用的全过程。要保护消费者个人信息权,需要明确电子商务交易中的个人信息权内涵。电子商务消费者的个人信息是指以电子方式记录的能够单独或与
梁漱溟是是现代新儒学的重要代表之一,被称为是“最后一个儒家”。“心性论”思想是梁漱溟哲学体系的重要内容,面对文化危机,他结合中西哲学不断地完善其思想,形成具有自己特色的理论体系,用自己独到的见解分析当下文化环境,表明对传统文化顽强生命力的信心。他的批判思想对于当代学者的影响不容小觑,本文从梁漱溟心性论发展的整体性入手,将梁漱溟的心性论放入历史境遇中,通过梳理其思想来源,了解心性论形成的思想背景,探
Fe-Cr合金因具备极好的膨胀系数、合适的氧化抗力、良好的导电导热性能、优异的综合机械性能及低成本等优点,成为最适合作为SOFC电堆中连接体的材料。然而,在长周期服役工作环境下,特别是阴、阳极两端不同的氧分压,常用的商用430合金呈现出氧化抗力不足,导致合金表面氧化膜层增厚、剥落以及面比电阻的增加等问题,严重制约了该合金材料开发应用。因此,本文针对Fe基合金存在的上述问题,选用SUS430合金作为
作为研究亲社会行为的新视角,社会善行指的是由于充满善意地关注别人而引发的行为。虽有大量关于自我控制与亲社会行为关系的研究,但结论尚不统一,而且在中国文化背景下缺乏关于自我控制与社会善行的相关研究。特质自我控制体现了个体行为的稳定性,而状态自我控制体现了个体行为的波动性,基于此本研究采用问卷法和实验法,从特质和状态两个角度考察自我控制对社会善行的影响。研究一采用自我控制量表(SCS)和社会善行范式(
采用焙烧-碱浸脱硅-高压溶出处理低品位铝土矿,是当前研究的热点之一。本文针对矿石脱硅所产生的含硅碱液,通过添加石灰、赤泥、硅渣及其混合物对溶液进行脱硅,系统研究了脱硅剂添加量、温度、时间等重要参数对脱硅效果的影响,并利用脱硅后液对矿石进行了循环脱硅,结合XRD、XRF、SEM、TEM、FTIR等表征手段,分析了脱硅动力学及机理。获得主要结论如下:石灰添加量和时间对脱硅效果产生显著影响,而初始碱浓度
本文以制动领域高性能耐磨材料的需求为研究背景,制备了梯度Ti C多孔陶瓷,再以其为增强相制备了梯度双连续相Ti C/Fe复合材料,并对其结构与性能进行了研究。利用模板层叠浸渍-无压烧结工艺成功制备了梯度Ti C多孔陶瓷增强体。实验中选用聚氨酯海绵作为模板,以Ti C粉为主要原料并加入少量Ti粉、Mo粉作为烧结助剂,将不同孔径的海绵模板层叠复合,利用模板浸渍-无压烧结工艺制备出界面连续过渡的梯度Ti
随着塑料工业的不断发展与进步,塑料制品在人们的生活中占的比重越来越大,人们对塑件的性能和外观要求也越来越高。在这其中,显示器后壳更是以其质量轻、耐热性好、表面光泽性好等优点得到越来越广泛的应用。注塑成型是显示器后壳最主要的加工方式,而注塑件在注塑加工过程中翘曲变形等缺陷对注塑件的质量和使用性能有非常大的影响。目前国内外对注塑后壳的结构特征所引起的翘曲变形的研究十分有限,大部分只针对工艺等方面对注塑
人体行为识别任务旨在从输入的包含目标人物活动的视频中辨别出其对应的行为类别。研究人体行为识别的理论意义在于推进科技,社会的发展;实际应用包括健身辅导、虚拟现实、城市安全等诸多领域。主流人体行为识别领域的研究方法大多采用RGB与光流融合的形式,从原始视频帧中提取相关特征。针对主流人体行为识别方法存在背景信息干扰,长时时域建模难,以及相关模态未有效利用等问题,本文提出了两种有效优化算法,具体研究内容及
对于社交媒体平台而言,识别和标注出特定语言的文本对于情感分类、趋势提取、预测电影评分等研究都具有重要的现实意义。传统的语种识别方法大多基于语法格式良好的较长文本,而对于社交媒体消息等短文本的识别效果并不理想。本文以社交媒体短文本为研究对象,研究语料标注和语种识别方法。主要包括以下两个创新点:(1)结合域相关信息的最大化自动标注方法提出并实现了一种结合域相关信息与基分类器投票的最大化自动标注方法。该