动态环境下的多智能体机器人协作模型

来源 :华中科技大学学报(自然科学版) | 被引量 : 0次 | 上传用户:king_hxr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了在动态环境中,多Agent的一种协作模型,适用于环境信息不完备的复杂情况.将Agent的独立强化学习与BDI模型结合起来,使多Agent系统不但拥有强化学习的高度反应性和自适应性,而且拥有BDI的推理能力,使只使用数值分析而忽略推理环节的强化学习结合了逻辑推理方法.使用了Borlzman选取随机动作,并且采用了新的奖励函数和表示方法,减少了学习空间,提高了学习速度.仿真结果表明所提方法可行,能够满足多Agent系统的要求. A collaborative model of multi-agent in dynamic environment is proposed, which is suitable for the complex situation of incomplete environmental information. Combining the independent reinforcement learning of Agent and BDI model makes the multi-agent system not only possess the high reactivity of intensive learning and Adaptive, and has the reasoning ability of BDI, so that intensive learning using only numerical analysis while ignoring reasoning is combined with logical reasoning methods. Borlzman uses random actions and introduces new reward functions and representations to reduce learning Space and improve the learning speed.The simulation results show that the proposed method is feasible and can meet the requirements of multi-agent system.
其他文献
目的了解临安地区市售水产品中副溶血性弧菌污染情况,并对毒力基因和药敏进行检测,为防治因副溶血性弧菌引起的食源性疾病提供依据。方法随机采集市售水产品205份,采用PCR方
对济钢开发的新型顶燃式热风炉进行了详细介绍,该炉具有整体结构稳定,风温高,操作安全的特点,适合热风炉新建或改造。
小学阶段是一个人思维能力成长的关键期,而数学思维的形成对小学生的成长十分重要.应用题教学在小学数学教学中占有非常重要的地位,也是小学数学教学的重点和难点.在应用题教
目的探讨依达拉奉对局灶性脑缺血-再灌注损伤的影响及其可能的神经保护机制。方法用线栓法制备大鼠局灶性脑缺血.再灌注损伤模型,用试剂盒检测脑组织丙二醛(MDA)含量和一氧化氮合
化学是一门以实验为基础的学科,实验有助于学生对化学知识的理解,激励学生探究化学的奥秘,增进学生对化学的情感,也是实现有效教学的重要手段。如何有效开展初中化学实验教学