基于协作机制的多Agent追捕研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:epwangke96
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于 agent的模型(ABMs)在人工智能及虚拟现实等领域一直都是在试图模仿人类的行为,在一个人工环境中,为了产生许多社会科学家可以理解的可能现象,agent的决策模块要互相影响并进行交互。这个定义对于那些不是在分布式人工智能(DAI)的专家来说并不是特别清楚,但是如果考虑到那些反映了特殊类型的 ABM鼎鼎大名的视频游戏,它确实提供了一个明确的意义。事实上,视频游戏将虚拟世界的玩家和一些互动的人物整合了起来,例如:怪物,追兵,逃跑者、宇航员、士兵等。这些 agent中的每一个在特定的情况下都在进行一种特定的并且规则的行为(一种行为算法),最重要的是,agent可以与其他 agent进行交互。然而,游戏也有很大的概率随机产生许多不同的结果,电子游戏基于每个agent的交互性而可以产生大量不确定的事件。在基于 agent的不同领域,如任务协调和路径规划等,移动 agent在未知环境下的追捕成为一个最有趣的挑战,该论文的总体目标是提出基于组织框架和博弈论的理论多 agent系统的协作机制,以检查和解决一些涉及多智能体的追捕及逃脱的问题。该联盟机制将允许 agent合作和自己协调自身任务,及时和有效地实现全局目标。在路径规划方面,提出了一种基于随机马尔可夫运动策略决策过程的方法(MDP)。此外,还开发了一种避障算法,允许 agent在遇到的障碍时可以采取一些有效的方法。仿真实验的目标是展示这些不同的机制在追捕的过程中如何影响的捕获时间和内在学习的过程。本文共分为五章:  第1章介绍了工作的主要目标以及对一些相关工作的原理及结果的介绍。该章节专注于探索适用于多Agent系统不同的任务和路径规划方法。此外,考虑到这些机制在关系到追捕和逃避问题的应用。这些章节的最后是关于论文工作的一些规范的介绍。  第2章提出了一种基于 Agent-组-角色(AGR)模型的联盟形成算法。该算法的应用为了衡量对不同的捕获者追捕群组的影响的形成及其面不同追捕者的稳定性。在这个模型中,多个 agent通过提出获得群组中的角色来形成群组。在联盟形成过程中,agent必须在群组创建的过程中执行一组特定的任务,以实现固定的目标。为了控制 agent的运动策略,利用基于马尔可夫的决策过程(MDP)的方法,允许在合作的多 agent系统中通过使用奖励和转移函数来决策问题。  第3章简述了其他两个基于组织原则的任务协调机制。以定义一个抓捕群组组访问机制为目标,提出了一个 YAMAM模型任务协调机制(Yet Another Multi-Agent Model)。确定了一些 agent,角色,任务和技能等概念来形成这个抓捕逃脱问题的框架,并优化的不同追逐群组组之间的任务共享机制。开发了一个灵活的基于模糊逻辑理论的 AGR模型。该模型的目的是让不同群组互动、组织和动态重组。在追逃问题上,提取出了不同程度的灵活性的组织模型的分组算法,突出了对逃跑者的捕获时间以及对动态重组的发展在任务执行过程中的积极作用。  在4章中,提出了一种迭代剔除劣势策略分散的联盟形成算法(IED)。这种博弈论决策过程是常见的解决问题的方法,该过程需要反复挑选出的占主导地位的战略,以确定通过这种方法达到平衡。  第5章重点研究了在追求目标的过程中所遇到的复杂的障碍如 U和 H的处理,提出了基于 bug算法和通过 MDP的应用来生成奖励的方法来实现避障。这个新的过程称为奖励错误算法(RBA),提高了 agent上传感器返回的环境数据的使用效率,证明了(RBA)是如何提高追捕者的目标转向正确率以及他们在障碍物躲避上的决策的效率。
其他文献
模糊推理是模糊系统和模糊控制的核心内容,受到广泛的关注。在模糊推理系统中,模糊隶属函数的确定和模糊推理规则的建立一直是难点问题,也是模糊推理系统的关键部分。B样条函
随着Web上的信息猛速增长,基于关键词全文匹配的传统搜索引擎,已不能满足用户在查全率、查准率方面的需求。同时随着科技的发展,人们对于智能化、专业化的需求也一直在提高,
科技项目管理是一项复杂的系统工程,有效管理科技项目是推动科技事业不断向前发展的重要因素。信息技术参与科技项目管理以来,发挥了巨大的作用,得到了各级科技管理部门的重
文档图像的版面分析是文档信息处理系统的重要组成部分,以及复杂文档OCR必不可少的环节,它是实现纸质文档数字化的重要环节。版面分析技术广泛应用于文档自动检索、办公自动
辨识和分析组织特异性基因及其调控关系对理解生物体的内在活动机制、具有针对性的疾病诊断和药物设计具有重要的作用。然而现今利用现代计算技术挖掘基因表达的组织特异性及
交通标志是道路交通系统中的重要组成部分,它为驾驶员安全舒适的驾驶提供重要信息。交通标志自动识别系统的研究对辅助驾驶系统和智能车系统具有重要意义。   交通标志识别
中间面对于薄板类零件CAE分析计算及CAE应用中六面体网格生成均有重要意义。本文针对CAD模型(B-Rep模型),研究了变(等)壁厚CAD模型的中间面生成技术。鉴于目前研究中对于变壁
信号分类一直是研究热点之一,如何对信号进行准确分类也是众多研究者追求的目标之一。分类在故障诊断和纹理图像检索中具有重要作用,在故障诊断运用中,可以通过对故障信号的
SaaS模式作为一种完全创新的软件应用模式,已经被认为是软件行业发展的无可争议的方向。从用户方面来看,SaaS软件拿来即用、无须维护、按需使用、随处可用、风险减小、成本降
无线射频识别(radio frequency identification,简称RFID)是一种新兴的自动识别人和物体的无线射频技术。具有标签存储容量大、识别距离远、可同时识别多个被标识物体、识别