基于DFL的多agent学习模型研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:FOFOXX
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Agent学习是近年来广泛受到人们关注的热点问题之一。针对agent学习过程中,agent本身属性以及环境所存在的动态模糊性特点,本文基于动态模糊逻辑(DFL),给出了一种多agent学习模型,包括agent心智模型、agent的心智状态及其相关公理、agent的工作原理、即时回报的单agent学习算法、基于DFL的Q-learning算法、多agent学习算法等,并将这些算法用于解决实际问题,实现了基于DFL的纸牌游戏系统。由此可以看出,本文的特色主要体现在如下几个方面:(1)提出了基于DFL的agent心智状态模型,为研究agent学习模型及算法奠定了基础;(2)提出了基于DFL的单agent和多agent学习模型算法,进一步丰富和发展了agent学习的基本内容;(3)实现了多agent学习算法在纸牌游戏中的应用。当然,这些工作还很初步,还有许多方面需要进一步研究:如学习算法的优化,模型在具体领域的应用等。
其他文献
质量保证已经成为软件行业越来越重要的一个指标。不管项目采用的是什么软件开发模型或流程,软件质量都是软件开发项目能否成功的一个关键的因素。敏捷开发是一种相对来说较新
RSA是一种公钥密码算法,其加密密钥和算法本身都可以公开,解密密钥则归用户私人拥有。从诞生那天起,RSA就因为安全强度高、使用方便等卓越性能受到关注,并得到广泛应用。目前
排课问题是一个涉及多因素约束的、多目标的、结构复杂的典型组合优化问题,并且已被证明为一个NP完全类,其问题求解的时间复杂度呈指数函数增长。分布式环境下的排课所面临的突
随着诊断技术的激烈竞争和计算机技术的迅猛发展,设备的状态检测与故障诊断已成为现代工业生产、航空航天和国防建设中的重要内容,也是科学界研究的热点之一。本文在分析各种神
随着WiFi与ZigBee技术的不断发展以及他们在日常生活中发挥着越来越重要的作用,如高速网络接入和火灾监控等,这两种异构网络得到了越来越广泛的部署。由于WiFi和ZigBee共享2.
无线Adhoc网络是一种具有高度动态拓扑结构的网络。每一个无线Adhoc网络由一组移动节点组成,它们与传统的蜂窝技术的根本区别在于移动节点之间的通信是在没有固定基础设施支持
汉语言认知是认知神经科学领域中的重要分支。目前,针对多音字的研究还比较少,其认知机制还尚不清楚。因此,本研究的主要工作是采用具有高时间分辨率的事件相关电位(Event-Re
本系统是在对我校招生管理流程进行完整而深入分析的基础上,结合学校实际业务以及校园网络应用环境的需求,进而提出基于.NET框架的一种C/S和B/S模式相结合的设计与实现综合方案
数据挖掘领域里,分类问题一直以来都是的一个重要研究分支。在当前多数据源数据日益普及的情况下,对数据挖掘领域中分类问题的研究也提出了新的挑战,例如如何从多个数据源中
当今,用蛋白相互作用网络研究蛋白功能已经成为科学界的一个热点。科学家通过对蛋白相互作用网络的研究发现相互作用的蛋白质趋向于具有相似的细胞功能。聚类方法能根据蛋白