四国军棋的人机博弈搜索算法研究

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:hubai123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人机博弈是人工智能的一个重要研究领域,其中不完全信息的人机博弈能够模拟现实复杂世界中不确定环境下的决策,因此越来越受到关注。四国军棋是一种典型的不完全信息游戏,其特点是不仅需要在对手和同盟棋子信息不确定的情况下做出决策,而且需要考虑与同盟的合作问题。在人机博弈研究中,博弈树的搜索是提高人机博弈系统智能的核心问题之一。四国军棋的博弈树具有分支庞大,支付值模糊等特点,这给四国军棋博弈树搜索的研究带来了困难与挑战。本文围绕四国军棋的人机博弈搜索算法展开深入的研究与分析,主要工作如下:1.针对四国军棋开局中博弈树分支多,模糊度大的特点,提出了基于定时器的期望搜索算法Aspiration with Timer算法,简称为AWT。AWT算法利用定时器动态调整窗口来提高搜索效率,快速找到次优解使游戏进入中局。实验结果表明,它以较小的额外内存消耗换取了快速的搜索效率。2.针对四国军棋不完全信息性,本文提出基于信息论的一种新的搜索算法——Alpha -Beta-Threshold算法。该搜索算法使用门限观念能动态调整搜索深度,其核心思想是在确定度高的分支上搜索的深度比较深,在不确定度高的搜索分支上搜索的深度比较浅。3.由于Alpha-Beta-Threshold算法的性能和着法的排列顺序很相关,本文进一步提出了一种改进算法Certain-Threshold算法。Certain-Threshold在搜索开始的时候,首先按照确定度以及着法的好坏进行排序,首先搜索确定性高的,好的节点的分支,产生更多的剪枝,提高算法性能。为了处理相同支付值情况下不同路径熵的问题,我们进一步改进,提出了Best-Certain -Threshold算法,综合考虑静态估值和路径熵,通过一定规则重新定义了支付值。4.为了更好讨论和分析Alpha-Beta-Threshold,Certain-Threshold,Best-Certain -Threshold算法性能,本文通过人工产生随机博弈树和四国军棋产生的博弈树两种方法进行实验比较与分析。实验结果显示:Alpha-Beta-Threshold算法,Certain-Threshold算法,Best-Certain-Threshold算法所访问的节点同等规模下访问的节点依次减少,而花费的内存依次增多。
其他文献
常用的多目标优化方法自身的不足及其在实际应用中存在的诸多困难,一直阻碍着多目标优化方法的发展。在20世纪80年代中期,进化算法开始应用于解决多目标优化问题。目前涌现了
行人异常检测是当今世界智能视觉系统研究中一个十分活跃的新领域,应用到地铁、道路、超市出入口等环境中有着明显的社会和经济效益。将远程控制与计算机视觉分析技术相结合使
由于无线传感器网络中节点的能源、计算能力和带宽都非常有限,因此设计能够有效节约能源、延长网络生命周期的协议成为其研究的重点之一。从减少网络能量消耗的角度出发,本文
互联网的迅速发展、信息网络的应用普及、信息传输媒体的数字化演变进程的推进,使得电子图书馆、在线服务和电子商务等先进的多媒体服务有了十分广阔的前景。然而,在全球一体
随着信息技术的迅速发展,大量文本信息不断涌入我们的视野,在这样一个信息化时代里,如何快速有效地在这浩瀚的信息海洋里找到需要的东西是亟待解决的问题。目前的检索效果不是很
本文首先针对P2P网络中的核心问题一资源定位算法,做了深入的分析和探讨。针对不同类型的P2P网络,本文分析,比较了三种最典型的对等网资源定位算法—集中式对等网络算法、非
公理设计—面向对象软件设计框架是设计公理应用于软件设计的主要成果,它在功能域和结构域之间自顶向下进行“之字形”分解映射。每层的分解映射过程,都要依据设计矩阵分析设计
文本聚类属于无监督的机器学习方法,是自然语言处理领域的一大研究热点,已成为文本信息进行有效地组织、摘要和导航的必要环节。谱聚类是目前研究比较多、应用十分广泛的一种
随着信息技术的迅速普及,计算机网络逐渐成为人们完成相关工作的不可或缺的手段,但也带来了许多严重的安全问题。网络安全态势感知是近年网络安全领域的一个新兴研究课题,它
现代互联网应用引发了对海量数据进行并行化处理的需求,越来越多的计算任务需要在拥有成千上万个相互独立的计算节点的装置上完成。于是Hadoop MapReduce作为新一代的编程系