基于深度学习的桥牌出牌策略研究与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:hz_gyf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器博弈作为人工智能领域的重要研究方向和检验人工智能发展水平的重要手段,始终以其巨大的趣味性和挑战性吸引着众多研究者。研究棋牌类智力竞技游戏中规则复杂、充满合作和博弈的代表——定约桥牌,有助于对非完备信息博弈中尚存在的问题提出解决方案,推进机器博弈、人工智能领域的发展。围绕桥牌出牌策略的选择,创新性地使用深度学习的研究方法,构建并实现了出牌策略选择程序,模仿学习现有的桥牌智能观察局面信息选择出牌的过程,给出该局面下合理的出牌策略,并针对选择系统设计实现了出牌预测可视化系统,将系统的预测结果直观地展示出来。与现有的基于蒙特卡洛搜索的桥牌机器人不同,本文采用深度学习理论和方法研究桥牌出牌。建立深度学习出牌模型和评估模型,通过基于搜索的桥牌机器人在桥牌对局中产生的大量专家经验数据,给出某一局面下各张手牌被打出的概率和指定牌张的价值,同时提出了出牌模型的多种改进方案。深度学习出牌模型和评估模型共同构成了出牌策略选择程序,根据牌张被打出的概率及其价值确定最优的出牌策略,在更短的时间内做出与基于搜索的桥牌机器人相同或相近的决策,用以替代基于搜索的桥牌机器人。此外,为辅助研究者观察系统的做出的决策,理解、改进和测试模型,设计实现了基于Web服务的出牌预测可视化系统,直观展示了出牌模型和评估模型的预测结果。
其他文献
为探讨基于行为改变理论的护理在永久性肠造口患者中的应用效果,选择2018年4月至2020年2月于我院接受永久性肠造口的100例患者,随机分为对照组和观察组,各50例,对照组接受常规护理干预,观察组接受基于行为改变理论的护理干预,比较2组干预后2个月时患者的自我管理能力及知信行能力.结果显示,干预后2个月,观察组患者自我管理能力之手术认知、日常生活、症状管理、心理调适和造口管理能力评分均明显高于对照组,知信行能力之知识、态度和行为维度评分亦明显高于对照组,P<0.05.结果表明,对永久性肠造口患者实施基于行
为探讨专科护士主导的基于加速康复外科(ERAS)理念的护理在短段型先天性巨结肠(HD)患儿中的应用效果,选取50例短段型HD患儿随机分为观察组和对照组,各25例,观察组接受专科护士主导的基于ERAS理念的护理,对照组接受常规护理,比较2组患者术后疼痛程度及恢复情况.结果显示,观察组患儿术后疼痛程度评分明显低于对照组,P<0.05;观察组患儿术后排气时间、排便时间及肛管、胃管、尿管拔除时间均明显短于对照组,P<0.05.结果表明,专科护士主导的基于ERAS理念的护理可有效减轻短段型HD患儿术后疼痛,促进术后
当前,研究者在科学探索中不断产生科研成果并向社会发表,进而产生了大量的科研数据。数据的发展导致科研数据的检索、管理和分析变得越来越具有挑战性。因此,如何在庞大的科研数据中准确地检索出所需的数据,并从数据中提取有效信息进行分析已经成为研究者密切关注的问题。本文针对科研数据中同名作者和论文的对应关系以及作者间的合作关系进行探索研究。第一,本文针对论文的作者署名与现实生活中的作者实体对应关系中存在的同名
随着互联网行业的蓬勃发展,国家网络安全和个人数据隐私变得愈发重要,光通信物理层安全首当其冲。虽然光缆天然地不受电磁干扰,但其难以抵御来自线路或节点的窃听攻击。合法通信方常通过预共享密钥对信息加密的方式来确保通信安全。利用传输信道的不可预测性和随机性,并将其转化为密钥是一种有前景且经济有效的方法。由于光纤信道的唯一性,合法双方与非法方的密钥源客观上存在不对称性,故该类密钥分发方案具备高安全性,而且所
复杂的骨科手术对机器人提出了更高的要求,智能化、微创化和精准化成为骨科手术机器人的发展方向.根据骨科手术方法分类,将骨科手术机器人分为关节骨科、创伤骨科以及脊柱外科手术机器人三种.本文介绍了几类典型骨科机器人的发展状况,论述了骨科手术机器人的技术特征,并对骨科手术机器人的发展前景进行展望.