基于状态演算和MDP的最优规划研究

来源 :江苏大学 | 被引量 : 0次 | 上传用户:jackzhao1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
智能规划是近几年人工智能领域中的一个研究热点,因其广泛的应用价值和在理论研究中的重要地位,受到越来越多的学者关注。马尔可夫决策过程是研究随机环境下多阶段决策过程优化问题的理论,与行动推理相结合,可以实现最优规划。状态演算为一种行动推理形式化系统,通过刻画动态系统变化规律,实现智能体在初始状态下根据目标状态进行的自动推理。   本文基于状态演算和MDP,围绕着效能函数对最优规划进行研究,主要工作如下:   (1)初步实现一种基于状态演算的最优规划。在状态演算的基础上,根据智能体的目标状态,设定一个特定的目标函数,实现最优规划。   (2)对MDP规划进行深入研究,将MDP中的报酬函数,效能函数引入到状态演算当中,提出了基于状态演算和MDP的最优规划。通过引入规划式,给出规划式语法和语义,用以描述规划中各动作间顺序,非确定选择等关系和规划式中不同动作关系的效能函数更新规则,特别是非确定选择动作关系,最终实现最优规划。   (3)设计和实现了基于状态演算和MDP最优规划的规划器MDPSC。给出规划器的组成部分,并根据规划式的语义,利用Prolog语言实现MDPSC的解释器。针对报酬函数的两种情形,通过两个实例,验证了基于状态演算和MDP的最优规划是可行的。  
其他文献
纹理合成指的是由一个小的样图产生一个任意大的纹理图像,样图和结果图像应该被观察者认为是同一种纹理,并且在结果图中不存在明显的接缝问题,纹理合成的结果应该是非周期的
与生命体类似,一个软件也要经历孕育、诞生、成长、成熟、衰亡等阶段,软件开发模型作为描述软件开发、活动和任务的结构框架能清晰、直观地表达软件开发的全过程,明确规定了
随着Internet的普及和电器的智能化和网络化,一种连接各种电子设备、特别是移动和无线设备的普适计算模式正在形成,服务发现协议在这种网络的发展趋势中应运而生。服务发现协
物以类聚,人以群分。今天,面对互联网上日益增长的数据,聚类在数字图像处理、物种类别分析、网络社区发现、信息安全监测、企业商务智能决策和文本数据挖掘等领域得到了越来
通用游戏是人工智能最具挑战性研究领域之一。近年来得到快速的发展,在军事行动、电子商务、商业流程管理等方面有巨大实用价值。通用游戏的目的在于设计一个只接收游戏的游
灾害性天气的预报和警示在人们的生产、生活中具有举足轻重的地位。天气的历史数据和预报员的经验往往对气象预测的结果起着重要作用,通常预报员可以根据当前的天气情况和历
随着数字化信息时代的到来,越来越多的数字化产品普及到了人们的日常生活。虽然数字化技术对信息的处理、传播和复制了提供极大的便利,但同时它也带来了一些负面效果,如版权
在传统的TCP/IP协议中,IP地址同时表示节点身份与位置,存在语义过载问题,导致核心路由表扩张,移动性差,多宿主等诸多问题,基于位置/标识分离思想是解决该问题的方式之一。但
随着计算机技术、数据存储技术和数据库技术等飞速发展,特别是互联网技术的广泛应用,个人电脑和互联网服务器上每天都会出现海量数据。从这些数据中挖掘出有价值的信息以指导
随着水资源的日益紧缺和农业机械化的要求,微灌已成为精确农业的一个重要组成部分。由于无线传感器网络(WSN)在许多场合的成功应用,国外已经将WSN技术应用于大范围农业微灌控