【摘 要】
:
目前经典的规划模型虽然还占统治地位,但因其处理不确定情形的能力太弱,研究者在此基础上提出了各种规划模型,还从运筹学、决策学、控制论及经济学的角度引入了新的模型用于
论文部分内容阅读
目前经典的规划模型虽然还占统治地位,但因其处理不确定情形的能力太弱,研究者在此基础上提出了各种规划模型,还从运筹学、决策学、控制论及经济学的角度引入了新的模型用于人工智能的规划问题.基于决策论的规划(DTP)特别适合于处理不确定情形下的规划问题.马尔可夫决策过程(MDP)是其中应用最多的模型,把规划问题看作是给定环境的模型和奖惩原则的情况下,寻求最优策略的问题.用值迭代的方法可以求解MDP的确良最优值函数,然后从最优值函数得到最优策略.该文的主要贡献有四点,分别是:1、基于PO9MDP的口语对话模型;这是该文最重要的贡献和创新之处.研究人员提出的基于POMDP的口语对话系统模型可以很好的处理对话中的不确定性,是对不确定规划模型和对话模型的一个重大贡献.基于贝叶斯网络的观察抽取模型、各种近似算法的应用研究及改进更是为这个口语对话模型进一步应用奠定了基础.2、基于Agent团队的强化学习模型;引入可变换的主导Agent作为主角,从团队角度进行多Agent强化学习是理论方面的又一大创新,能大大提高不确定环境中Agent团队的决策能力.3、实用的口语对话系统;该系统结合了多种技术,能在特定领域进行有效的人机对话,是应用方面的一个贡献,也是使POMDP口语模型进入实际应用的良好基础.4、RoboCup仿真球队;对国内机器人足球的发展做出极大的贡献,同时也为国际RoboCup的研究和开发做出了贡献.
其他文献
该文介绍了面向电视机顶盒的有线电视网数字信息广播系统(DIVB:DigitalInformation&VideoBroadcasting)的研制,包括系统的整体设计,数据协议的制定、前端数据发送软件的研制以及
该文可分为三个部分.第一部分由第一和第二章构成,主要对医疗数据通讯和3DMED系统设计进行概述;第二部分由第三章构成,着重从通讯协商、信息编码、SOP服务类等方面对DICOM协
该文利用面向对象的思想,首先将地图符号分为点、线、面、文本四种类型,并从地图符号中抽象出构成地图符号的8个基本图元,然后在此基础上设计了地图符号库的面相对象模型和数
该文介绍了基于Web的自适应考试系统及其开发工具的框架和部分实现过程.系统结合了网络技术、数据库技术、数据库与Web互联技术及构件技术.该文分析了建立题库的理论基础——
该文主要讨论分布式多层应用的实现技术,包括分布式构件的开发,多层结构的设计方法,分布对象的设计原则,提出并实现了通用数据访问层来解决分布环境下的数据访问,设计并实现
由于炼铁工艺的专业性和复杂性,为阐述本文内容,首先介绍了高炉炼铁的一般过程, 说明了铁水含硅量预测的技术价值和主要的技术难度。然后,运用时间序列方法,对含硅
本文首先深入分析了CTI技术和IP技术的内涵,对基于CTI技术和IP技术的业务进行了展望,并认为网络技术和网络业务的融合是网络统一化发展的最终趋势。基于这个认识,随后本文分析了
随着信息技术的飞速发展,嵌入式系统的应用越来越广泛,从传统的通信设备到消费电子,再到工业领域,可谓是无处不在。嵌入式系统的更新换代越来越快,这就对开发工具提出了更高
本文首先探讨了当前流行的分布式数据库结构及应用体系结构,其中详细讨论了分布式数据库的实现途径,分析了浙江万里学院管理信息系统(MIS)的体系结构和功能需要,提出如何建立基于
针对MPEG数据数据结构的特殊性,该文研究了MPEG图像加密算法.通过分析研究MPEG图像编码过程和已有的几种MPEG图像加密算法,找到了MPEG图像加密算法的加密原则--优秀的MPEG加