再励学习相关论文
PID控制是最早发展起来的控制策略之一,在控制理论和技术飞速发展的今天,PID控制由于其简单、稳定性能好、可靠性能高等优点,仍广泛的......
近年来Agent以及MAS的研究成为分布式人工智能研究的一个热点。单Agent因个体所拥有的知识、能力的限制,因此对MAS的研究迅速发展。......
在过去的二十年中,计算机网络经历了爆炸式的增长,随之而来的是越来越严重的拥塞问题。拥塞控制是确保Internet鲁棒性的关键因素,......
设计活动是产品开发过程中最重要环节之一,在CAD(Computer-Aided Designl),CAE(Computer-Aided Engineering)和CAM(Computer-Aided M......
提出了一种综合智能化的控制系统设计思想,并将其应用在发电机的励磁控制上,所设计的综合智能型电力系统稳定器兼顾对发电机端电压......
在诸如机器人足球赛等典型的可分解马尔可夫决策过程(factored Markov decision process,简称FMDP)模型中,不同状态属性在不同的状......
结合控制系统设计问题的特点,将遗传算法和再励学习分别引入到模糊神经网络控制器的离线训练和在线应用过程中,提出了一种综合智能......
针对解决对传统的多A gen t再励学习算法中,A gen t只能独立学习、不能合作学习的问题和启发式算法中只考虑了单个A gen t而没有推......
本文给出了一种改进的基于再励算法的神经网络BOXES控制系统,引入超维椭球体模糊划分状态空间的概念,并且通过神经网络的再励学习......
综合考虑再励学习的两个重要子问题 :连续空间及语言评价问题 ,提出了一种新的学习方法 ,即面向语言评价的 Takagi-Sugeno(T-S)模......
为了研究仿人、能量高效的双足机器人步行,研制了由MACCEPA(mechanically adjustable compliance and controllable equilibrium p......
本文对具有时滞的不确定控制对象提出了一种带有神经网络的Smith预估器再励学习控制方法 .文中还给出了再励学习系统中模糊自适应......

