再励学习相关硕士博士期刊学术论文

再励学习相关论文

一种基于模糊神经网络采用再励学习的PID控制器

PID控制是最早发展起来的控制策略之一，在控制理论和技术飞速发展的今天，PID控制由于其简单、稳定性能好、可靠性能高等优点，仍广泛的......

学位

PID控制器模糊神经网络智能控制被控对象控制原理模糊控制技术控制理论控制系统设计参数组在线调整

基于进化的再励学习方法的多机器人地图构建研究

近年来Agent以及MAS的研究成为分布式人工智能研究的一个热点。单Agent因个体所拥有的知识、能力的限制，因此对MAS的研究迅速发展。......

学位

Agent MAS 地图构建协同进化再励学习

基于智能控制的主动队列管理算法研究

在过去的二十年中,计算机网络经历了爆炸式的增长,随之而来的是越来越严重的拥塞问题。拥塞控制是确保Internet鲁棒性的关键因素,......

学位

拥塞控制模糊控制再励学习主动队列 NS

支持创新概念设计的多Agent系统

设计活动是产品开发过程中最重要环节之一，在CAD(Computer-Aided Designl)，CAE(Computer-Aided Engineering)和CAM(Computer-Aided M......

学位

计算机辅助概念设计多Ageni系统功能-行为-状态模型合同网模型再励学习遗传算法

面向多移动机器人系统的再励学习方法研究

随着多移动机器人系统的应用越来越向未知领域如医学领域、深海探测和航空航天领域等方向发展,在未知环境下解决避障路径规划问题......

学位

多移动机器人系统避撞路径规划再励学习平均报酬模型函数逼近器再励函数结构分层再励学习 MDP模型环境部分可观测模型

综合智能型电力系统稳定器的研究

提出了一种综合智能化的控制系统设计思想,并将其应用在发电机的励磁控制上,所设计的综合智能型电力系统稳定器兼顾对发电机端电压......

期刊

模糊神经元网络遗传算法再励学习电力系统稳定器

一种基于特特征向量提取的FMDP模型求解方法

在诸如机器人足球赛等典型的可分解马尔可夫决策过程(factored Markov decision process,简称FMDP)模型中,不同状态属性在不同的状......

期刊

群体Agent合作求解可分解马尔可夫决策过程线性规划再励学习维数灾

汽轮发电机组汽门开度控制器的综合智能化设计方法

结合控制系统设计问题的特点,将遗传算法和再励学习分别引入到模糊神经网络控制器的离线训练和在线应用过程中,提出了一种综合智能......

期刊

模糊神经网络遗传算法再励学习汽门开度控制

对称和非对称的启发式多Agent再励学习方法

针对解决对传统的多A gen t再励学习算法中,A gen t只能独立学习、不能合作学习的问题和启发式算法中只考虑了单个A gen t而没有推......

期刊

多Agent系统再励学习启发式算法

一种改进的基于再励学习算法的模糊神经BOXES控制系统

本文给出了一种改进的基于再励算法的神经网络BOXES控制系统,引入超维椭球体模糊划分状态空间的概念,并且通过神经网络的再励学习......

期刊

模糊BOXES控制系统模糊神经网络再励学习

面向语言评价的Takagi-Sugeno模糊再励学习

综合考虑再励学习的两个重要子问题 :连续空间及语言评价问题 ,提出了一种新的学习方法 ,即面向语言评价的 Takagi-Sugeno(T-S)模......

期刊

再励学习语言评价 T-S模糊推理系统神经-模糊控制函数逼近 Q-学习模糊数

基于再励学习的被动动态步行机器人

为了研究仿人、能量高效的双足机器人步行,研制了由MACCEPA(mechanically adjustable compliance and controllable equilibrium p......

期刊

机器人双足机器人被动动态步行再励学习

具有时滞的不确定系统再励学习控制

本文对具有时滞的不确定控制对象提出了一种带有神经网络的Smith预估器再励学习控制方法 .文中还给出了再励学习系统中模糊自适应......

期刊

不确定对象再励学习模糊控制神经网络

看过本文同时还关注