论文部分内容阅读
模糊控制和神经网络技术是人工智能系统中两种重要的理论,虽然它们从属于两个截然不同的学科领域,其基础理论也相差较远,但是它们都能模拟人的智能行为,从而解决不确定、非线性、复杂的自动化问题。神经网络与模糊推理的融合可以解决各自在信息处理与控制中存在的不足,并通过互补构造出功能更加完善、更加智能化的系统。神经模糊控制系统就是两个学科相互融合的产物,神经网络的并行处理能力和学习能力为智能控制领域注入了新的活力,同时也提出了新的问题。一方面,在引入了模糊量之后,节点需要进行精确数值计算和模糊计算的转化,使得神经元在输入量和输出量之间的传递函数变得更加复杂,对神经模糊控制系统的硬件实现提出了极大的挑战。针对这个问题,本文中提出了一种新型的单向线性响应(Unidirectional Linear Response)神经元,通过ULR单元可将神经模糊网络中各层神经元的不同的传递函数进行转化,从而将神经模糊控制器中的神经元全部转变为同一种神经元,这样使神经模糊控制器的节点类型变得单一化,硬件实现变得相对简单。另一方面,在神经模糊控制中应该选用什么样的学习算法呢?传统反向传播(Back-propagation)算法适用于各种多层神经网络的学习,但是在神经模糊控制系统中,由于隶属函数中往往存在一些尖点,导致算法中的微分运算无法进行,只能采用近似计算的方法;并且BP算法存在会使系统陷入局部极小值的问题。遗传算法是一种很好的全局优化算法,但是它对不同的问题需要使用相适应的变量编码方案,尤其在参数较多的情况下,对参数进行有效的编码变得极其复杂。为此,本文提出了一种基于线性搜索LS(Linear Search)的强化学习算法,强化学习(Reinforcement Learning)是一种无监督学习方法,而线性搜索算法是参数优化中常用的一类算法,其中的多种方法都是采用类似于遗传算法中跳跃式选点的方式,能够在一定程度上避免陷入局部极小值,并且算法简易可行,不需要遗传算法中那样复杂的编码和规则。我们将这二者结合起来,得到一种复合的模糊神经网络学习算法。本文将前述单向线性响应神经元(ULR)和基于线性搜索(Linear Search)算法的强化学习算法引入到神经模糊控制系统中,设计了一个用于非线性系统的自适应多层神经模糊控制系统,给出了用ULR单元实现的该神经模糊控制系统的详细结构,介绍了基于线性搜索的强化学习算法在本系统中的应用方法。并通过将该神经模糊控制系统应用到倒立振子平衡控制系统中,验证了这种新的复合学习算法的可行性。我们将仿真实验得到的数据,与同等参数条件下应用TBP(Temporal Back Propagation)学习算法的神经模糊控制器的结果数据进行了多方面的比较,结果表明,该算法的确能够在一定程度上避开局部极小点,并且在控制系统中具有比TBP更为有效的学习效果。