【摘 要】
:
将模拟退火算法的Metropolis准则用于平衡模糊Q学习中探索和扩张之间的关系,提出基于Metropolis准则的模糊Q学习算法Simulated Annealing Fuzzy Q—learning(SA—FQL)。利用SA—
论文部分内容阅读
将模拟退火算法的Metropolis准则用于平衡模糊Q学习中探索和扩张之间的关系,提出基于Metropolis准则的模糊Q学习算法Simulated Annealing Fuzzy Q—learning(SA—FQL)。利用SA—FQL算法优化区域的公共周期,在给定周期的基础上再用SA—FQL算法优化区域中各干线相邻两路口的相位差,最后根据交通流量确定各路口的绿信比。TSIS仿真结果表明,相比基于Q学习和模糊Q学习的控制方法,该方法能显著提高学习速度和交通效率。
其他文献
目的:探讨、分析肠扭转的临床表现、影像诊断及治疗原则。方法:对2014年5月至2018年2月河南科技大学第二附属医院和郑大一附院急诊科收治的12例急性肠扭转患者的临床资料进行
虚拟现实视频的一大特征是具有沉浸式体验,可以让用户体验身临其境的感受。联合视频探索小组(Joint Video Exploration Team,JVET)将虚拟现实视频编码纳入下一代视频编码标准研究范围内,并提出了虚拟现实360度视频方案。虚拟现实视频的分辨率很高(通常为4K至8K),编码需要耗费的时间很长,给此类视频实时编码带来了困难。论文重点研究了虚拟现实视频的帧内编码问题,提出了基于纹理特
采用CFD方法对水在矩形光滑微通道内的流动和传热特性进行了数值模拟.计算结果表明微通道的长径比、当量直径、高宽比和孔隙率都对其流动和传热有着不同程度的影响.在保持长
该文从医疗器械监管队伍、信用体系建设及《医疗器械质量管理规范》实施情况等方面介绍了我国医疗器械生产企业监管情况,提出了监管难点并给出监管建议。
建立双机协同被动探测的任务模型,运用模糊理论对问题状态空间进行泛化,针对不同的探测阶段给出了目标转移函数的不同形式,通过合理定义动作空间和奖励函数将问题描述为Markov决
本文以王安忆的<小鲍庄>和莫言的<红高粱>、乔良的<灵旗>为代表,对20世纪80年代中后期出现的结构小说,运用叙述学的理论,从叙述视点、叙述结构、叙述层次、叙述语调等方面分
通过综合考虑城市规划和铁路规划,提出了高速铁路引入深圳地区的客运站设置方案,在吸引更多客流的同时,使铁路客运站与城市交通有效结合起来,减少旅行时间,充分发挥高速铁路
《日用化学工业》主要报道关于表面活性剂及其原料、洗涤用品(包括洗涤剂、皮肤清洁剂、头发清洗剂及肥香皂等)及其专用助剂、个人护理用品(包括各类化妆品、护理品和口腔卫
<正>广西蝗区是我国南亚热带东亚飞蝗的重要蝗区之一,与暖温带和北热带地区的蝗区略有不同.据文献报道该虫在冀、鲁、豫、苏、皖等地年发生2代,世代重叠不明显;在海南年发生4
快乐的教学环境,可以使识字教学变抽象为具体,变死板为灵活、生动。作者在识字教学中,积极探索省时高效的识字教学方略,切实培养学生主动识字、自愿识字的能力,巧妙地引导学生自主