基于启发式强化学习的双种群蚁群算法应用与研究

来源 :上海工程技术大学 | 被引量 : 0次 | 上传用户:gl24334119
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器人产业作为科技变革的重要领域之一,如何提高机器人的智能化以及工作效率,一直以来都是学者们研究的焦点,高效的路径规划则是达到上述目标过程中最基本同时也是最关键的一步。在解决机器人路径规划问题上,蚁群算法被证明是一种很高效的算法,但是大多数都是针对单种群蚁群算法进行改进,在面对较复杂的环境时,性能下降比较明显。本文首先从经典蚁群算法展开研究,根据先验知识,建立有效的启发式函数,改进单种群蚁群算法;接着结合强化学习相关理论,提出一种启发式强化学习机制的双种群蚁群算法,并通过TSP问题验证算法的先进性;最后将双种群蚁群算法应用到机器人的路径规则之中,验证算法的性能。具体研究工作如下:首先针对蚁群系统(Ant Colony System,ACS)在解决TSP问题上存在易陷入局部最优和收敛速度较慢的问题,本文提出了一种改进的启发式蚁群算法。在迭代前期赋予伪随机因子较小的阈值,从而使蚂蚁能以较大的概率选择轮盘赌方式完成解的构建,扩大了解的搜索范围;同时通过引入迭代最优蚂蚁进行全局信息素更新,来进一步增加了解的多样性,使算法避免陷入局部最优。在迭代后期随着伪随机因子参数值变化幅度的加快,则用至今最优蚂蚁来取代迭代最优蚂蚁,以促进搜索进程很快的向最优解附近收敛,加快了收敛的速度。实验仿真结果表明改进后的算法在前期能够有效的跳出局部最优,并且在后期能够明显提升收敛速度。其次提出了一种基于启发式强化学习的异构双种群蚁群算法。蚁群分为主种群和子种群,主种群负责解的构建和信息素的更新,子种群则是在构建解的同时对主种群的解集进行替换。算法初期利用启发式算子自适应地控制两个种群的交流频率,通过偏离度系数控制解的交换方式。前期让子种群的最优解去替换主种群的随机解,增加解的多样性,同时引入强化学习机制对交流后主种群最优路径上的信息素进行自适应的奖赏,以增大最优公共路径以后被选择的概率。后期则控制子种群的最优解去替换主种群的最差解,强化最优路径上信息素的量,并对主种群最优路径上的信息素进行奖赏,进一步提高算法的收敛速度,最后通过TSP问题的对比实验,验证了算法能够更好的在收敛性和多样性上达到平衡。最后,将启发式强化学习的双种群算法应用到机器人路径规划之中。首先通过栅格法作对比实验,验证了算法的先进性;然后利用ROS系统中插件将算法应用到turtlebot机器人的路径规划中,验证算法的有效性;最后通过Gazebo仿真平台搭建仿真环境,通过turtlebot扫描得到保存环境信息的二维矩阵,将矩阵数值处理后得到模拟仿真环境的栅格地图,进一步验证算法在较为复杂的环境中的性能,实验结果证明算法可行性。
其他文献
宋话本是中国文言小说系统和白话小说系统的分水岭,在我国古代小说史上占据重要地位,其中涉及北宋都城东京和南宋都城临安的两京故事,占据了宋话本总数的绝大部分。空间叙事是近几年叙事学领域研究的热点,与中国古代文学的结合研究日渐增多。本课题以目前中西方的空间叙事理论为基础,对宋话本中两京故事的空间叙事进行研究。全文共由绪论、正文、结语三部分组成。绪论部分主要说明本课题的研究目的和研究意义,梳理相关领域的研
声表面波马达可通过结构简单的叉指电极直接激发声表面波产生驱动信号。因而,声表面波马达除了具有超声马达的优点外(比如高输出力,高速度等等),还有一些其它的优点,比如纳米级的精确定位,易于小型化等等。此外,非接触式声表面波马达通过定子与转子之间流体层中的声流来驱动转子运动。由于不需要依靠转子与定子间的接触摩擦来提供驱动力,故与接触式声表面波马达相比具有无摩擦损耗、寿命更长、转速更高等优点。这也使得非接
随着核电的大力发展,核电站在全球范围的大规模建立,核电站和乏燃料后处理厂每年将要产生大量的放射性非工艺低放废液,其中放射性洗衣废水的处理需要尤为关注。在放射性洗衣废水的处理实践中,只使用单一方法处理放射性洗衣废水一般并不能达到预期的效果,因此需要将多种工艺组合起来,以达到预期效果。本文采用了气浮、膜分离、吸附方法对放射性洗衣废水模拟液进行单一工艺和组合工艺的处理。通过单一方法的使用,对模拟洗衣废水
随着互联网的飞速发展,各类网络业务和应用所产生的网络流量呈现爆发式增长,同时,信息的安全性问题也受到越来越多的关注,密码技术在保护隐私和数据传输安全方面得到了极大的应用,因此,加密流量在网络传输中的比重越来越大。但是这在保障信息安全的同时,却也给异常流量检测和网络监管带来了严峻挑战,很多病毒、蠕虫等恶意软件利用加密和隧道技术绕过安全设备的检测和防御,因此对加密流量进行检测识别成为业内研究的热点。当
构造解释和储层预测在油气勘探开发中皆起着重要的指导作用,地震资料解释能够解决构造地质方面的问题,储层预测结果直接影响油气藏开发的效果。随着三维地震勘探技术的普及以及采集、处理和解释技术的提高,高分辨率的油气勘探开发对储层预测的精度也提出了更高的要求。井震联合反演是目前提高井震储层预测精度的重要方法。其中反演方法、反演参数的优选、井资料对反演过程的质控以及精细的构造解释都是制约储层预测效果的关键问题
经济主义思潮出现在十九世纪末二十世纪初无产阶级革命运动不断激烈的俄国,其本质是小资产阶级利用机会主义思想企图通过改良的方式发展剥削无产阶级的资本主义经济。此时无产阶级中立场不坚定的同志被经济主义思潮所影响,严重危害了无产阶级的革命事业,加之俄国革命事业还没有一个坚强的无产阶级政党的领导,封建势力不断扼杀党的积极分子,社会民主革命危在旦夕。列宁审时度势,积极对错误的经济主义思潮进行深刻彻底地批判,强
近几年,世界经济增长面临下行压力,贸易保护主义和单边主义甚嚣尘上,国际经济环境充满不确定性,瘟疫、自然灾害等事件时有突发,中国经济面临的环境十分复杂,经济下行压力较大。为推动产业升级和助力经济转型,2015年12月,国家供给侧结构性改革中首次提出“去杠杆”,2016年在中央经济工作安排中明确要把降低企业杠杆率做为非常重要工作来抓,下大力气规范企业和地方政府的举债活动。2017年7月,国家金融工作会
2008年全球金融危机,中国工业气体行业发展受到经济疲软,制造业低迷的影响,市场增速缓慢。2012年行业回暖,市场对于工业企业的需求受到基础建设投资和新兴市场石油储备的影响
中国特色社会主义进入新时代,意味着社会主义意识形态建设具有广阔发展空间的同时,也面临着更多复杂的挑战。新时代我国社会主义意识形态引领力建设,必须重视社会主义意识形态本身的牵引和领导作用,注重培育社会成员的心理认同以及行动上的遵循。建设具有强大引领力的社会主义意识形态是对历史和现实的深刻把握和总结:一方面,是对我国意识形态领域建设经验与教训的回顾反思以及对苏东前社会主义国家意识形态建设教训的警示;另
目标检测是计算机视觉和图像处理中一个重要的研究领域,随着大数据时代的到来,基于深度学习的目标检测方法成为了研究的热点,虽然检测精度远超过传统的方法,但是仍然无法同时满足对于实时性和准确性的要求。为了平衡网络模型的大小和检测性能,本文采用轻量级网络MobileNet进行深度特征学习,并结合SSD框架来实现目标检测,MobileNet结合SSD能够有效地对网络模型的大小进行压缩,并提高检测速率。但是在