基于博弈学习的无人机集群围捕方法研究

来源 :西安工业大学 | 被引量 : 0次 | 上传用户:xixijeffkol
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
无人机集群协同围捕是无人机集群协同对抗领域的一个典型问题,对时效性和准确性要求较高。本文面向无人机集群对不同规模下智能化目标的协同围捕任务,分析了围捕集群和逃跑目标行为策略之间的关联性及围捕集群中各节点决策选择的相关性,研究了阿波罗尼斯圆、博弈学习、强化学习相关理论,提出了基于博弈论与强化学习的无人机集群协同围捕方法。具体如下:1)分析了围捕无人机和逃跑无人机的运动特性和相互作用关系,建立了基于阿波罗尼斯圆和博弈论的协同围捕模型,将无人机集群围捕中的信息映射为博弈论的关键要素。2)针对单逃跑者围捕问题。通过改进的Q学习算法对逃跑者的行动策略进行学习,并在学习过程中不断更新状态-动作矩阵,结合累计奖赏均值动态调整贪婪因子以加快学习速度;利用积累的学习经验求解博弈支付矩阵得到纳什均衡解,使得各围捕无人机得到较优行为策略并完成对单目标的围捕任务。实验结果表明,本文所提改进Q学习方法相较于传统方法能更有效地学习逃跑无人机的行为策略,此外,本文提出的协同围捕方法在处理单目标围捕任务时表现出较好的时效性。3)分析了多目标围捕任务中多架逃跑无人机的特性,考虑到多架逃跑无人机具有合作或分散式两种逃逸选择,建立了基于虚拟目标点的多目标围捕判定模型,使得围捕无人机集群能更有针对性的对逃跑无人机进行围捕。实验结果表明,本文所提围捕判定模型的可行性和有效性。4)针对多逃跑者围捕问题,提出了一种基于改进博弈学习的无人机集群协同围捕方法。根据逃跑无人机的信息对围捕无人机集群进行任务分配产生一个或多个团队,分析围捕过程中可能出现的各种情况对团队进行调整,结合基于博弈学习的协同围捕方法完成对多目标的围捕任务。实验结果表明,本文所提方法相较传统Q学习方法以及博弈学习方法能够有效对多目标进行围捕,且具有较好的时效性。综上所述,本文根据无人机围捕特性,建立了基于阿波罗尼斯圆的协同模型,采用累计奖赏均值动态调整贪婪因子的Q学习算法,设计的基于改进博弈学习的协同围捕方法。能在多对一、多对多等不同博弈模式下完成快速有效的围捕,经过实验仿真证明,本文方法比同类算法在围捕的时效性、判断的准确性两方面上展现出较好的性能。为解决无人机集群协同技术的应用提供了一些技术参考。
其他文献
伟大精神需要弘扬,精神血脉需要赓续。中国共产党的发展历程是一部中国共产党领导广大人民从积贫积弱的近代中国走向民康物阜的盛世强国的不懈奋斗史,也是一篇不断培育精神个体、赓续精神血脉的传承录。新时代背景下,建设具有强大凝聚力和引领力的社会主义意识形态是时代的主旋律、社会的正能量。因此,赓续与弘扬中国共产党人的精神谱系就是一项意义深远的重要举措,深入探讨中国共产党人的精神谱系赓续与弘扬的发轫之始、历史进
学位
红色家风是中国共产党人在长期革命、建设和改革实践中培育形成的光荣传统和优良作风,集中体现了革命前辈积极进取的精神境界、奋发图强的精神力量、严于律己的精神风貌和大公无私的精神人格。互联网、云技术等信息技术的发展,正在改变着大学生人格的某些特征,如自我观念、思维习惯、价值观、信仰等。而功利主义、拜金主义、利己主义等严重影响大学生人格的形成与健康发展。现代社会竞争的根本是人才的竞争,社会的发展最终是人的
学位
奋斗精神是中华民族精神的具象化表述,是贯穿中国共产党百年奋斗历史经验的一条红线,绘就了中国人民特有的精神图谱,是中国人民世代传承,所保留下来的精华所在。中华民族五千多年来凝聚的奋进力量,为中国现代化建设提供精神力量。党的十八大以来,习近平总书记在多个场合对“奋斗”“奋斗精神”做出重要论述,回答了时代之问,为全国各族人民奋发图强、矢志奋斗,擘画出宏伟蓝图,极大的鼓舞了中国人民的斗志。当代大学生肩负时
学位
液晶光学相控阵是一种非机械式光束扫描控制器件,具有体积小、功耗低、灵活性高、电控可编程、稳定性好等优点,在激光成像雷达、空间光通信、激光整形、光学成像和自适应光学等领域具有广泛的应用前景。目前液晶光学相控阵主要采用逐行扫描、蛇形扫描、螺旋扫描和高斯扫描等方法实现单光束扫描,存在扫描速率慢,捕获效率低的问题。因此,本文开展了液晶光学相控阵多光束扫描方法及应用的研究。论文工作主要内容如下:从液晶光学相
学位
学位
机载光电稳瞄平台作为一种融合了光学、精密机械、图像采集与处理、自动控制等领域的先进设备,其作用是隔离来自外界的干扰,以保证光电探测设备能完成对目标物的瞄准、捕获、跟踪,由于其在工作时会受到诸多扰动因素影响,故为提高机载光电稳瞄平台的鲁棒性和扰动抑制能力,本文开展了基于机载光电稳瞄平台的视轴稳定控制策略研究。本文的主要研究工作以及创新性成果如下:1、探究了机载光电稳瞄平台组成与基本工作模式,建立了系
学位
分布式多孔径光学成像系统作为新型光电探测设备,具有同时探测多维度信息、体积小、精度高的优点,将在现代军事技术、工业制造技术等领域发挥着越来越重要的作用。光场成像技术作为分布式多孔径成像技术的一种,迅速发展且日益成熟,基于光场成像技术的全光相机,可以实现四维光场信息采集,已经广泛应用于工业领域。但传统的光场成像系统存在分辨率低、景深小、成像质量低的问题,为解决这一问题,本文对分布式多孔径光场成像系统
学位
弹丸过幕时刻提取精度对光幕阵列测试系统尤为重要,但是在信号调理电路的影响下,系统输出信号的动态性能下降,导致输出信号产生畸变失真,各通道信号一致性变差,系统的测量结果误差增大。论文利用非线性有源自回归神经网络算法,构建了光幕阵列的动态补偿模型,并通过仿真分析了补偿前后系统响应的动态特性,结果显示该方法可大幅度提高光幕阵列响应的动态特性。文章主要研究内容和结论如下:1)基于光幕阵列测量原理,设计了一
学位
合成孔径雷达(Synthetic Aperture Rader,SAR)是一种成像雷达,由于其优越的高分辨率特性得到广泛应用。它是由天线进行信号的发射和接收,并将接收信号储存,经数字信号处理技术将储存的信号进行叠加处理形成图像。由此可见天线是SAR系统中关键硬件子系统,因此通过对天线系统的研究设计进而提高SAR系统的性能是很有必要的。无论是军用还是在民用方面,机载SAR都有着广阔的市场,随着科技的
学位
陕西省绥德师范学校做为“西北革命策源地”,为中国的革命事业培养了大批杰出人才,该校走出的师生群体立足于陕西地区的实际状况,开展了一系列卓有成效的革命工作,为西北地区党团组织、西北红军、西北革命根据的创建与发展做出了巨大贡献。本文对1923年至1935年该群体在陕西地区的革命活动进行研究。本文从经济、社会、文化环境等方面探究了绥德师范学校的创建背景,分析了绥德师范学校师生群体的群体特征。考察了192
学位