CGF战术任务规划行为建模关键技术研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:konashu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机生成兵力(Computer Generated Forces,CGF)战术任务规划是在作战仿真系统中,CGF为达到其作战目的而进行的一系列规划推理和选优决断活动,是构建真实可信的作战仿真系统的重点和难点。目前的CGF战术任务规划行为建模技术存在领域知识获取困难、战场环境不确定、行为模型过于简单等问题,针对这些不足,论文以研究CGF行为建模中战术任务规划行为模型框架为目标,重点围绕战术任务规划行为建模关键技术展开研究。论文的主要贡献及创新点如下:(1)对不确定环境中规划过程面临的重难点问题进行分析,设计了一种复杂动态战场环境下CGF战术任务规划行为建模框架,以满足不确定对抗环境中CGF战术任务规划行为建模的需求。真实战场环境中,任务规划过程面临环境信息不确定、对手行为不确定、动作效果不确定等难点。为提高规划算法对不确定环境的适应性,保证规划结果的准确性、有效性,论文设计了一种不确定战场环境下的CGF战术任务规划行为建模框架。首先,分析了作战仿真中CGF战术任务规划行为建模与其他任务规划相比的特点,从感知信息、对手判断、模型表示三个方面明确了建模需求。其次,分析并运用分层任务网规划方法作为研究问题的算法基础,设计了一种通用的不确定战场环境下CGF战术任务规划行为建模框架,从环境信息处理、对手行为分析、规划结果预测等方面详细描述了框架的关键组件与决策过程。最后,研究剖析了框架中部分可观环境下的状态评估方法、面向分层任务网的对手行为建模方法、面向动作效果预测的态势评估方法三个关键技术模块,分析了模块间的相互关系和定位,为后续具体研究工作的展开确定需求与边界。(2)针对部分可观环境中,历史信息完整与历史信息不完整两种情况,分别提出了基于历史信息的状态生成方法与基于模糊理论的状态生成方法,并与敌对规划分层任务网修复规划方法结合,从而实现部分可观环境下的战术任务规划。在实际战场中,由于存在战场迷雾,感知范围有限,对抗双方感知到的环境信息往往是不完整的。为有效解决由于信息不完整带来的状态不确定问题,提出了两种状态生成方法。首先,通过“状态-动作”信息集对部分可观环境信息进行形式化描述,分析状态动作的变化过程;其次,在基于信息集的信念状态基础上,针对历史信息完整以及历史信息不完整条件,分别提出了基于历史信息的单一状态生成方法以及基于模糊理论的单一信念状态生成方法,并将两种状态生成方法与对抗分层任务网修复规划算法进行结合,形成了适用于部分可观环境下的优化分层任务网规划算法。构建了有侦察动作与感知范围的部分可观对抗环境,对两种规划算法的有效性与效率进行了验证。(3)针对对手行为分析问题,提出了面向对抗分层任务网的隐式对手建模方法,使用基于粒子滤波的策略匹配算法对对手行为进行建模,与对抗分层任务网结合形成博弈对抗分层任务网算法,使生成的规划方案更具有针对性。对手行为不确定,是不确定环境中对规划过程影响较大的因素。为确保规划的前瞻性,必须将对对手行为的预测纳入到规划的过程中。现有智能规划算法中,为提高单步规划效率,通常对对手建模进行简化处理与假设,却忽略了对手模型的多样性与动态性。为了有效预测对手行为,提出了一种基于策略匹配的隐式对手建模方法。首先,提出了基于粒子滤波的策略匹配算法,在给定对手策略集基础上,不断迭代计算表征不同策略的粒子估计动作与实际动作的匹配程度,并基于此更新不同策略粒子的数量,直至满足获取对手稳定策略条件。其次,构建基于策略匹配的隐式对手模型,对对手下一次动作进行预测。在此基础上,将隐式对手建模方法与对抗分层任务网相结合,提出博弈对抗分层任务网方法。最后,在不同对抗环境、不同对手设置情况下,对提出的方法进行验证。(4)针对规划结果预测问题,通过对评估指标及权重进行优化设计,提出了动态分层估值网评估方法,并基于多尺度卷积神经网络对最终胜负结果进行预测,实现从整体态势上对规划的动作效果进行评估。动作效果评估,是通过对未来形势变化的预测和推理,从而判断当前动作的执行效果,为规划提供基础。考虑到环境动态变化对估值的影响,提出了动态分层估值网方法,构建分层估值网对估值因素以及因素间的相关关系进行管理,并通过动态计算因素权值,实现态势的动态评估。为解决估值因素提取困难、权重设计复杂的问题,提出了基于胜负预测的离线态势评估方法。将战场环境信息抽象为多维信息数组,提取不同时刻的态势信息与对应的胜负结果,构建多时刻状态数据集以及单时刻状态数据集。使用基于Goog Le Net的多尺度卷积神经网络模型对数据集进行学习训练,从而准确预测游戏胜负。
其他文献
同步定位与建图(Simultaneous Localization and Mapping,SLAM)是指机器人在未知环境中移动时利用所搭载传感器的观测数据进行场景地图构建,并同时估计机器人在地图中的位置及运动轨迹。随着低成本三维视觉传感器(RGB-D相机)技术的成熟,三维视觉SLAM技术成为机器人领域和计算机三维视觉领域中新的研究方向。本文以实际应用需求为牵引,利用RGB-D相机可同时采集彩色图
随着大数据和硬件计算资源的发展,人工智能当前进入了深度学习时代,深度学习时代具有两个最为显著的特点:一是计算量大,二是在多个应用领域效果远超传统方法。传统的人工智能方法虽然计算量相对较少,但是其性能遇到了天花板,很难进一步提高,而目前来看深度学习只要数据量足够,通过合理的网络设计以及足够的计算其在性能上往往都具有非常高的潜力。为了获得足够的深度学习计算加速,当前展开了各种硬件竞赛,比如GPU上针对
机器学习作为人工智能技术的核心支撑受到了广泛的关注。数据规模不断增长,对最优化方法求解机器学习模型带来了新的挑战。本文以提高随机最优化方法在大数据条件下的收敛速度和精度为目标,针对随机梯度降噪算法计算效率低、自适应梯度方法泛化能力低、随机拟牛顿方法收敛速度慢、基于随机梯度下降的Lookahead方法调参要求高等问题,从随机梯度下降算法的弹性降噪、自适应梯度方法的边界调度、随机拟牛顿方法的降噪加速、
随着近年来国内外多条商业运营线路的开通,磁浮列车逐渐成为轨道交通领域研究和发展的热点和焦点。高速磁浮列车作为一种新型轨道交通制式,对于解决大城市间的快速交通问题,建立和完善我国高效立体的高速客运体系具有重要意义。本文以时速600公里高速磁浮列车悬浮系统为研究对象,对悬浮系统的性能优化问题展开研究。论文针对高速磁浮列车悬浮搭接结构建立数学模型,并根据模型特性设计标称控制器。由于高速磁浮列车长期运行过
计算机生成兵力(Computer Generated Forces,CGF)是作战仿真领域的关键前沿技术之一。意图识别行为是CGF认知行为建模的重要研究方向,可有效解决现有模拟仿真系统中CGF行为模式固定可预测、对抗与协同能力不足、态势分析与处理水平低等问题。策略型意图识别行为建模是考虑战场竞合关系条件下,对一般意图识别行为的泛化研究,有助于CGF更富策略性地识别敌友作战意图。研究面向CGF的策略
动态目标防御技术是一种新型的网络安全技术,通过构建、评价和部署多样化、不断迁移并且随时间变化的机制及策略的方式,增加攻击者的攻击难度及代价,有效限制脆弱性的暴露及被攻击的机会,提高系统的弹性。本文结合新一代网络架构SDN直接灵活、集中式的网络控制能力优势,对动态目标防御网络的相关关键技术进行了深入研究,主要研究工作及创新点如下:对于基于SDN的路由随机变换技术,本文分析了路由随机变换的相关问题,从
随着人们对互联网的依赖日益加深,保证互联网正常且稳定地运行是社会稳定运行的前提。但随着网络安全威胁技术不断升级,新的网络安全威胁不断涌现,网络安全面临较严峻的形势。而网络规模的不断增大,网络流量数据规模的增大,给网络流量的分析和异常检测带来了许多困难。因而,如何实时准确地发现大规模网络中存在的网络流量异常行为,保障网络正常且有效地运行,对提高网络的可用性和可靠性具有重要的意义。目前网络流量异常检测
近年来,人工智能技术迅猛发展,在全球范围内受到了广泛关注。以卷积经网络(Convolutional Neural Networks)、图卷积神经网络(Graph Convolutional Neural Networks)为代表的深度学习算法的不断更新迭代对计算机系统的计算性能与能耗要求急剧提高。然而,由于近年来摩尔定律发展的停滞以及冯诺伊曼结构限制,现有的数据中心架构无法高效地实现深度学习与大数
场景重建与语义分析理解是计算机视觉、计算机图形学以及机器人学中的难点。随着工业和娱乐领域对数字几何需求的不断增长,对场景进行建模与分析理解比过去任何时候都更加重要。近年来深度扫描技术的快速发展使得场景的数据建模越来越便捷,由于这一技术的革新,场景的重建和语义分析技术经历了由简单到复杂以及由低维到高维的发展演变。另一方面,移动机器人经过多年的研究和发展,已经逐步走向实用化,在制造业、物流业、服务业等
从片上多核系统到高性能计算机系统,互连网络作为节点之间通信的基础部件,一直是限制系统性能提升的瓶颈。路由器是互连网络的基础结构单元,负责网络中报文的转发,是影响网络吞吐率和报文传输延迟的关键部件。路由器基本结构包括输入端口、缓存、交换开关和输出端口等。其中,缓存用于存储路由器中等待转发的报文,而交换开关负责将报文无冲突的从路由器输入端口转发到输出端口。片上网络通常通过简化路由器流水级来降低报文通过