基于参数时变离散DBN的无人机决策参数估计与学习方法研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:ping996115122xing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前无人机技术飞速发展,在军事领域的应用范围与深度更是突飞猛进,无人机所需要面临的环境越来越复杂,对无人机自主技术同样提出了越来越高的要求。自主技术涵盖“观测”—“判断”—“决策”—“行动”等四个方面,称为“OODA”环,而其中自主决策技术,作为无人机自主控制技术的关键技术之一,其策略的可靠性决定着无人机任务的成败。目前,基于贝叶斯网络的决策方法因其强大的逻辑推理能力在无人机自主决策领域得到了广泛应用,但仍然存在网络结构与参数固定,无法有效适应动态场景的情况。为了改进这一问题,本文以无人机自主决策任务为背景,以获得符合实际动态场景的决策结果为目标,研究基于一种参数时变离散动态贝叶斯网络模型的无人机推理决策方法,并提出了对应的参数估计与参数学习方法。本文主要工作及贡献如下:(1)分析了无人机自主决策任务场景中存在的各类要素与其对应特点,对自主决策特性进行了分析,在此基础上将其与贝叶斯网络进行了类比。首先以无人机任务背景为立足点,分析典型无人机任务决策场景要素与特点,并对场景中攻击单元、防空单元、攻击目标、气象地理环境四种要素进行了分析;然后对无人机决策特性进行分析,特别是针对任务过程中的不确定性,复杂性进行深度剖析;最后结合上述分析,对贝叶斯网络与无人机决策任务中内在特点进行了类比,详细研究了利用贝叶斯网络方法对无人机决策进行推理的可靠性和依据。(2)针对参数时变的特点,进行参数时变离散动态贝叶斯网络建模,同时引入滤波算法,进行网络参数估计。为了应对复杂的任务环境,特别是包含时序因素的各种非稳态系统,提出了一种参数时变离散动态贝叶斯网络模型并给出了推理框架,针对信息误差与干扰,在结合滤波算法的基础上,提出了一种网络参数估计方法。论文首先形式化描述了结构不变条件下的参数时变离散动态贝叶斯网络的一般数学模型,并给出了推理框架;其次,创新性地将参数时变离散动态贝叶斯网络模型的推理决策过程与滤波过程相结合;然后,在不同时间片输入相同证据值进行参数估计,并且加入重采样避免发生粒子退化现象。最后,利用一阶隐马尔可夫模型,在网络参数不同变化情况下开展了参数估计实验,结果表明该方法能够实现对时变网络参数的有效估计。(3)结合无人机自主决策任务面临的复杂动态情况,提出了一种基于参数时变离散动态贝叶斯网络的无人机决策任务参数学习方法,并在仿真环境中进行测试。当前无人机面临的任务场景越来越复杂,需要面对的动态变化情况也越来越多样,参数时变离散动态贝叶斯网络模型为无人机的推理决策提供了一种方法,但是贝叶斯网络推理决策的准确性很大程度上依赖于网络参数的准确性,本文通过分析滤波过程中建议密度函数的选择对于该方法效果的影响,同时对贝叶斯网络的参数学习进行研究与探索;其次,然后通过对多项式分布、狄利克雷分布的探索和研究,选取其作为粒子滤波过程的建议密度函数,实现参数学习;最后将改造后的参数学习方法运用于设计的无人机决策任务背景当中,进行仿真实验,和传统贝叶斯网络、动态贝叶斯网络对比,提高了决策的准确性和可靠性。(4)结合本文提出的参数时变离散动态贝叶斯网络方法,利用《星际争霸》平台及相关接口对无人机自主决策任务进行仿真测试。为了更好地验证本文方法在无人机自主决策任务中的效果,在简单仿真的基础上,本文在《星际争霸》测试平台环境的基础上,提出了面向参数时变离散动态贝叶斯网络模型的无人机自主决策方法测试环境。本文首先介绍了暴雪公司提供的《星际争霸》测试平台、BWAPI测试环境、Torch Craft接口,以及集成了贝叶斯网络各项功能的PGMPY工具包;其次,设定了模拟无人机决策任务的环境背景与参数,包括游戏地图、模拟无人机单元的行动集合与决策选择等内容;然后,采用“服务器—客户端”架构搭建综合测试环境;最后,使用前文中提出的参数估计方法与参数学习方法,在该测试平台环境中进行无人机任务决策的仿真环境测试,验证了方法的可靠性。
其他文献
本文针对战术导弹滑翔弹道在线参数辨识和弹道规划展开研究,降低其对飞行环境离线获取的依赖,提高导弹抗干扰能力和生存几率。分析了滑翔弹道的飞行特性。对助推滑翔导弹进行运动建模,分析飞行过程中各种约束及对弹道特性的影响规律。结合射程优化函数,对导弹机动性评价指标——射程覆盖区域进行仿真分析。以准平衡滑翔弹道为例,设计参数拉偏实验,测试大气和气动参数对飞行品质的影响。提出了基于分子光学大气数据系统(Mol
学位
在绿色发展的社会环境下,为了改善日益严重的环境问题,政府大力倡导绿色生产和绿色消费,一些国家开始制定减少环境污染的环境税政策,但是关于生产方和消费方排放责任的区分很少。供应链研究中大多假设渠道成员是理性的,但实际上决策参与者还会在意利润分配的公平性,且现实市场上由于制造商具有一定的生产能力和市场规模,多个零售商相互竞争的情况非常常见。因此,本文将在绿色供应链的背景下,刻画基于生产和基于消费的环境税
学位
从最原始的游戏形态发展到如今已不再局限于推理凶手的剧情,而是加入了机制阵营、情感演绎等更新潮的玩法,剧本杀的剧本写作迎来了更为丰富的创作契机。剧本杀剧本是悬疑小说、戏剧脚本和游戏说明书的综合体,注重给玩家带来拼图式的还原体验、戏剧式的沉浸体验和游戏式的交互体验。这三重创新不仅为剧本写作提供了独特的思路,同时也为不同艺术形式的融合发展提供了创新的路径。
期刊
近几年来,网络视频飞速发展,弹幕作为一种新兴的、社交化、主动性的互动形式越来越得到人们的欢迎,以B站为代表的视频网站形成了独特的弹幕文化,视频的弹幕和评论一起组成了视频用户互动方式。在互动视频内容创作内容、创作形式、创作人数飞速增长的前提下,视频流行度和用户关注度在现在互联网平台中就显得的至关重要。本文基于视频弹幕和评论以及用户的视频贡献行为,研究视频流行度和用户关注度影响因素,对于网络视频创作与
学位
精确的室内定位由于其广泛的应用价值备受研究者的关注,它在室内导航定位、机器人技术以及增强现实技术有着广泛的应用价值。这些应用可以利用提前建立的室内模型和视觉定位技术来实现。但是室内定位目前存在以下挑战,一是环境中缺乏明显的纹理,很多场景特征点缺少或不足;二是场景建模的数据量大以及计算量大,难以用于大规模场景的定位;三是系统复杂,对数据和设备的要求高,同时也导致系统成本高。针对这些问题,本文从多层级
学位
在大数据时代,如何从海量的社交网络数据中挖掘出有价值的信息是研究者们关注的热点。深度学习技术的兴起,为海量数据的处理与分析奠定了坚实的基础。事件检测和事件预测作为社交网络分析的子任务,在众多的应用领域中起着重要的作用,诸如交通预测、安全监视、欺诈检测、舆情管控等。因此,对事件检测及预测的研究在现实世界具有非常重大的意义。现有的事件检测方法并未重点关注事件相关的重要词汇和重要依存关系,而它们对于识别
学位
众包物流平台基于共享经济的理念产生、发展,平台通过移动互联网技术连接社会配送人员和消费者,降低了配送成本,同时给予消费者良好的配送体验。然而众包物流平台天然所具备的社会配送人员的不确定性和消费者需求的随机波动性,以及作为典型的双边市场而受到的网络外部性影响,使得平台在实际中时常面临因社会配送服务供需不匹配而造成的损失,进而对社会福利产生不利影响。因此,本文构建受网络外部性影响,处于不同市场需求环境
学位
目前,在线评论已经成为用户分享产品使用体验的主要方式。由于在线评论多是用户自发性的分享,它蕴含的需求信息更加丰富真实。在经济逐步稳健发展的大背景下,用户不再只关注功能需求,也开始注重产品带来的用户情感体验。因此,在竞争激烈的市场环境下,挖掘用户的感性需求对企业而言至关重要。但是,由于不同需求类别对满意度的影响不同,并且企业实际投入改进的资源较为有限,确定产品改进的优先级必不可少。本文采用基于在线评
学位
近年来,人体骨架数据在动作分析任务中得到了广泛的研究。由骨架的关键点按照人体内的连接自然构成的图结构包含了丰富的时空信息,可以准确地描述人体动作,并具有对背景噪声和光照等干扰因素的鲁棒性。图神经网络对于这种图结构具备有效的特征提取能力,成为了研究人体骨架数据的深度学习算法和实际应用的热点。在利用人体骨架数据实现的动作分析任务中,动作识别、动作预测和动作检测三个问题具有重要的研究价值,解决这些问题的
学位
近年来,在跨境贸易数字化的推动下,各种跨境电商互联网平台应运而生,跨境电商得以快速发展。然而,相对于日益成熟的国内电商而言,跨境电商面临着需求、关税、汇率等不确定因素以及跨境电商贸易政策的影响。此外,跨境电商的发展离不开跨境物流的支持,以海外仓和边境仓为核心的双仓模式给跨境物流提供了新思路。但目前关于跨境电商贸易环境与政策的研究多以定性研究为主,本文采用随机规划的建模方法展开研究,为跨境电商企业提
学位