【摘 要】
:
对抗训练是当今和平时期军事训练的主要方式。传统的假想型单一化对抗训练方式受技术条件和认知水平的限制已经不能满足目前对于训练模式的创新要求。本文针对智能学习对抗训练系统中机器人的动态目标快速识别、复杂环境下路径规划方法、以及智能学习算法进行研究,主要研究包括以下几个方面:(1)针对对抗训练环境中目标位置时变的特点,提出了 一种利用光流法对动态目标生成候选区域的对抗训练目标识别方法。该方法首先利用光流
论文部分内容阅读
对抗训练是当今和平时期军事训练的主要方式。传统的假想型单一化对抗训练方式受技术条件和认知水平的限制已经不能满足目前对于训练模式的创新要求。本文针对智能学习对抗训练系统中机器人的动态目标快速识别、复杂环境下路径规划方法、以及智能学习算法进行研究,主要研究包括以下几个方面:(1)针对对抗训练环境中目标位置时变的特点,提出了 一种利用光流法对动态目标生成候选区域的对抗训练目标识别方法。该方法首先利用光流法提取图像中的动态目标作为候选区域,然后通过深度卷积神经网络对候选区域进行目标识别,解决了传统方法因穷举候选区域而导致检测速度慢的问题。采用金字塔算法对光流法进行改进,利用图像金字塔对图像进行逐层分解,以迭代的方式逐步求解光流值,进一步提高了候选区的生成速度。针对传统深度学习算法收敛速度慢的问题,提出了利用归一化方法优化的深度学习算法,并在大规模数据集下进行了测试,验证了算法的通用性和有效性。(2)研究了对抗训练机器人动态复杂环境下的路径规划问题,提出一种融合全局路径规划和局部路径规划的APF-PRM混合路径规划方法。该方法采用随机路径图法生成可安全到达目标点的路径点集,利用路径点集产生“中间力”,通过改变合力解决了人工势场法陷入局部最小值的问题。针对改进的人工势场法中参数设置不当时,其路径不是最优的问题,利用粒子群算法对APF-PRM混合算法的引力、斥力和“中间力”的系数进行优化,进一步缩短了路径长度,增加了路径的安全性。(3)针对多变环境下的对抗训练问题,开展了对抗训练机器人自主学习和智能决策算法研究。首先总结了对抗训练问题的特点,针对对抗训练过程较长、对抗态势复杂、非预期情况多的特点,将基于Team Q-learning的智能学习算法引入到对抗训练中,使对抗训练机器人通过自主学习不断更新对抗策略、积累经验,找到应对各种作战环境下的最优策略,实验表明该算法成功实现了对抗训练机器人在对抗训练任务中的自主学习。(4)针对Team Q-learning算法随智能体数量增加导致的状态空间维数灾难问题,提出了一种利用可变分辨率的K-means聚类算法减少状态空间维数的TQ-Kmeans算法,通过对环境状态进行相似计算,将相似状态合并,减少了算法中状态空间的维数,解决了 Team Q-learning算法的维数灾难问题。通过实验证明TQ-Kmeans算法具有更快的收敛速度。本文基于Python开发了移动机器人对抗训练仿真实验平台,将以上研究成果应用到对抗训练中,仿真实验进一步验证了本文提出算法的可行性和有效性。该研究对促进人工智能技术与军事训练的结合发展具有一定的意义。
其他文献
生物质资源是一种地球上广泛存在的可再生资源。随着“生物质精炼”技术的发展,更加多样的生物质精细利用途径被开发。在木质纤维生物质炼制过程中,三大组分清洁高效分离是实现精细利用的重要前提。本文以活性氧/固体碱组分分离技术(Cooking with Active Oxygen and Solid Alkali,CAOSA)为核心,分析了组分分离过程中木质素降解过程,开展了木质素降解机理研究;完善了黄液成
真核细胞中,主要负责编码蛋白质基因转录的是RNA聚合酶Ⅱ,即RNA Pol Ⅱ[1]。转录延伸在早期并没有受到足够的重视,但随着研究的不断深入,特别是正性转录延伸因子——P-TEFb(Positive Transcription Elongation Factor B)的发现,使人们认识到转录延伸也具有高效有序,精密细微的调控机制。随着对P-TEFb研究是深入,陆续发现了和P-TEFb结合的一些蛋
锂离子电池在移动电子器件、电动汽车乃至规模储能等领域得到广泛应用。然而,锂离子电池的能量密度(250~300Wh kg-1)远不能适应人类社会经济发展日渐增长的需求。Li-O2电池和Li-CO2电池分别具有3500和1876 Wh kg-1的理论能量密度,有望成为新一代储能体系。对于Li-O2电池,若以空气中的O2作为原料气时不可避免的受到空气中CO2的影响,产生副产物碳酸锂(Li2CO3),从而
肺癌是一种严重威胁人类健康和生命的恶性肿瘤之一,其发病率和死亡率位居所有癌症之首。放疗和化疗仍是肺癌的主要治疗方案,肺癌细胞的治疗耐受严重影响了患者的治疗效果。异常激活的DNA修复是导致癌细胞治疗耐受的主要原因,因此开发和使用靶向DNA修复抑制剂增强癌细胞治疗敏感性是肺癌治疗的新型疗法。多发性内分泌肿瘤Ⅰ型(multiple endocrine neoplasia type 1,MEN1)综合征致
近年来,人为因素引起的的重金属污染广泛地影响了中国河口地区生态系统的健康。海洋双壳贝类作为河口生态系统的重要底栖类群之一,具有容易累积重金属以及对重金属较为敏感的特点,因此其正常的生理过程(如生长,繁殖)在重金属污染的环境中很容易受影响,进而影响整个河口区生态系统的稳定以及水产养殖的经济效益。缢蛏(Sinonovacula constricta)作为中国河口地区常见的埋栖性海洋双壳贝类,是中国水产
本研究依托中国第29次和30次南极科学考察航次,开展了南大洋普里兹湾和南极半岛附近海域悬浮颗粒有机物碳、氮同位素组成的研究,揭示了研究海域颗粒有机碳、氮含量及其碳、氮同位素组成的空间分布特征,探讨影响颗粒有机物碳、氮同位素组成的影响因素,并进一步应用瑞利模型和稳态模型计算混合层中浮游植物吸收无机碳和硝酸盐过程中碳、氮同位素的分馏因子,以及中深层颗粒有机物再矿化过程中氮同位素的分馏因子,获得以下主要
疟疾是由疟原虫引起的经按蚊叮咬传播的一类寄生虫病,2016年世界上共有91个国家和地区仍然遭受着疟疾的危害,造成了 40多万人死亡。目前还没有疟疾疫苗正式投入临床使用,青蒿素联合用药疗法是目前疟疾流行地区的一线治疗方案,但是在大湄公河次区域已经产生了青蒿素耐药性疟原虫虫株,这对疟疾的治疗和控制产生了极大的威胁,开发新的抗疟药物已经刻不容缓。作为一种在宿主细胞内生长的寄生虫,疟原虫依赖于宿主提供的营
mRNA翻译成蛋白质是重要的基础生理过程,与细胞生长分化、神经系统功能和记忆、衰老等密切相关。翻译异常可引起包括癌症在内的一系列疾病,因此翻译是基因表达中调控最严格的步骤之一,同时翻译与营养和能量状态以及环境诱因如压力条件等紧密联系。虽然翻译在概念上被分为独立的生化步骤——起始、延伸、终止和核糖体循环,但最近的证据表明,翻译调控在体内以一种整合的方式发生,同时影响多个步骤。eIF3家族蛋白是mRN
人类与其他动物相比重要区别在于人类拥有高等认知能力,这种认知能力集中体现在学习记忆和语言表达方面。而高等认知能力的物质基础是进化过程中人类形成的高度复杂的大脑,人类大脑特征主要体现在相对脑容量的增加、神经元数目增加和神经元之间连接的更加丰富。遗传因素对大脑进化起着重要作用,人类进化过程中所产生的ARHGAP2C、TBC1D3、TMEM14B、NOTCH2NL和SRGAP2C等新基因,参与人类大脑发
海水中过量的磷会引发水体富营养化和缺氧等环境问题,而海岸带沉积物内源磷的向上释放是海水磷的重要来源。还原条件下异化铁还原和硫酸盐还原不仅是海岸带沉积物有机质早期成岩的重要路径,也是固相活性磷再活化的主要途径,而氧化条件下铁氧化物的存在有效控制了对磷的吸附钝化,铁、硫的氧化还原循环是驱动沉积物磷循环和跨界面交换的关键因素。然而在快速的全球变化和人类活动影响下,敏感的海岸带沉积环境变得更加动态和复杂,