基于强化学习的群智感知激励机制研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:lmh116
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
其他文献
协作机器人不仅需要具备强大的可控性和灵活性,更需要具备自主作业的能力以应对复杂作业任务。然而,目前的机器人控制系统面临着运动编程效率低、控制柔性不足等问题;此外,传统柔顺控制方法过度依赖传感器及环境模型,已经难以满足日益复杂的工作任务需求。因此,如何提高机器人系统的技能学习、泛化和交互能力已经成为适应新一代协作机器人发展的关键举措。本文一方面设计机器人的增量运动控制器,重点解决传统神经网络控制器中
学位
由于大脑高度发达,人类能够轻松准确地应对各种各样的复杂事件。人脑被认为是最复杂同时也是最智能的系统,主要表现在:“边做边学”,即在工作过程中完成学习,并将学到的知识记忆/存储在大脑中;“学以致用”,即存储的知识可以在新的任务中作为经验得以应用。受此启发,人们提出高级的智能控制方法,如神经网络控制等,用来处理动态环境中复杂系统的控制问题。智能控制的一个主要特点是具有足够的关于人的控制策略、被控对象及
学位
在恶劣天气环境和人类活动(如烟雾、烟雾、灰尘)影响下,大气中的雾霾所引起的低对比度和有限能见度会造成所获得图像的雾化。雾化图像会严重影响到基于计算机视觉应用的实现,因为这些应用程序需要鲁棒清晰的图像属性,如在目标识别、目标定位和跟踪等中的应用。  图像获取中雾霾的形成往往是基于两种成分的结合:光的衰减和大气光。相机从观察到的场景中获得的辐照度会随着气溶胶视野的影响而衰减;入射光通量与来自各个方向的
学位
随着控制对象越来越复杂,对控制性能指标要求也越来越高,同时系统运行机制受到多方面因素的制约,许多实际控制问题须通过切换系统理论才能得到更好的解决,切换系统分析与综合研究成为了学术界和工程研究领域的热点问题。切换系统的动力学行为不仅取决于各个切换子系统,还与切换规则密切相关。平均驻留时间(Average Dwell Time, ADT)切换规则是切换系统分析与综合的一种有效工具。尽管经过数十年的研究
学位
随着现代社会生活水平的不断提高,人们对精细化三维物体表达模型的需求日益增加。与此同时,三维点云获取方式的日益丰富也使得我们对周围世界的数字表达能力得到了显著提升。因此,在当前的行业发展背景下,利用三维点云高效简便地生成高精度的三维网格模型也开始显得尤为重要。点云表面重建技术作为一种三维网格模型的典型生产方式,因其便捷和高效的特点,在诸多行业领域逐渐得到了广泛的应用。  本文主要聚焦于基于屏蔽泊松方
学位
近些年来,随着城市化进程的加快以及公共交通系统的发展,可供居民选择的出行方式越来越多:公共汽车、私家车、地铁、网约车、共享单车等。以这些出行方式为基础,结合搭载在其上的硬件设备获得的卫星导航信号等相关数据,应用先进的物联网,大数据等技术,人们可以对使用这些出行工具的用户进行行为分析和研究,获得用户的出行行为以及需求特点。从而解决城市的交通以及规划等问题,促进城市的发展,提高居民的生活质量和幸福指数
学位
近年来,随着机器人技术的发展,服务机器人逐渐走进人们的日常生活中。人们对服务机器人的智能化提出了更高的要求,希望服务机器人可以根据人类的表情提供更加有针对性的服务。然而,主流的表情检测算法基于深度学习,运算量很大。机器人端运算能力有限,如果在机器人端进行表情检测,很难保障检测的实时性,也会影响机器人对其他任务的处理以及机器人的续航。目前通信技术快速发展,因此考虑把复杂费时的表情检测算法放到服务器端
学位
软件缺陷预测作为软件质量保证领域的重要手段,可以提高软件的可靠性和稳定性,根据应用场景不同,软件缺陷预测可以分成三类:项目内缺陷预测(WPDP)、跨项目缺陷预测(CPDP)和异质缺陷预测(HDP)。异质缺陷预测是近年研究的热点,它面临的主要挑战有:  (1)隐私保护问题:执行异质缺陷预测的一个重要前提是,这些源项目的缺陷数据能够从其他公司获取,然而在实际操作过程中,因为担心公司的隐私被泄露,数据拥
协作型多智能体系统在智能交通系统、多个机器人协作运输等领域中都有着广泛的应用和巨大的经济价值,因此已经成为控制领域中的一个研究热点。本文从两个方面研究了多智能体系统的协作控制问题。首先,利用事件触发控制和复拉普拉斯矩阵等方法,研究了具有输入时延的多智能体系统的相似编队问题。然后,研究了基于QMIX算法的多智能体协作控制系统在训练过程中,因限定了每个episode中的训练步数导致的伪终态问题。具体研
学位
机器学习在大数据时代得到的广泛应用,随机梯度下降成为了求解这类大规模机器学习问题的基础方法。随着数据规模的增长,模型越来越大,机器学习模型的训练尤其是对于深度学习模型的训练正变得越来越耗时。因而,设计出能够高效加速训练的分布式优化算法,在机器学习的研究与应用中变得至关重要。当前大规模机器学习的训练中,往往采用分布式随机下降算法,其通过让多台机器协同计算来加速训练过程。然而,由于其算法过程中引入了多
学位