论文部分内容阅读
本文以RoboCup3D仿真的机器人足球比赛为研究背景,主要针对南京邮电大学Apollo3D团队中机器人的个体动作设计以及团队协作机制进行深入研究,设计了新的机器人行走、踢球及团队协作办法,优化和提升了整支队伍的进攻与防守性能。本文的主要工作及贡献如下:(1)首先,提出了一种基于小脑模型连接控制网络(Cerebellar Mode ArticulationController,CMAC)的仿人机器人闭环控制全向行走方法。方法通过规划机器人足部空间的三次样条轨迹,建立仿人机器人行走的双线性倒立摆模型(Double Linear Inverted Pendulum,D-LIP),由机器人躯干和足部位姿通过逆运动学计算机器人腿部各关节的当前角度值,与此同时,依据机器人的传感器信息值通过CMAC模型不断修正逆运动学的关节角度,实现机器人稳定快速的全向行走模式。(2)其次,针对RoboCup3D仿真中双足机器人的踢球动作设计与优化问题,提出了一种基于协方差自适应矩阵进化策略(Covariance Matrix Adaptation Evolution Strategy,CMA-ES)优化的三层渐进积累学习的踢球方法。通过机器人最佳踢球点和足部空间运动轨迹的规划,以踢球后足球运动的直线距离和找到踢球点所花费的时间为优化目标,实现第一层灵活性踢球的学习优化;基于机器人质心和陀螺仪传感器反馈的双平衡机制下的第二层稳定性学习优化;第三层精准踢球的积累学习则是以足球上触球点的选择、机器人踝关节加权惩罚值和踢球任务的完成情况为优化目标。引入该方法下的踢球机制,不仅保证机器人自身的稳定性,同时还确保踢球距离的远近和角度的精准。(3)最后,在RoboCup3D多智能体系统中实现整个团队的协作策略。主要是基于角色分配函数、投票通信系统和理想行为预测模型(Ideal of Behavior Prediction Model,IOBPM)下的分层决策机制。依次实现前锋持球者(Center Forward,CF)的选择和其它所有球员角色的分配,同时针对CF带球决策模块建立IOBPM模型,最后采用动态规划算法优化角色函数所带来的高维数计算量的问题,以保证了基于足球位置不断变化下的角色轮换的流畅性。经过若干场竞赛和实验的反复验证,采用上述方法的Apollo3D团队无论是在单智能体的动作设计优化方面,还是团队整体协作的连贯性方面都有显著的成效。