基于迭代学习算法的六自由度机械臂运动学求解分析

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:xianzhiwangsu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机械臂是机器人执行操作任务的重要部分,但不同公司的机械臂结构多种多样,分别有不同的控制方程式,没有统一的控制方法。上世纪90年代,神经网络被用在机械臂逆运动学的求解上,位姿作为神经网络的输入,关节角作为神经网络的输出,研究的对象从二关节、三关节到现在主流应用的六关节机械臂,神经网络的输入、输出也不断变化,输入可以是目标位姿、当前位姿和目标位姿与当前位姿之差、相机获取的目标物体图像,输出可以是关节角、目标关节角和当前关节角之差、电机的力矩,但缺点很明显,神经网络只能输出一个解,而到达目标位姿、抓取物体有多个解,且使用神经网络模拟这种非函数关系的效果受训练数据影响较大。Sergey Levine等[1]将相机图像和电机命令作为神经网络输入,抓取成功的概率作为神经网络的输出。对于一个确定的输入,输出是确定的、唯一的,这种输入、输出发挥了神经网络模拟函数关系的优势。但其在寻解时,是随机一批电机命令输入神经网络获得抓取成功概率,而后使用CEM算法获得抓取成功率最高的电机命令,没有充分发挥神经网络反向传播求电机命令导数并像优化神经网络权值一样优化电机命令的优势,且需要预训练大量的训练数据,不具有热启动特性。本文提出拥有记忆单元的迭代学习算法,该算法以目标位姿为驱动,通过神经网络反向传播求目标位姿与当前位姿之差的平方和对当前关节角的导数,并通过梯度下降、线性搜索算法寻找最优关节角,执行电机命令至寻找到的关节角并获得真实位姿,如果满足误差要求,则结束,如果不满足要求,则将刚才实践的数据加入记忆单元并训练神经网络,继续寻找关节角。通过优化关节角和优化网络权值这两种无缝衔接的循环的优化过程,达到迭代学习和热启动的目的;通过使用有限的记忆单元,使神经网络使用更少的数据达到收敛,且不必记忆大量的训练数据;对不同误差要求的任务,使用本文所提方法训练的神经网络具有更强的适应性。对于神经网络认为不可达的位姿,本文提出试探性学习策略算法,在不限制尝试次数的情况下,可以100%完成任意精度的任意目标位姿。本文所提算法是对神经网络模拟的函数关系的反向应用。通过构建良性循环生态,让神经网络自己去学习。该算法具有普遍适用性。
其他文献
国内首套拥有自主知识产权的焦炉气非催化部分氧化制合成气装置在该公司通过了72h连续运行考核。该装置单炉规模为75000Nm^3/h焦炉气,这也是迄今单炉运行规模最大的焦炉气转
GPS高程拟合中二次曲面法应用较广,但传统二次曲面法是基于最小二乘原则,由此引入以变量误差模型(EIV)为基础的整体最小二乘法和加权整体最小二乘法,提出了一种改进的定权方式应用于加权整体最小二乘的高程拟合,并在高程拟合实例中比较了分别基于最小二乘(LS)、基于整体最小二乘(TLS)和基于加权整体最小二乘(WTLS)的二次曲面法。实例表明该定权方法的加权整体最小二乘检核点残差整体减小了约1 mm,外
目的研究氨磺必利联合利培酮对精神分裂症患者糖脂代谢及血清CRP、NGF、TRF水平的影响。方法回顾性分析2018年1月至2019年12月如皋市精神病防治医院收治的60例精神分裂症患者
经济发展对金融服务的要求是多方面的,商业银行应当从多层面的金融需求中寻找发展空间。本文在分析金融危机对湖北经济金融影响的基础上,通过对去年以来为应对金融危机导致银