期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于ProMPs和PI^2的机器人学习方法 被引量:1
1
作者 傅剑 曹策 申思远 《武汉科技大学学报》 CAS 北大核心 2019年第5期387-393,共7页
基于传统运动基元模型的机器人学习方法存在学习速度慢、学习结果精度低等问题,为此本文提出一种融合贝叶斯估计算法的概率运动基元(ProMPs)表达和模仿学习框架,同时还利用了基于核典型相关分析(KCCA)的改进型路径积分PI^2策略进行轨迹... 基于传统运动基元模型的机器人学习方法存在学习速度慢、学习结果精度低等问题,为此本文提出一种融合贝叶斯估计算法的概率运动基元(ProMPs)表达和模仿学习框架,同时还利用了基于核典型相关分析(KCCA)的改进型路径积分PI^2策略进行轨迹优化。ProMPs结合贝叶斯推断,为机器人实现有别于示范任务的新任务提供了一个可行解搜索起点,而利用附加泛函指标约束的PI^2算法能让机器人获得平滑的过点轨迹。通过UR5机器人实验平台和V-REP仿真软件对本文方法进行过点试验验证,结果表明,所提出的贝叶斯ProMPs-PI^2学习方法能快速而精准地完成机器人从示范任务到陌生任务的泛化学习,实现机器人新技能的获取。 展开更多
关键词 机器人学习 概率运动基元 路径积分 PI^2 贝叶斯估计 轨迹优化
下载PDF
融合KCCA推断强化学习的机器人智能轨迹规划 被引量:3
2
作者 傅剑 滕翔 +1 位作者 曹策 娄平 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2019年第11期96-102,共7页
针对当前模仿强化学习(LfDRL)框架面向新任务时并未考虑机器人各关节之间的联系,从而影响学习效果的不足,利用伪协方差矩阵的思想,基于再生核空间(RKHS)和广义瑞丽熵构建面向泛函指标的关节间摄动相关局部坐标系,进而设计出一种集成核... 针对当前模仿强化学习(LfDRL)框架面向新任务时并未考虑机器人各关节之间的联系,从而影响学习效果的不足,利用伪协方差矩阵的思想,基于再生核空间(RKHS)和广义瑞丽熵构建面向泛函指标的关节间摄动相关局部坐标系,进而设计出一种集成核典型相关分析(KCCA)与路径积分策略提升(PI^2)的强化学习方法.利用学习经验数据基于KCCA推断出机器人各关节间面向轨迹规划任务的隐含非线性启发式信息,引导PI^2搜索到最优/次优策略,使得机器人实现从示范轨迹规划任务到新轨迹规划任务的快速迁移学习,并高质量完成.选择顺应性装配机械手臂(SCARA)和优傲5(UR5)机器人的过单点、过两点迁移学习智能轨迹规划实验,结果表明:融合KCCA推断启发式信息的强化学习的平均代价下降率明显优于经典的PI^2算法,其机器人智能轨迹规划在提升学习收敛速度的同时也提高了机器人完成新任务的精度. 展开更多
关键词 轨迹规划 模仿强化学习(LfDRL) 核典型相关分析(KCCA) 路径积分策略提升(PI^2) 伪协方差矩阵
原文传递
基于双空间交替学习的机器人运动技能获取 被引量:2
3
作者 傅剑 陈思明 +1 位作者 庞牧野 娄平 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2017年第10期90-94,110,共6页
针对如何基于示范任务学习让机器人自主获得完成新任务的能力的难题,提出一种高斯混合回归结合路径积分策略提升(GMR-PI2)的表达、模仿和优化框架,同时采用基函数、策略表达权系数两个空间上交替搜索执行方案来解决上述问题.核心思想是... 针对如何基于示范任务学习让机器人自主获得完成新任务的能力的难题,提出一种高斯混合回归结合路径积分策略提升(GMR-PI2)的表达、模仿和优化框架,同时采用基函数、策略表达权系数两个空间上交替搜索执行方案来解决上述问题.核心思想是当权系数探索到最佳逼近点附近时,根据经验最优轨迹集进行基函数的自重组,然后再重启权系数搜索,从而实现从示范任务到指标集约束任务的渐进运动技能获取.经典的轨迹规划过点实验结果表明该方法是有效和可行的. 展开更多
关键词 机器人学习 基函数自重组 混合高斯回归 路径积分策略提升 轨迹规划
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部