期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于ProMPs和PI^2的机器人学习方法
被引量:
1
1
作者
傅剑
曹策
申思远
《武汉科技大学学报》
CAS
北大核心
2019年第5期387-393,共7页
基于传统运动基元模型的机器人学习方法存在学习速度慢、学习结果精度低等问题,为此本文提出一种融合贝叶斯估计算法的概率运动基元(ProMPs)表达和模仿学习框架,同时还利用了基于核典型相关分析(KCCA)的改进型路径积分PI^2策略进行轨迹...
基于传统运动基元模型的机器人学习方法存在学习速度慢、学习结果精度低等问题,为此本文提出一种融合贝叶斯估计算法的概率运动基元(ProMPs)表达和模仿学习框架,同时还利用了基于核典型相关分析(KCCA)的改进型路径积分PI^2策略进行轨迹优化。ProMPs结合贝叶斯推断,为机器人实现有别于示范任务的新任务提供了一个可行解搜索起点,而利用附加泛函指标约束的PI^2算法能让机器人获得平滑的过点轨迹。通过UR5机器人实验平台和V-REP仿真软件对本文方法进行过点试验验证,结果表明,所提出的贝叶斯ProMPs-PI^2学习方法能快速而精准地完成机器人从示范任务到陌生任务的泛化学习,实现机器人新技能的获取。
展开更多
关键词
机器人学习
概率运动基元
路径
积分
PI^
2
贝叶斯估计
轨迹优化
下载PDF
职称材料
融合KCCA推断强化学习的机器人智能轨迹规划
被引量:
3
2
作者
傅剑
滕翔
+1 位作者
曹策
娄平
《华中科技大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2019年第11期96-102,共7页
针对当前模仿强化学习(LfDRL)框架面向新任务时并未考虑机器人各关节之间的联系,从而影响学习效果的不足,利用伪协方差矩阵的思想,基于再生核空间(RKHS)和广义瑞丽熵构建面向泛函指标的关节间摄动相关局部坐标系,进而设计出一种集成核...
针对当前模仿强化学习(LfDRL)框架面向新任务时并未考虑机器人各关节之间的联系,从而影响学习效果的不足,利用伪协方差矩阵的思想,基于再生核空间(RKHS)和广义瑞丽熵构建面向泛函指标的关节间摄动相关局部坐标系,进而设计出一种集成核典型相关分析(KCCA)与路径积分策略提升(PI^2)的强化学习方法.利用学习经验数据基于KCCA推断出机器人各关节间面向轨迹规划任务的隐含非线性启发式信息,引导PI^2搜索到最优/次优策略,使得机器人实现从示范轨迹规划任务到新轨迹规划任务的快速迁移学习,并高质量完成.选择顺应性装配机械手臂(SCARA)和优傲5(UR5)机器人的过单点、过两点迁移学习智能轨迹规划实验,结果表明:融合KCCA推断启发式信息的强化学习的平均代价下降率明显优于经典的PI^2算法,其机器人智能轨迹规划在提升学习收敛速度的同时也提高了机器人完成新任务的精度.
展开更多
关键词
轨迹规划
模仿强化学习(LfDRL)
核典型相关分析(KCCA)
路径
积分
策略
提升
(PI^2)
伪协方差矩阵
原文传递
基于双空间交替学习的机器人运动技能获取
被引量:
2
3
作者
傅剑
陈思明
+1 位作者
庞牧野
娄平
《华中科技大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2017年第10期90-94,110,共6页
针对如何基于示范任务学习让机器人自主获得完成新任务的能力的难题,提出一种高斯混合回归结合路径积分策略提升(GMR-PI2)的表达、模仿和优化框架,同时采用基函数、策略表达权系数两个空间上交替搜索执行方案来解决上述问题.核心思想是...
针对如何基于示范任务学习让机器人自主获得完成新任务的能力的难题,提出一种高斯混合回归结合路径积分策略提升(GMR-PI2)的表达、模仿和优化框架,同时采用基函数、策略表达权系数两个空间上交替搜索执行方案来解决上述问题.核心思想是当权系数探索到最佳逼近点附近时,根据经验最优轨迹集进行基函数的自重组,然后再重启权系数搜索,从而实现从示范任务到指标集约束任务的渐进运动技能获取.经典的轨迹规划过点实验结果表明该方法是有效和可行的.
展开更多
关键词
机器人学习
基函数自重组
混合高斯回归
路径
积分
策略
提升
轨迹规划
原文传递
题名
基于ProMPs和PI^2的机器人学习方法
被引量:
1
1
作者
傅剑
曹策
申思远
机构
武汉理工大学自动化学院
出处
《武汉科技大学学报》
CAS
北大核心
2019年第5期387-393,共7页
基金
国家自然科学基金资助项目(61773299,51475347,51575412)
文摘
基于传统运动基元模型的机器人学习方法存在学习速度慢、学习结果精度低等问题,为此本文提出一种融合贝叶斯估计算法的概率运动基元(ProMPs)表达和模仿学习框架,同时还利用了基于核典型相关分析(KCCA)的改进型路径积分PI^2策略进行轨迹优化。ProMPs结合贝叶斯推断,为机器人实现有别于示范任务的新任务提供了一个可行解搜索起点,而利用附加泛函指标约束的PI^2算法能让机器人获得平滑的过点轨迹。通过UR5机器人实验平台和V-REP仿真软件对本文方法进行过点试验验证,结果表明,所提出的贝叶斯ProMPs-PI^2学习方法能快速而精准地完成机器人从示范任务到陌生任务的泛化学习,实现机器人新技能的获取。
关键词
机器人学习
概率运动基元
路径
积分
PI^
2
贝叶斯估计
轨迹优化
Keywords
robot learning
ProMPs
path integral
PI^
2
Bayesian estimation
trajectory optimization
分类号
TP242.6 [自动化与计算机技术—检测技术与自动化装置]
下载PDF
职称材料
题名
融合KCCA推断强化学习的机器人智能轨迹规划
被引量:
3
2
作者
傅剑
滕翔
曹策
娄平
机构
武汉理工大学自动化学院
武汉理工大学信息学院
出处
《华中科技大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2019年第11期96-102,共7页
基金
国家自然科学基金资助项目(61773299,51575412)
武汉理工大学优秀硕士论文培育项目(2017-YS-066)
文摘
针对当前模仿强化学习(LfDRL)框架面向新任务时并未考虑机器人各关节之间的联系,从而影响学习效果的不足,利用伪协方差矩阵的思想,基于再生核空间(RKHS)和广义瑞丽熵构建面向泛函指标的关节间摄动相关局部坐标系,进而设计出一种集成核典型相关分析(KCCA)与路径积分策略提升(PI^2)的强化学习方法.利用学习经验数据基于KCCA推断出机器人各关节间面向轨迹规划任务的隐含非线性启发式信息,引导PI^2搜索到最优/次优策略,使得机器人实现从示范轨迹规划任务到新轨迹规划任务的快速迁移学习,并高质量完成.选择顺应性装配机械手臂(SCARA)和优傲5(UR5)机器人的过单点、过两点迁移学习智能轨迹规划实验,结果表明:融合KCCA推断启发式信息的强化学习的平均代价下降率明显优于经典的PI^2算法,其机器人智能轨迹规划在提升学习收敛速度的同时也提高了机器人完成新任务的精度.
关键词
轨迹规划
模仿强化学习(LfDRL)
核典型相关分析(KCCA)
路径
积分
策略
提升
(PI^2)
伪协方差矩阵
Keywords
trajectory planning
learning from demonstration and reinforcement learning(LfDRL)
kernel canonical correlation analysis(KCCA)
path integral policy improvement(PI^
2
)
pseudo covariance matrix
分类号
TP242.6 [自动化与计算机技术—检测技术与自动化装置]
原文传递
题名
基于双空间交替学习的机器人运动技能获取
被引量:
2
3
作者
傅剑
陈思明
庞牧野
娄平
机构
武汉理工大学自动化学院
武汉理工大学信息学院
出处
《华中科技大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2017年第10期90-94,110,共6页
基金
国家自然科学基金资助项目(61773299
51475347
+1 种基金
51575412)
湖北省自然科学基金资助项目(2014CFB357)
文摘
针对如何基于示范任务学习让机器人自主获得完成新任务的能力的难题,提出一种高斯混合回归结合路径积分策略提升(GMR-PI2)的表达、模仿和优化框架,同时采用基函数、策略表达权系数两个空间上交替搜索执行方案来解决上述问题.核心思想是当权系数探索到最佳逼近点附近时,根据经验最优轨迹集进行基函数的自重组,然后再重启权系数搜索,从而实现从示范任务到指标集约束任务的渐进运动技能获取.经典的轨迹规划过点实验结果表明该方法是有效和可行的.
关键词
机器人学习
基函数自重组
混合高斯回归
路径
积分
策略
提升
轨迹规划
Keywords
robot learning
basis function auto-encoding
Gaussian mixture regression
path integralpolicy improvement
trajectory planning
分类号
TP242.6 [自动化与计算机技术—检测技术与自动化装置]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于ProMPs和PI^2的机器人学习方法
傅剑
曹策
申思远
《武汉科技大学学报》
CAS
北大核心
2019
1
下载PDF
职称材料
2
融合KCCA推断强化学习的机器人智能轨迹规划
傅剑
滕翔
曹策
娄平
《华中科技大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2019
3
原文传递
3
基于双空间交替学习的机器人运动技能获取
傅剑
陈思明
庞牧野
娄平
《华中科技大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2017
2
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部