期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于深度强化学习的机械臂动态目标抓取方法
1
作者
张轩
卢惠民
+4 位作者
任君凯
莫新民
肖浩然
张伟杰
杨璇
《兵工自动化》
北大核心
2024年第6期91-96,共6页
针对现有机械臂动态目标抓取方法轨迹规划困难、实时性不足、难以实现六自由度抓取等问题,提出一种基于深度强化学习(deep reinforcement learning,DRL)的机械臂动态目标抓取方法。进行马尔可夫决策过程(Markov decision process,MDP)建...
针对现有机械臂动态目标抓取方法轨迹规划困难、实时性不足、难以实现六自由度抓取等问题,提出一种基于深度强化学习(deep reinforcement learning,DRL)的机械臂动态目标抓取方法。进行马尔可夫决策过程(Markov decision process,MDP)建模,设计状态空间、动作空间以及奖励函数,实现机械臂对动态目标的六自由度抓取。基于Pybullet构建机械臂动态目标抓取仿真试验环境,对该方法进行训练,将训练得到的策略在新颖场景进行测试,并与经典规划控制的动态目标抓取方法进行对比。仿真结果表明:该方法能实现机械臂对动态目标的六自由度抓取,在抓取成功率和速度上具有优势。
展开更多
关键词
动态目标抓取
马尔科夫
轨迹规划
深度强化学习
六自由度抓取
下载PDF
职称材料
题名
基于深度强化学习的机械臂动态目标抓取方法
1
作者
张轩
卢惠民
任君凯
莫新民
肖浩然
张伟杰
杨璇
机构
西北机电工程研究所人体增强技术创新中心
国防科技大学智能科学学院
出处
《兵工自动化》
北大核心
2024年第6期91-96,共6页
文摘
针对现有机械臂动态目标抓取方法轨迹规划困难、实时性不足、难以实现六自由度抓取等问题,提出一种基于深度强化学习(deep reinforcement learning,DRL)的机械臂动态目标抓取方法。进行马尔可夫决策过程(Markov decision process,MDP)建模,设计状态空间、动作空间以及奖励函数,实现机械臂对动态目标的六自由度抓取。基于Pybullet构建机械臂动态目标抓取仿真试验环境,对该方法进行训练,将训练得到的策略在新颖场景进行测试,并与经典规划控制的动态目标抓取方法进行对比。仿真结果表明:该方法能实现机械臂对动态目标的六自由度抓取,在抓取成功率和速度上具有优势。
关键词
动态目标抓取
马尔科夫
轨迹规划
深度强化学习
六自由度抓取
Keywords
dynamic target grasping
Markov
trajectory planning
deep reinforcement learning
six-degree-of-freedom grasping
分类号
TP241 [自动化与计算机技术—检测技术与自动化装置]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于深度强化学习的机械臂动态目标抓取方法
张轩
卢惠民
任君凯
莫新民
肖浩然
张伟杰
杨璇
《兵工自动化》
北大核心
2024
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部