基于深度强化学习的六足机器人运动规划被引量：2

Motion planning for hexapod robot using deep reinforcement learning

下载PDF

导出

摘要六足机器人拥有多个冗余自由度,适用于复杂的非结构环境。离散环境作为非结构环境的一个苛刻特例,需要六足机器人具备更加高效可靠的运动策略。以平面随机梅花桩为例,设定随机起始点与目标区域,利用深度强化学习算法进行训练,并得到六足机器人在平面梅花桩环境中的运动策略。为了加快训练进程,采用具有优先经验重放机制的深度确定性策略梯度算法。最后在真实环境中进行验证,实验结果表明,所规划的运动策略能让六足机器人在平面梅花桩环境中高效平稳地从起始点运动到目标区域。为六足机器人在真实离散环境中的精确运动规划奠定了基础。 Hexapod robot have multiple redundant degrees of freedom and are suitable for complex unstructured environments.Discrete environments,as a harsh special case of unstructured environments,require hexapod robots to have more efficient and reliable motion strategies.A plane random plum-blossom pile environment was taken as an example.A random starting point and a target area were set,and the deep reinforcement learning algorithm was applied to plan a motion strategy for a hexapod robot in theplane plum-blossompile environment.To speed up the training process,a deep deterministic policy gradient algorithm with a prioritized experience replay mechanism was used.Finally the policy was verified in a real environment.The results show that the planned motion strategy can make the hexapod robot move efficiently and smoothly from a starting point to a target area in aplane plum-blossom pile environment.This work lays the foundation for the precise motion planning of hexapod robots in the real discrete environment.

作者傅汇乔唐开强邓归洲王鑫鹏陈春林 FU Huiqiao;TANG Kaiqiang;DENG Guizhou;WANG Xinpeng;CHEN Chunlin(School of Management and Engineering,Nanjing University,Nanjing 210046,China;School of Manufacturing Science and Engineering,Southwest University of Science and Technology,Mianyang 621010,China)

机构地区南京大学工程管理学院西南科技大学制造科学与工程学院

出处《智能科学与技术学报》 2020年第4期361-371,共11页 Chinese Journal of Intelligent Science and Technology

基金国家自然科学基金资助项目(No.71732003,No.62073160) 国家重点研发计划资助项目(No.2018AAA0101100) 载人航天第四批预研项目(No.030602)

关键词六足机器人运动规划深度强化学习 hexapod robot motion planning deep reinforcement learning

分类号 TP242 [自动化与计算机技术—检测技术与自动化装置] TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献7

1李满宏,张明路,张建华,张小俊.六足机器人关键技术综述[J].机械设计,2015,32(10):1-8. 被引量：49
2沈宇,韩金朋,李灵犀,王飞跃.游戏智能中的AI——从多角色博弈到平行博弈[J].智能科学与技术学报,2020,2(3):205-213. 被引量：11
3王飞跃,曹东璞,魏庆来.强化学习:迈向知行合一的智能机制与算法[J].智能科学与技术学报,2020(2):101-106. 被引量：12
4刘全,翟建伟,章宗长,钟珊,周倩,章鹏,徐进.深度强化学习综述[J].计算机学报,2018,41(1):1-27. 被引量：431
5孙长银,穆朝絮.多智能体深度强化学习的若干关键科学问题[J].自动化学报,2020,46(7):1301-1312. 被引量：78
6GARIBALDI Jonathan M,陈虹宇,李小双.差异与学习:模糊系统与模糊推理[J].智能科学与技术学报,2019,0(4):319-326. 被引量：6
7陈德旺,蔡际杰,黄允浒.面向可解释性人工智能与大数据的模糊系统发展展望[J].智能科学与技术学报,2019,0(4):327-334. 被引量：12

二级参考文献43

1李宪港,李强.典型智能博弈系统技术分析及指控系统智能化发展展望[J].智能科学与技术学报,2020,2(1):36-42. 被引量：18
2GARIBALDI Jonathan M,陈虹宇,李小双.差异与学习:模糊系统与模糊推理[J].智能科学与技术学报,2019,0(4):319-326. 被引量：6
3LUCAS Simon,沈甜雨,王晓,张杰.基于统计前向规划算法的游戏通用人工智能[J].智能科学与技术学报,2019,0(3):219-227. 被引量：4
4张钹.人工智能进入后深度学习时代[J].智能科学与技术学报,2019,0(1):4-6. 被引量：41
5郑南宁.人工智能新时代[J].智能科学与技术学报,2019,0(1):1-3. 被引量：56
6黄麟,韩宝玲,罗庆生,徐嘉.仿生六足机器人步态规划策略实验研究[J].华中科技大学学报（自然科学版）,2007,35(12):72-75. 被引量：18
7王飞跃.人工社会、计算实验、平行系统——关于复杂社会经济系统计算研究的讨论[J].复杂系统与复杂性科学,2004,1(4):25-35. 被引量：230
8阎岭,郑洪涛,蒋静坪.基于进化策略生成可解释性模糊系统[J].电子学报,2005,33(1):70-73. 被引量：5
9汪劲松,荣松年,张伯鹏.全方位双三足步行机器人（Ⅰ）──步行原理、机构及控制系统[J].清华大学学报（自然科学版）,1994,34(2):102-107. 被引量：6
10魏英姿 ,赵明扬 .一种基于强化学习的作业车间动态调度方法[J].自动化学报,2005,31(5):765-771. 被引量：19

共引文献565

1赵亮,谢志峰,张坤鹏,郑玉卿,付园坤.无线网络信号传输建模:一种区间二型模糊集成深度学习方法[J].智能科学与技术学报,2020,2(4):401-411. 被引量：3
2刘莹莹,王占山.异构多智能体系统的输出同步:一个基于数据的强化学习方法[J].智能科学与技术学报,2020(4):394-400. 被引量：2
3宿帅,朱擎阳,魏庆来,唐涛,阴佳腾.基于DQN的列车节能驾驶控制方法[J].智能科学与技术学报,2020(4):372-384. 被引量：3
4李涛,魏庆来.基于深度强化学习的智能暖气温度控制系统[J].智能科学与技术学报,2020,2(4):348-353. 被引量：4
5贾庆山,唐静娴,吴俊杰,胡潇,林依挺,夏恒.面向数据中心绿色可靠运行的强化学习方法[J].智能科学与技术学报,2020(4):341-347. 被引量：2
6刘朝阳,穆朝絮,孙长银.深度强化学习算法与应用研究现状综述[J].智能科学与技术学报,2020(4):314-326. 被引量：35
7杜宏庆,陈德旺,黄允浒,朱凤华,李灵犀.基于改进遗传算法与支持度的模糊系统优化建模方法[J].智能科学与技术学报,2020(2):179-185. 被引量：2
8王飞跃,曹东璞,魏庆来.强化学习:迈向知行合一的智能机制与算法[J].智能科学与技术学报,2020(2):101-106. 被引量：12
9韩志豪,汪益兵,张宇,郝永志.基于深度强化学习的船舶航线自动规划[J].中国航海,2021,44(1):100-105. 被引量：9
10李茹杨,彭慧民,李仁刚,赵坤.强化学习算法与应用综述[J].计算机系统应用,2020,29(12):13-25. 被引量：35

同被引文献7

1石琳,罗庆生,韩宝玲,黄麟.仿生六足机器人稳定性的仿生实验研究(英文)[J].系统仿真学报,2008,20(19):5384-5387. 被引量：4
2刘宇飞,丁亮,高海波,刘振,胡艳明,何玉庆,邓宗全.基于激光测距的月球探测重载六足机器人自主避障控制[J].宇航学报,2018,39(12):1381-1390. 被引量：14
3李满宏,张明路,张建华,张小俊.六足机器人关键技术综述[J].机械设计,2015,32(10):1-8. 被引量：49
4孙辉辉,胡春鹤,张军国.移动机器人运动规划中的深度强化学习方法[J].控制与决策,2021,36(6):1281-1292. 被引量：23
5胡勇,蒋刚,李昔学,留沧海.非结构环境下六足机器人仿真研究[J].机械设计与制造,2021(7):281-284. 被引量：5
6董星宇,唐开强,傅汇乔,留沧海,蒋刚.基于强化学习的六足机器人动态避障研究[J].传感器与微系统,2022,41(1):19-23. 被引量：5
7杨红刚.一种手持式半球形视角激光雷达SLAM三维建图技术[J].测绘通报,2023(2):139-144. 被引量：1

引证文献2

1李昔学,庹先国,蒋刚,黄寅森,范孝冬.基于地形感知的六足机器人运动控制方法[J].通信与信息技术,2023(3):11-15. 被引量：1
2王鑫鹏,傅汇乔,邓归洲,唐开强,陈春林,留沧海.基于DRL和自由步态的六足机器人运动规划研究[J].系统仿真学报,2024,36(2):373-384.

二级引证文献1

1徐琬婷,梅源,周欣悦.一款基于STM32单片机的六足巡检机器人设计[J].西昌学院学报（自然科学版）,2023,37(4):34-41.

1王华军.变电运维技术中的智能化技术分析[J].中国科技投资,2020(28):21-21. 被引量：1
2张建同,何钰林.基于深度强化学习的动态共享单车重置问题研究[J].上海管理科学,2021,43(2):81-86. 被引量：1

智能科学与技术学报

2020年第4期

浏览历史

内容加载中请稍等...

基于深度强化学习的六足机器人运动规划被引量：2

参考文献7

二级参考文献43

共引文献565

同被引文献7

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于深度强化学习的六足机器人运动规划 被引量：2

参考文献7

二级参考文献43

共引文献565

同被引文献7

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于深度强化学习的六足机器人运动规划被引量：2