基于深度强化学习的机器人路径规划被引量：4

Robot path planning based on deep reinforcement learning

下载PDF

导出

摘要针对传统强化学习中Q学习算法在机器人路径规划过程中易引发维数灾难及搜索效率低的问题,提出一种深度强化学习算法。在Q学习算法中引入深度学习,通过深度学习网络对参数进行不断的训练和优化,利用网络输出值来替代传统的Q值表,从而避免陷入维度灾难。另外针对算法的过估计问题,设计了一种深度双Q学习策略,其中包含了两个网络结构对机器人的执行动作和决策评估进行分别计算。同时采用重回放机制,改善算法收敛性。最后,利用贝塞尔曲线对路径进行平滑。仿真表明,深度强化学习算法相较于Q学习算法,路径各项指标得以提升,对机器人工作运行更为有利。

作者齐嵘吴宪凤 QI Rong;WU Xian-feng

机构地区包头广播电视大学包头铁道职业技术学院

出处《制造业自动化》 CSCD 北大核心 2022年第12期177-180,共4页 Manufacturing Automation

基金内蒙古广播电视大学2021年度教育教学研究重大课题攻关项目(EZDGG202104) 内蒙古广播电视大学2021年度科学研究一般课题(IMOU-EZDGGZ2125)。

关键词 Q学习深度强化学习机器人路径规划

分类号 TP242 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献10

1霍凤财,迟金,黄梓健,任璐,孙勤江,陈建玲.移动机器人路径规划算法综述[J].吉林大学学报（信息科学版）,2018,36(6):639-647. 被引量：148
2朱大奇,颜明重.移动机器人路径规划技术综述[J].控制与决策,2010,25(7):961-967. 被引量：331
3张红梅,李明龙,杨乐.基于改进A~*算法的移动机器人安全路径规划[J].计算机仿真,2018,35(4):319-324. 被引量：53
4张丽珍,何龙,吴迪,杜战其.改进型蚁群算法在路径规划中的研究[J].制造业自动化,2020,42(2):55-59. 被引量：18
5孙波,姜平,周根荣,董殿永.基于改进遗传算法的AGV路径规划[J].计算机工程与设计,2020,41(2):550-556. 被引量：54
6罗阳阳,彭晓燕.基于改进PSO的四轮移动机器人全局路径规划[J].计算机仿真,2020,37(7):373-379. 被引量：16
7韩向敏,鲍泓,梁军,潘峰,玄祖兴.一种基于深度强化学习的自适应巡航控制算法[J].计算机工程,2018,44(7):32-35. 被引量：13
8赵英男,刘鹏,赵巍,唐降龙.深度Q学习的二次主动采样方法[J].自动化学报,2019,45(10):1870-1882. 被引量：16
9董永峰,杨琛,董瑶,屈向前,肖华昕,王子秋.基于改进的DQN机器人路径规划[J].计算机工程与设计,2021,42(2):552-558. 被引量：20
10夏宗涛,秦进.一种深度Q网络的改进算法[J].计算机应用研究,2019,36(12):3661-3665. 被引量：6

二级参考文献140

1王景武,金立生.车辆自适应巡航控制系统控制技术的发展[J].汽车技术,2004(7):1-4. 被引量：19
2戴博,肖晓明,蔡自兴.移动机器人路径规划技术的研究现状与展望[J].控制工程,2005,12(3):198-202. 被引量：75
3高庆吉,于咏生,胡丹丹.基于改进A*算法的可行性路径搜索及优化[J].中国民航学院学报,2005,23(4):42-45. 被引量：15
4刘义,张宇.基于改进人工势场法的移动机器人局部路径规划的研究[J].现代机械,2006(6):48-49. 被引量：17
5高阳,周如益,王皓,曹志新.平均奖赏强化学习算法研究[J].计算机学报,2007,30(8):1372-1378. 被引量：38
6Hofner C, Schmidt G. Path planning and guidance techniques for an autonomous mobile robot[J]. Robotic and Autonomous Systems, 1995, 14(2): 199-212.
7Schmidt G, Hofner C. An advaced planning and navigation approach for autonomous cleaning robot operationa[C]. IEEE Int Conf Intelligent Robots System. Victoria, 1998: 1230-1235.
8Vasudevan C, Ganesan K. Case-based path planning for autonomous underwater vehicles[C]. IEEE Int Symposium on Intelligent Control. Columbus, 1994:160-165.
9Liu Y. Zhu S, Jin B, et al. Sensory navigation of autonomous cleaning robots[C]. The 5th World Conf on Intelligent Control Automation. Hangzhou, 2004: 4793- 4796.
10De Carvalho R N, Vidal H A, Vieira P, et al. Complete coverage path planning and guidance for cleaning robots[C]. IEEE Int Conf Industry Electrontics. Guimaraes, 1997: 677-682.

共引文献635

1赵健,宋东鉴,朱冰,刘斌,陈志成,张培兴.基于自学习和监督学习混合驱动的智能汽车跟驰控制策略[J].中国公路学报,2022,35(3):55-65. 被引量：4
2刘军,冯硕,任建华.移动机器人路径动态规划有向D~*算法[J].浙江大学学报（工学版）,2020,54(2):291-300. 被引量：28
3陈学雷.基于改进遗传算法的矿井风网特征图优化研究[J].工矿自动化,2023,49(S02):71-74.
4黄鲁,周非同.基于路径优化D^*Lite算法的移动机器人路径规划[J].控制与决策,2020,35(4):877-884. 被引量：24
5赵明,郑泽宇,么庆丰,潘怡君,刘智.基于改进人工势场法的移动机器人路径规划方法[J].计算机应用研究,2020,37(S02):66-68. 被引量：32
6刘洋,李建军.深度确定性策略梯度算法优化[J].辽宁工程技术大学学报（自然科学版）,2020(6):545-549. 被引量：2
7罗国攀,张国良,徐佳宝.基于SPE-ICM的移动机器人内在动机避障规划[J].电子测量与仪器学报,2023,37(2):21-27. 被引量：3
8李芳娣,邓晓燕,吴伟铭,周依静,陈芯婷.移动机器人复杂角点定位和停车策略研究与实现[J].电子测量技术,2023,46(22):26-31.
9杨敏豪,张国良,李德胜.基于双向F-RRT^(*)算法的移动机器人路径规划[J].电子测量技术,2023,46(5):91-97. 被引量：1
10张凡,蔡涛,刘文达,范亚雷.基于改进JPS算法的电站巡检机器人路径规划[J].电子测量技术,2020,43(8):10-16. 被引量：7

同被引文献46

1陈思.基于蝙蝠算法的无人艇全局路径规划[J].军事交通学报,2022(12):42-46. 被引量：1
2郭丹,刘杰.基于模型设计与传统方式的联合设计开发[J].单片机与嵌入式系统应用,2012,12(9):16-19. 被引量：6
3王珂,卜祥津,李瑞峰,赵立军.景深约束下的深度强化学习机器人路径规划[J].华中科技大学学报（自然科学版）,2018,46(12):77-82. 被引量：20
4杨霄鹏,欧阳超,杨朝阳,姚昆,倪娟.基于“当前”统计模型的模糊自适应航迹预测算法[J].空军工程大学学报（自然科学版）,2015,16(2):1-4. 被引量：5
5许保同,杨国亮,吴奇.基于Simulink的纯电动汽车VCU控制策略设计方法[J].汽车工程师,2016(5):19-21. 被引量：10
6李起伟,张立亚.矿山应急救援机器人全局路径规划的研究[J].煤炭技术,2016,35(8):249-251. 被引量：9
7邵雪卷,孟凡斌,陈志梅,张井岗.基于dSPACE的磁悬浮系统实验平台设计[J].实验技术与管理,2016,33(12):67-71. 被引量：5
8曹广忠,肖松松,黎文博,何志明,梁得亮.基于dSPACE的交流电机V/f控制平台的研究[J].微特电机,2017,45(2):62-64. 被引量：5
9王航.基于神经网络的非线性系统反演模糊滑模控制[J].机电工程技术,2017,46(5):99-102. 被引量：3
10吴姣,郝玉锴,徐宁,李向东.一种使用MATLAB/Simulink的Arduino模型化开发方法[J].电子技术应用,2017,43(6):60-63. 被引量：7

引证文献4

1鲁鹏,付强,杨艳,胡旭,谷明信,罗天洪.基于MBD的直流减速电机控制器设计[J].机电工程技术,2023,52(10):20-24. 被引量：1
2王堃,周志崇,曲凯,曹明松,胡延达.基于注意力机制的CNN-LSTM模型的航迹预测[J].空军工程大学学报,2023,24(6):50-57. 被引量：2
3边艳华,解路,苗超.基于深度强化学习和大邻域搜索的矿山巡检机器人路径规划算法[J].金属矿山,2024(2):212-218. 被引量：3
4周俊霄,唐晓峰.概率路线图环境下自动驾驶路径规划优化[J].自动化应用,2024,65(13):16-19.

二级引证文献6

1靳晋.颗粒物监测网络浓度预测[J].福建电脑,2024,40(6):40-45.
2郝宇.基于智能巡检机器人的超高压变电站故障检测技术研究[J].通信电源技术,2024,41(9):218-220.
3刘志强,江世明,刘易菲,陈鑫宇.油电混动小车智能控制系统设计[J].传感器世界,2024,30(7):18-23.
4杨乾.基于有线通信的变电站巡检机器人路径规划算法研究[J].通信电源技术,2024,41(18):246-248.
5陆明龙,刘耀强,蔡虓,张维维,梅源,李捷.关于阵地可探查覆盖范围的计算方法[J].指挥信息系统与技术,2024,15(4):78-81.
6李耀贵.基于元强化学习的电力巡检机器人自主越障控制研究[J].科学技术创新,2024(24):29-32.

1王霄.基于改进灰狼优化算法的仓储物流机器人路径规划方法[J].自动化技术与应用,2022,41(12):23-27. 被引量：6
2吴戴燕,刘世林.基于改进Q学习的机械臂实时障碍规避方法[J].台州学院学报,2022,44(6):13-20.

制造业自动化

2022年第12期

浏览历史

内容加载中请稍等...

基于深度强化学习的机器人路径规划被引量：4

参考文献10

二级参考文献140

共引文献635

同被引文献46

引证文献4

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于深度强化学习的机器人路径规划 被引量：4

参考文献10

二级参考文献140

共引文献635

同被引文献46

引证文献4

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于深度强化学习的机器人路径规划被引量：4