基于深度强化学习和人工势场法的移动机器人导航被引量：5

Mobile robot navigation based on deep reinforcement learning and artificial potential field method

下载PDF

导出

摘要针对移动机器人在公共服务领域导航任务中的深度强化学习算法所面临的状态信息交互困难、回馈机制不充分和动作探索冗余等问题,提出势场增强注意力深度强化学习PARL算法.首先,利用人工势场法和注意力机制设计势场注意力网络;然后,利用人工势能场理论构建一种全新的势场奖励函数;最后,提出反向近似模型,并结合势场奖励函数的空间划分方式改进动作空间.实验结果表示,使用PARL算法驱动的机器人,自主学习效率得到提高,平均导航成功率和安全率分别为100%和98.2%,与SARL、CADRL、ORCA算法相比,平均导航时间缩短0.14~1.11 s,且导航动作的鲁棒性更强. Aiming at the difficulties of state information interaction,insufficient feedback mechanism and redundant action exploration faced by the deep reinforcement learning algorithm of mobile robots in the navigation task of public services,PARL algorithm is proposed.First of all,we use the artificial potential field method and attention mechanism to design a potential field attention network.Then we use artificial potential field theory to construct a new potential field reward function.Finally,we propose a reverse approximation model.The model combines the space division method of the potential field reward function to improve the action space.The experimental results show that the use of the mobile robot driven by the PARL algorithm improves the efficiency of autonomous learning.Compared with SARL,CADRL,DRCA algorithms,the average navigation success rate and safety rate are 100%and 98.2%,respectively.The average navigation time is shortened by 0.14~1.11 s and the navigation action is more robust.

作者陈满李茂军李宜伟赖志强 CHEN Man;LI Mao-jun;LI Yi-wei;LAI Zhi-qiang(School of Electrical&Information Engineering,Changsha University of Science&Technology,Changsha 410114,Hunan,China)

机构地区长沙理工大学电气与信息工程学院

出处《云南大学学报（自然科学版）》 CAS CSCD 北大核心 2021年第6期1125-1133,共9页 Journal of Yunnan University(Natural Sciences Edition)

基金国家自然科学基金(61601061).

关键词深度强化学习人工势场法移动机器人导航 deep reinforcement learning artificial potential field method mobile robot navigation

分类号 TP241.2 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献2

1江杰,任恒靓.基于改进人工势场法的移动机器人路径规划的研究[J].自动化应用,2017(8):80-81. 被引量：12
2王云鹏,郭戈.基于深度强化学习的有轨电车信号优先控制[J].自动化学报,2019,45(12):2366-2377. 被引量：16

二级参考文献7

1陈少斌,蒋静坪.基于神经网络和粒子群优化算法的移动机器人动态避障路径规划[J].系统仿真技术,2006(4):192-197. 被引量：9
2王肖青,王奇志.传统人工势场的改进[J].计算机技术与发展,2006,16(4):96-98. 被引量：15
3吴晨光.改进的人工势场法在机器人足球路径规划中的应用[J].电子测试,2012(4):81-85. 被引量：3
4舒波,李大铭,赵新良.基于强化学习算法的公交信号优先策略[J].东北大学学报（自然科学版）,2012,33(10):1513-1516. 被引量：4
5段艳杰,吕宜生,张杰,赵学亮,王飞跃.深度学习在控制领域的研究现状与展望[J].自动化学报,2016,42(5):643-654. 被引量：147
6赵英男,刘鹏,赵巍,唐降龙.深度Q学习的二次主动采样方法[J].自动化学报,2019,45(10):1870-1882. 被引量：16
7高阳,陈世福,陆鑫.强化学习研究综述[J].自动化学报,2004,30(1):86-100. 被引量：268

共引文献26

1谌海云,陈华胄,刘强.基于改进人工势场法的多无人机三维编队路径规划[J].系统仿真学报,2020,32(3):414-420. 被引量：38
2李晔,贾知浩,张伟斌,廖煜雷.面向无人艇自主靠泊的分层轨迹规划与试验[J].哈尔滨工程大学学报,2019,40(6):1043-1050. 被引量：12
3李福进,张俊琴,任红格.基于仿生学内在动机的Q学习算法移动机器人路径规划研究[J].现代电子技术,2019,42(17):133-137. 被引量：5
4张佳龙,闫建国,张普.基于反步推演法的多机编队队形重构控制[J].航空学报,2019,40(11):203-215. 被引量：18
5王辉,于立君,胡羽坤,王莹莹.具有势场启发因子的蚁群路径规划仿真[J].实验室研究与探索,2020,39(3):106-109. 被引量：5
6王鹏勇,陈龚涛,赵江烁.基于深度强化学习的机场出租车司机决策方法[J].计算机与现代化,2020(8):94-99.
7孙长银,穆朝絮.多智能体深度强化学习的若干关键科学问题[J].自动化学报,2020,46(7):1301-1312. 被引量：84
8南英,蒋亮.基于深度强化学习的弹道导弹中段突防控制[J].指挥信息系统与技术,2020,11(4):1-9. 被引量：10
9韩坤,李东琦.基于嵌入式计算机的小麦精播机器人路径规划研究[J].农机化研究,2020,42(11):206-210. 被引量：1
10王迪,李彩虹,郭娜,张宁.基于人工势场法的移动机器人局部路径规划[J].山东理工大学学报（自然科学版）,2021,35(1):21-26. 被引量：20

同被引文献51

1林依凡,陈彦杰,何炳蔚,黄益斌,王耀南.无碰撞检测RRT^*的移动机器人运动规划方法[J].仪器仪表学报,2020(10):257-267. 被引量：41
2李泽东,李志农,王成军.深度卷积神经网络在轴承多故障复合诊断中应用研究[J].南昌航空大学学报（自然科学版）,2020,34(1):12-20. 被引量：2
3可荣博,王铁宁,宋宁波.基于遗传BP神经网络的装甲装备器材需求预测[J].火力与指挥控制,2015,40(6):99-102. 被引量：13
4刘建华,杨建国,刘华平,耿鹏,高蒙.基于势场蚁群算法的移动机器人全局路径规划方法[J].农业机械学报,2015,46(9):18-27. 被引量：128
5杨志超,周强,胡侃,赵云.基于卷积神经网络的焊接缺陷识别技术及应用[J].武汉理工大学学报（信息与管理工程版）,2019,41(1):17-21. 被引量：13
6黄迪,刘畅.智能决策系统的深度神经网络加速与压缩方法综述[J].指挥信息系统与技术,2019,10(2):8-13. 被引量：5
7江其洲,曾碧.基于深度强化学习的移动机器人导航策略研究[J].计算机测量与控制,2019,27(8):217-221. 被引量：11
8李江昀,赵义凯,薛卓尔,蔡铮,李擎.深度神经网络模型压缩综述[J].工程科学学报,2019,41(10):1229-1239. 被引量：42
9董敏,陈铁桩,杨浩.基于改进RRT算法的无人车路径规划仿真研究[J].计算机仿真,2019,36(11):96-100. 被引量：15
10曹继平,王赛,岳小丹,雷宁.基于自适应深度卷积神经网络的发射车滚动轴承故障诊断研究[J].振动与冲击,2020,39(5):97-104. 被引量：18

引证文献5

1邓修朋,崔建明,李敏,张小军,宋戈.深度强化学习在机器人路径规划中的应用[J].电子测量技术,2023,46(6):1-8. 被引量：4
2宗飞宇.露天矿边帮压煤无人开采导航技术应用[J].矿业装备,2022(2):116-118.
3刘文光,刘浩伟,罗通,王志民.RRT算法路径优化及仿真验证[J].重庆理工大学学报（自然科学）,2022,36(11):1-7. 被引量：3
4王彦昆,康丽锋.基于物联网和卷积神经网络的拖拉机轴承故障诊断[J].农机化研究,2023,45(9):245-249. 被引量：3
5金凯乐,李发元,杨婷.激光SLAM技术下移动机器人自主导航优化研究[J].激光杂志,2024,45(5):20-24. 被引量：1

二级引证文献11

1周维庆,王飞,崔丹,李琛.基于表格记忆式清扫机器人路径规划方法[J].自动化与仪表,2023,38(10):37-41.
2赵辉,郑缙奕,岳有军,王红君.改进RRT算法的采摘机械臂路径规划[J].重庆理工大学学报（自然科学）,2024,38(1):338-345. 被引量：2
3李鹏程,周远国,杨国卿.基于深度Q网络的海上环境智能路径规划[J].电子测量技术,2024,47(5):77-84.
4邢慧杰,张晓滨,张宏伟.APF与A*融合的多目标点路径规划算法[J].计算机技术与发展,2024,34(8):116-121.
5周鼎,何涛,周杰,黄亮,杨国林.基于迁移学习方法的架空配电线路无人机精准定位及拍摄技术研究[J].供用电,2024,41(10):68-74.
6余建华.基于音频特征的拖拉机发动机状况识别系统设计[J].农机化研究,2025,47(2):228-233.
7张扬.基于LabVIEW的拖拉机电气故障诊断系统设计[J].农机化研究,2025,47(2):239-243.
8伞红军,杨晓园,陈久朋,孙海杰,张号彬.基于拟水流算法在移动机器人路径规划中的应用[J].仪器仪表学报,2024,45(7):263-278.
9笪晨,宋天麟,王勇刚,卢亚平.运动学约束下规划与跟踪算法的研究与改进[J].制造业自动化,2024,46(10):62-68.
10毕霄昀,鲁广东,蔡霞.基于高斯混合模型的分布式强化学习算法鲁棒性优化[J].软件工程,2024,27(11):75-78.

1王倩,郭君红,刘亚杰.阿司匹林对妊娠期高血压患者不良结局的影响分析[J].中国医学工程,2021,29(10):121-123. 被引量：4
2杨志永,房培娜,刘琬钰,姜杉.基于代价地图的活检路径规划研究[J].天津大学学报（自然科学与工程技术版）,2022,55(2):151-157.
3王璿,高明亮.超大型空载船舶驶出铜鼓水道的安全操纵[J].天津航海,2021(3):23-25.
4丁梦远,郭迟,黄凯.激光—相机系统语义栅格建图和路径规划[J].中国图象图形学报,2021,26(10):2524-2532. 被引量：5
5覃艺丹,卢英战.糖厂改造低温燃硫炉和中和反应器提高澄清质量的实践探索[J].甘蔗糖业,2021,50(4):59-65. 被引量：1

云南大学学报（自然科学版）

2021年第6期

浏览历史

内容加载中请稍等...

基于深度强化学习和人工势场法的移动机器人导航被引量：5

参考文献2

二级参考文献7

共引文献26

同被引文献51

引证文献5

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

基于深度强化学习和人工势场法的移动机器人导航 被引量：5

参考文献2

二级参考文献7

共引文献26

同被引文献51

引证文献5

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

基于深度强化学习和人工势场法的移动机器人导航被引量：5