基于深度强化学习的无人船全覆盖路径规划被引量：2

USV coverage path planning based on deep reinforcement learning

下载PDF

导出

摘要无人船使用传统“之”字形算法在不规则岛屿区域执行海上搜索任务时,无法实现全覆盖路径规划。针对该问题,文中提出一种将“之”字形算法和基于深度强化学习的无人船全覆盖路径规划算法框架相结合的混合算法,对大范围无障碍区域使用“之”字形算法,对存在障碍的小范围区域使用深度强化学习算法框架,并引入内在好奇心模块增强该算法框架的收敛速度。该算法框架将搜索区域的地图信息转换成矢量观测值并通过全连接层传递给智能体,从而训练出一个神经网络为无人船做规划决策,在满足规避障碍物的安全约束条件下实现任务区域的全覆盖。试验方面,通过Unity3D仿真平台搭建三维环境模型,验证该混合算法的可行性。结果表明,所提出的无人船全覆盖路径规划算法框架可在岛屿区域达到覆盖率100%,且路径较短。 The unmanned surface vehicle(USV)cannot achieve full coverage path planning when using traditional zigzag algorithm to perform maritime search task in irregular island area.On this basis,a hybrid algorithm combining zigzag algorithm and USV full coverage path planning algorithm framework based on deep reinforcement learning is proposed.The zigzag algorithm is used for a large range of barrier-free areas,the deep reinforcement learning algorithm framework is used for small areas with obstacles,and the internal curiosity module is introduced to enhance the convergence speed of the algorithm framework.This algorithm framework can be used to convert the map information of the search area into vector observations and transfer them to the agent by means of the full connection layer,thus training a neural network to make planning decisions for USV,and achieving full coverage of the task area under the security constraints of obstacle avoidance.In the aspect of the experiment,the feasibility of the hybrid algorithm was verified by building a 3D environment model on the Unity3D simulation platform.The results show that the proposed USV coverage path planning algorithm can achieve 100%coverage and has a short path in the island area.

作者宋大雷吕昆岭陈小平干文浩曹江丽 SONG Dalei;LÜKunling;CHEN Xiaoping;GAN Wenhao;CAO Jiangli(College of Engineering,Ocean University of China,Qingdao 266100,China;Institute for Advanced Ocean Study,Ocean University of China,Qingdao 266100,China;Teaching Center of Fundamental Courses,Ocean University of China,Qingdao 266100,China;709th Research Institute,China State Shipbuilding Industry Corporation Limited,Wuhan 430205,China)

机构地区中国海洋大学工程学院中国海洋大学海洋高等研究院中国海洋大学基础教学中心中国船舶重工集团公司第七〇九研究所

出处《现代电子技术》 2022年第22期1-7,共7页 Modern Electronics Technique

基金十三五国防预研项目(995-02030503)。

关键词无人船深度强化学习全覆盖路径规划避障仿真实验可行性验证 USV deep reinforcement learning full coverage path planning obstacle avoidance simulation experiment feasibility verification

分类号 TN953-34 [电子电信—信号与信息处理] TP399 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献7

1宋宇,王志明.基于改进遗传算法的移动机器人路径规划[J].现代电子技术,2019,42(24):172-175. 被引量：30
2杨凯,龙佳,马雪燕,余中政.移动机器人改进人工势场的路径规划方法研究[J].现代电子技术,2020,43(7):141-145. 被引量：18
3董加鑫.基于深度强化学习的无人机区域覆盖路径规划研究[J].工业控制计算机,2021,34(5):80-82. 被引量：8
4赖俊,饶瑞.深度强化学习在室内无人机目标搜索中的应用[J].计算机工程与应用,2020,56(17):156-160. 被引量：9
5谭庆,李辉,吴昊霖,王壮,邓书超.基于奖励预测误差的内在好奇心方法[J].计算机应用,2022,42(6):1822-1828. 被引量：3
6陈天元,袁伟,俞孟蕻.基于集合制导和动态窗口约束的无人船自主动态避碰方法研究[J].中国造船,2020,61(3):176-185. 被引量：3
7雷洁,徐文华,许国冬,李明爵.基于双目视觉定位技术的无人船航迹跟踪控制室内模型实验[J].无人系统技术,2022,5(1):43-50. 被引量：3

二级参考文献28

1彭辉,王林,沈林成.区域目标搜索中基于改进RRT的UAV实时航迹规划[J].国防科技大学学报,2009,31(5):86-91. 被引量：24
2郑锐,冯振明,陆明泉.基于遗传算法的无人机航路规划优化研究[J].计算机仿真,2011,28(6):88-91. 被引量：28
3张晶晶,周德云,张堃.一种基于强化学习的UAV目标搜索算法[J].计算机应用研究,2011,28(10):3659-3661. 被引量：4
4乔莎莎,吴勇,张建东,史国庆.基于遗传算法和人工势场法的路径规划[J].现代电子技术,2012,35(12):75-78. 被引量：7
5杨献峰,付俊辉.移动机器人路径规划的仿真研究[J].计算机仿真,2012,29(7):223-226. 被引量：11
6陈超,唐坚.基于可视图法的水面无人艇路径规划设计[J].中国造船,2013,54(1):129-135. 被引量：38
7谢涛,刘锐,胡秋红,姚新.基于无人机遥感技术的环境监测研究进展[J].环境科技,2013,26(4):55-60. 被引量：79
8唐平鹏,张汝波,史长亭,杨歌,刘德丽.水面无人艇分层策略局部危险规避[J].应用科学学报,2013,31(4):418-426. 被引量：8
9余扬,赵凯飞,沈嘉.室内定位技术应用、研究现状及展望[J].电信网技术,2014(5):46-49. 被引量：16
10曾小龙,茅云生,宋利飞,董早鹏,包涛.基于改进细菌觅食优化的无人艇自主避碰算法[J].大连海事大学学报,2018,44(4):35-42. 被引量：11

共引文献65

1何志强,专祥涛,梁杰,张逸凡.基于区域人工势场的无人船目标跟踪策略研究[J].中国造船,2023,64(1):236-245. 被引量：4
2罗国攀,张国良,徐佳宝.基于SPE-ICM的移动机器人内在动机避障规划[J].电子测量与仪器学报,2023,37(2):21-27. 被引量：3
3蒋方庆,陈自力,高喜俊,王春峰,贺道坤.基于改进TD3算法的无人机决策研究[J].信息化研究,2023,49(3):36-42.
4夏天冰,查伊倩,赵丽莉,李明原,王鸿东.无人船在港口安全保障中的应用研究[J].船舶工程,2023,45(7).
5王顺宏,赵鑫,李德祥,杨涛.基于改进人工势场法的运动目标在线规划方法[J].火箭军工程大学学报,2020(3):7-12. 被引量：1
6郎磊,夏应清.紧凑的神经网络模型设计研究综述[J].计算机科学与探索,2020,14(9):1456-1470. 被引量：5
7段立伟,王进华.改进遗传算法在移动机器人路径规划中的应用[J].信息通信,2020(7):5-8. 被引量：1
8李世国,苏卫华,郭鹏飞,张世月,谢鹏发.基于改进A^*算法的无人搜救全局路径规划研究[J].医疗卫生装备,2020,41(12):16-20. 被引量：12
9戈萧,郑慧.基于插值参考点的多目标路径规划方法研究[J].浙江科技学院学报,2020,32(6):541-548.
10何乃峰,宿一凡,刘子弘,张文娇.基于改进人工势场法的移动机器人路径规划算法研究[J].现代制造技术与装备,2020,56(12):1-3. 被引量：5

同被引文献19

1杜婉茹,王潇茵,贾福凯,郑重,李慧妍.基于多层双向A~*的未知环境路径规划算法研究[J].计算机应用与软件,2019,36(12):261-267. 被引量：14
2王中玉,曾国辉,黄勃.基于改进双向A^*的移动机器人路径规划算法[J].传感器与微系统,2020,39(11):141-143. 被引量：21
3张鹏,葛中盛,徐效农,赵奉奎.一种基于人工势场法的自动驾驶汽车主动避障路径规划算法[J].智能计算机与应用,2020,10(9):174-177. 被引量：5
4陈德童,刘贤达,刘生伟.基于双向搜索改进A;算法的自动导引车路径规划[J].计算机应用,2021,41(S02):309-313. 被引量：20
5李奇才,舒远仲,洪宇轩.一种蚁群算法与自适应机制的路径规划算法优化[J].机械科学与技术,2022,41(7):1095-1101. 被引量：8
6谢春丽,高胜寒,孙学志.融合改进A^(*)算法和贝塞尔曲线优化的路径规划算法[J].重庆理工大学学报（自然科学）,2022,36(7):177-187. 被引量：18
7赵春宇,姜皓,徐茂竹,满伟俊,杨伟明,陈范模.改进A^(*)算法在无人船路径规划中的应用[J].浙江工业大学学报,2022,50(6):615-620. 被引量：17
8程满,杨光永,徐天奇,黄卓群,戈一航.基于电子地图的D^(*)补偿算法AGV路径规划[J].计算机与数字工程,2022,50(10):2187-2191. 被引量：3
9沈克宇,游志宇,刘永鑫,黄涛.基于改进A^(*)算法的移动机器人路径规划[J].计算机应用研究,2023,40(1):75-79. 被引量：23
10吴昊,吴子昂,孟庆斌,刘广伟.水环境监测场景中的自主巡航无人船系统[J].电子制作,2023,31(2):14-17. 被引量：3

引证文献2

1孟凡齐,孙潇潇,朱金善,梅斌,郑沛洁.基于双向A^(*)-APF算法的船舶路径规划研究[J].大连海洋大学学报,2024,39(3):506-515.
2吴健,何良,曹晓桢.水库库容无人船自动巡航路径规划算法与仿真实验[J].科技创新与应用,2024,14(30):12-15.

1邢博闻,杨柳,胡庆松,王五桂.无人船全覆盖路径规划算法研究[J].兵器装备工程学报,2022,43(9):28-33. 被引量：6
2马建业,郑东健,孙建伟.基于生物启发神经网络的水下坝面表观裂缝检测路径规划算法[J].水利水电科技进展,2022,42(6):60-65. 被引量：5
3田鹏,朱志斌,步海明,唐强.野外自主移动智能机器人设计[J].科学技术创新,2022(27):191-196. 被引量：1
4赵其定,汪夏荣.在三维未知动态环境中无人机避障导航混合方法的研究[J].科学技术创新,2022(32):45-50.
5巫茜,黄浩,曾青,王成睿,邝茜.改进ACO算法的UAV航迹规划在山区物流配送中的应用研究[J].重庆理工大学学报（自然科学）,2022,36(10):185-191. 被引量：3

现代电子技术

2022年第22期

浏览历史

内容加载中请稍等...

基于深度强化学习的无人船全覆盖路径规划被引量：2

参考文献7

二级参考文献28

共引文献65

同被引文献19

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于深度强化学习的无人船全覆盖路径规划 被引量：2

参考文献7

二级参考文献28

共引文献65

同被引文献19

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于深度强化学习的无人船全覆盖路径规划被引量：2