基于多智能体深度强化学习的船舶协同避碰策略被引量：2

Ship cooperative collision avoidance strategy based on multi-agent deep reinforcement learning

导出

摘要船舶避碰是智能航行中首要解决的问题,多船会遇局面下,只有相互协作,共同规划避碰策略,才能有效降低碰撞风险.为使船舶智能避碰策略具有协同性、安全性和实用性,提出一种基于多智能体深度强化学习的船舶协同避碰决策方法.首先,研究船舶会遇局面辨识方法,设计满足《国际海上避碰规则》的多船避碰策略.其次,研究多船舶智能体合作方式,构建多船舶智能体协同避碰决策模型:利用注意力推理方法提取有助于避碰决策的关键数据;设计记忆驱动的经验学习方法,有效积累交互经验;引入噪音网络和多头注意力机制,增强船舶智能体决策探索能力.最后,分别在实验地图与真实海图上,对多船会遇场景进行仿真实验.结果表明,在协同性和安全性方面,相较于多个对比方法,所提出的避碰策略均能获得具有竞争力的结果,且满足实用性要求,从而为提高船舶智能航行水平和保障航行安全提供一种新的解决方案. Ship collision avoidance is the primary issue in intelligent navigation.In multi-ship encounters,only by collaborating and jointly planning collision avoidance strategies,the collision risk can be effectively reduced.In order to make the ship intelligent collision avoidance strategy collaborative,safe and practical,a ship collaborative collision avoidance decision method based on multi-agent deep reinforcement learning is proposed.Firstly,the method of identifying ship encounter situations is studied and a multi-ship collision avoidance strategy that satisfies the"International regulations for preventing collisions at sea"is designed.Secondly,by analysing the cooperation mode of multi-ship agents,a multi-ship agent cooperative collision avoidance decision-making model is constructed.The model uses the attention inference method to extract the key data that is helpful for collision avoidance decisions.And a memory driven experience learning method is designed to effectively accumulate interactive experience.In addition,the noise network and multi-head attention mechanism are introduced into the model to enhance decision-making and exploration capabilities of ship agents.Finally,on the experimental map and the real nautical chart,simulation experiments are carried out on the multi-ship encounter scenarios.The results show that in terms of collaboration and safety,compared with multiple comparison methods,competitive results are obtained and the practical requirements are met using the proposed method,which provides a new solution for improving theintelligent navigation of ships and ensuring navigation safety.

作者隋丽蓉高曙何伟 SUI Li-rong;GAO Shu;HE Wei(School of Computer Science and Artificial Intelligence,Wuhan University of Technology,Wuhan 430063,China;College of Physics Electronic Information Engineering,Minjiang University,Fuzhou 350108,China)

机构地区武汉理工大学计算机与人工智能学院闽江学院物理与电子信息工程学院

出处《控制与决策》 EI CSCD 北大核心 2023年第5期1395-1402,共8页 Control and Decision

基金绿色智能内河创新国家重大科技专项项目(工信部装函(2019)) 国家自然科学基金项目(52172327)。

关键词多智能体深度强化学习多智能体通信模型多智能体合作协同决策船舶避碰协同避碰策略 multi-agent deep reinforcement learning multi-agent communication model multi-agent cooperation collaborative decision-making ship collision avoidance collaborative collision avoidance strategy

分类号 TP273 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献5

1沈海青,郭晨,李铁山,余亚磊.考虑航行经验规则的无人船舶智能避碰导航方法[J].哈尔滨工程大学学报,2018,39(6):998-1005. 被引量：18
2蒋明智,吴天昊,张琳.基于深度强化学习的无信号交叉口车辆协同控制算法[J].交通运输工程与信息学报,2022,20(2):14-24. 被引量：3
3宋佰霖,许华,齐子森,饶宁,彭翔.一种基于深度强化学习的协同通信干扰决策算法[J].电子学报,2022,50(6):1301-1309. 被引量：3
4周怡,袁传平,谢海成,羊箭锋.基于DDPG算法的游船航行避碰路径规划[J].中国舰船研究,2021,16(6):19-26. 被引量：7
5周双林,杨星,刘克中,熊勇,吴晓烈,刘炯炯,王伟强.规则约束下基于深度强化学习的船舶避碰方法[J].中国航海,2020,43(3):27-32. 被引量：7

二级参考文献26

1李丽娜,王俊玲,陈国权.船舶拟人智能避碰决策理论的集成机器学习策略[J].信息与控制,2011,40(3):359-368. 被引量：13
2李丽娜,邵哲平.船舶拟人智能避碰决策理论介绍[J].中国海事,2011(7):24-27. 被引量：5
3李丽娜,陈国权,邵哲平,熊振南,杨神化,孙洪波.船舶拟人智能避碰决策方法及其评价标准的构建[J].大连海事大学学报,2011,37(4):1-5. 被引量：14
4康与涛,朱大奇,陈伟炯.船舶避碰路径规划研究综述[J].船海工程,2013,42(5):141-145. 被引量：13
5于家根,刘正江,卜仁祥,高孝日,李伟峰.基于拟态物理学优化算法的船舶转向避碰决策[J].中国航海,2016,39(1):36-38. 被引量：11
6尚明栋,朱志宇,周涛.基于改进蚁群算法的水面无人艇智能避碰方法研究[J].船舶工程,2016,38(9):6-9. 被引量：11
7倪生科,刘正江,蔡垚,王欣.基于遗传算法的船舶避碰决策辅助[J].上海海事大学学报,2017,38(1):12-15. 被引量：18
8颛孙少帅,杨俊安,刘辉,黄科举.采用双层强化学习的干扰决策算法[J].西安交通大学学报,2018,52(2):63-69. 被引量：11
9陈希亮,曹雷,李晨溪,徐志雄,何明.基于重抽样优选缓存经验回放机制的深度强化学习方法[J].控制与决策,2018,33(4):600-606. 被引量：22
10沈海青,郭晨,李铁山,余亚磊.考虑航行经验规则的无人船舶智能避碰导航方法[J].哈尔滨工程大学学报,2018,39(6):998-1005. 被引量：18

共引文献30

1李昀哲,乐小龙,张毅,刘彬.自主航行避碰决策技术研究综述[J].船舶工程,2023,45(7).
2王仁强,赵越.基于Sigmoid函数的限制水域船舶避障路径建模[J].广州航海学院学报,2019,27(1):25-28. 被引量：1
3谢玉龙,王直.基于改进遗传算法的船舶路径规划[J].计算机技术与发展,2019,29(5):152-156. 被引量：8
4汤国瑞,谢新连,潘伟.复杂水域船舶智能避碰专家系统设计[J].船海工程,2019,48(3):160-165. 被引量：11
5范云生,苏辉,王国峰.无人水面艇自主航行能力测试技术与应用[J].大连海事大学学报,2020,46(3):38-49. 被引量：9
6周双林,杨星,刘克中,熊勇,吴晓烈,刘炯炯,王伟强.规则约束下基于深度强化学习的船舶避碰方法[J].中国航海,2020,43(3):27-32. 被引量：7
7冯涂超,郑茂,尹奇志,初秀民,谢朔.基于海上避碰规则和机器学习的辅助避碰决策方法研究[J].武汉理工大学学报（交通科学与工程版）,2021,45(1):111-116. 被引量：2
8宁君,陈汉民,鲁峰,李春泽.基于自适应神经网络智能舵的自动避碰研究[J].浙江海洋大学学报（自然科学版）,2021,40(1):71-79. 被引量：1
9王兴华,陈国权,李丽娜,李国定.不同船速比对改向避让效果的影响[J].集美大学学报（自然科学版）,2021,26(4):320-326.
10崔铁军,王凌霄.YOLOv4目标检测算法在煤矿工人口罩佩戴监测工作中的应用研究[J].中国安全生产科学技术,2021,17(10):66-71. 被引量：14

同被引文献15

1张化光,张欣,罗艳红,杨珺.自适应动态规划综述[J].自动化学报,2013,39(4):303-311. 被引量：77
2WEN Guanghui,YU Wenwu,YU Xinghuo,Lü Jinhu.Complex Cyber-Physical Networks： From Cybersecurity to Security Control[J].Journal of Systems Science & Complexity,2017,30(1):46-67. 被引量：12
3Derong Liu,Yancai Xu,Qinglai Wei,Xinliang Liu.Residential Energy Scheduling for Variable Weather Solar Energy Based on Adaptive Dynamic Programming[J].IEEE/CAA Journal of Automatica Sinica,2018,5(1):36-46. 被引量：13
4杜威,丁世飞.多智能体强化学习综述[J].计算机科学,2019,46(8):1-8. 被引量：45
5孙长银,穆朝絮.多智能体深度强化学习的若干关键科学问题[J].自动化学报,2020,46(7):1301-1312. 被引量：78
6梁星星,冯旸赫,马扬,程光权,黄金才,王琦,周玉珍,刘忠.多Agent深度强化学习综述[J].自动化学报,2020,46(12):2537-2557. 被引量：32
7周凤杰.船舶避碰的粒子群-遗传(PSO-GA)的混合优化算法研究[J].船舶力学,2021,25(7):909-916. 被引量：10
8谢鸿伟,张英俊,邢胜伟,高宗江.基于模型预测控制的船舶自主避碰方法[J].船舶工程,2021,43(8):23-28. 被引量：13
9ZHANG Jiandong,YANG Qiming,SHI Guoqing,LU Yi,WU Yong.UAV cooperative air combat maneuver decision based on multi-agent reinforcement learning[J].Journal of Systems Engineering and Electronics,2021,32(6):1421-1438. 被引量：10
10李丽娜,陈国权,杨凌波,许春亮,王兴华,文婷.船舶拟人智能避碰决策算法测试及应用[J].中国航海,2022,45(1):1-7. 被引量：10

引证文献2

1温广辉,杨涛,周佳玲,付俊杰,徐磊.强化学习与自适应动态规划:从基础理论到多智能体系统中的应用进展综述[J].控制与决策,2023,38(5):1200-1230. 被引量：2
2张哲.多规则约束条件下的船舶实时避碰算法研究[J].舰船科学技术,2023,45(14):164-167.

二级引证文献2

1沈超,周振超.基于自适应控制的多智能体一致性跟踪系统设计[J].辽宁科技学院学报,2023,25(6):20-23.
2张捷,姚瑶,王健安,李志强.固定和切换拓扑下多智能体系统二分容错状态一致性研究[J].控制工程,2024,31(3):439-449.

1高振.基于多智能体深度强化学习的船舶协同避碰策略研究[J].中文科技期刊数据库（引文版）工程技术,2023(5):0087-0090.
2赵光辉,杨晓敏.单图像超分辨率多尺度特征融合网络[J].现代计算机,2023,29(8):67-74.
3宋健,王子磊.基于值分解的多目标多智能体深度强化学习方法[J].计算机工程,2023,49(1):31-40.
4刘肖.全媒体融合视角下高校思想政治教育创新路径研究[J].中文科技期刊数据库（全文版）教育科学,2023(5):0019-0021.
5何荣坤,黄炜.一种集成式可视化遥测遥控航标灯器应用探讨[J].珠江水运,2023(7):21-23. 被引量：1
6李肖,李世其,韩可,李卓,熊友军,谢铮.面向实时自避碰的双臂机器人力矩控制策略[J].信息与控制,2023,52(2):211-219. 被引量：1
7王胜楠.让自主探索点亮数学课堂[J].文理导航,2023(20):49-51.
8张荣翔,戴永寿,李立刚,金久才.基于改进海洋捕食者算法的无人船避碰方法[J].现代电子技术,2023,46(5):119-125. 被引量：2
9曾丽虾,熊永强,任凤英.近视防控背景下防控相关人员的眼视光继续教育实践探索[J].科学咨询,2023(7):238-240.
10张严心,孔涵,殷辰堃,王子豪,黄志清.一类基于概率优先经验回放机制的分布式多智能体软行动-评论者算法[J].北京工业大学学报,2023,49(4):459-466. 被引量：2

控制与决策

2023年第5期

浏览历史

内容加载中请稍等...

基于多智能体深度强化学习的船舶协同避碰策略被引量：2

参考文献5

二级参考文献26

共引文献30

同被引文献15

引证文献2

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于多智能体深度强化学习的船舶协同避碰策略 被引量：2

参考文献5

二级参考文献26

共引文献30

同被引文献15

引证文献2

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于多智能体深度强化学习的船舶协同避碰策略被引量：2