基于深度强化学习的无人驾驶船舶避碰行为决策方法

Collision avoidance behavior decision⁃making of unmanned ship based on deep reinforcement learning

导出

摘要为解决无人驾驶船舶的多船避碰问题,结合船舶领域知识、国际海上避碰规则(COLREGs)及船舶操纵特性,提出一种基于深度确定性策略梯度(DDPG)算法的多船会遇避碰行为决策方法。采用门控循环单元(GRU)构建神经网络模型,并进行层归一化处理,可有效处理高维观测数据,提高了行为决策的效率。本文设计的奖励函数符合国际海上避碰规则,并考虑了尽量使用小舵角进行避让的船舶操纵习惯。多船会遇的仿真实验验证了本文避碰决策方法在灵活性和有效性方面的优势。 To solve the problem of multi⁃vessel collision avoid⁃ance of unmanned ships,a multi⁃vessel collision avoidance behavior decision⁃making method based on the deep determin⁃istic policy gradient(DDPG)algorithm was proposed,which combining knowledge of ship domain,international regulations for preventing collisions at sea(COLREGs),and ship ma⁃neuvering characteristics.The gated recurrent unit(GRU)was used to construct a neural network model and performs layer normalization,which can effectively process high⁃dimensional observation data and improve the efficiency of behavior⁃al decision⁃making methods.The reward function designed in this paper conformed to the GOLREGs,while considering the ship maneuvering habit of using small rudder angles as much as possible for avoidance.The simulation experiments of mul⁃tiple⁃ship encounters verified the advantages of the collision a⁃voidance decision⁃making method in terms of flexibility and effectiveness in this paper.

作者关巍罗文哲崔哲闻 GUAN Wei;LUO Wenzhe;CUI Zhewen(Navigation College,Dalian Maritime University,Dalian 116026,China)

机构地区大连海事大学航海学院

出处《大连海事大学学报》 CAS CSCD 北大核心 2024年第1期11-19,共9页 Journal of Dalian Maritime University

基金国家自然科学基金资助项目(52171342)。

关键词多船避碰行为决策国际海上避碰规则(COL⁃REGs) 深度强化学习门控循环单元(GRU) multi⁃ship collision avoidance behavioral deci⁃sion⁃making international regulations for preventing collisions at sea(COLREGs) deep reinforcement learning gated recurrent unit(GRU)

分类号 U676.1 [交通运输工程—船舶及航道工程]

引文网络
相关文献

参考文献7

1周济.智能制造——“中国制造2025”的主攻方向[J].中国机械工程,2015,26(17):2273-2284. 被引量：1202
2张笛,赵银祥,崔一帆,万程鹏.智能船舶的研究现状可视化分析与发展趋势[J].交通信息与安全,2021,39(1):7-16. 被引量：18
3薛彦卓,魏伊,孙淼.基于避碰重点船算法的多船避碰模拟[J].大连海事大学学报,2014,40(1):13-16. 被引量：9
4茅云生,宋利飞,向祖权,周永清,茅普修,闫钊.水面无人艇多船障碍智能避碰[J].大连海事大学学报,2015,41(4):8-13. 被引量：8
5沈海青,郭晨,李铁山,余亚磊.考虑航行经验规则的无人船舶智能避碰导航方法[J].哈尔滨工程大学学报,2018,39(6):998-1005. 被引量：18
6刘绍满,王宁,吴兆麟.船舶领域研究综述[J].大连海事大学学报,2011,37(1):51-54. 被引量：27
7吴莹莹,赵丽宁,袁志鑫,张灿.基于注意力机制的CNN-GRU船舶交通流预测模型[J].大连海事大学学报,2023,49(1):75-84. 被引量：6

二级参考文献58

1徐海祥,朱梦飞,余文曌,韩鑫.面向智能船舶的自动靠泊鲁棒自适应控制[J].华中科技大学学报（自然科学版）,2020,48(3):25-29. 被引量：7
2郭志新.船舶领域边界的量化分析[J].船海工程,2001,30(S1):63-64. 被引量：7
3贾传荧.拥挤水域内船舶领域的探讨[J].大连海运学院学报,1989,15(4):15-19. 被引量：26
4刘顺来,钟碧良.浅析船舶避碰决策研究的现状与前景[J].广州航海高等专科学校学报,2005,13(2):12-15. 被引量：1
5]YANG Shen-hua, LI Li-na, SUO Yong-feng, et al. Study on construction of simulation platform for vessel automatic anti-collision and its test method [ C ]//Proceedings of the IEEE International Conference on Automation and Logis- tics, Jinan : IEEE Press ,2007.
6COENEN F P,SMEATON G P, BOLE A G.. Knowl- edge-based collision avoidance[ J]. The Journal of Navi- gation, 1989,42( 1 ) : 107 - 116.
7王永江.船舶避碰决策理论与方法的研究[M].上海:上海海事大学,2004.
8YAMADA K,ARMURA N. A study on man-machine sys- tem in vessel traffic flow[J]. The Journal of Japan Insti- tute of Navigation, 1988 (25) : 16 - 17.
9XUE Y, LEE B S, HAN D. Automation collision avoid- ance of ships[J]. Proc. IMechE Part M:J. Eng. Marit. Environ, 2009,223 (1) :33 - 46.
10ABU-TAIR M, NAEEM W. A decision support frame- work for collision avoidance of unmanned maritime vehi- cles[J]. Communications in Computer and Information Science, 2013, 355:549 - 557.

共引文献1278

1念潮旭.“3+4”中本贯通人才培养模式:基于福建的实施逻辑、实践矛盾及推进路径[J].中国职业技术教育,2020,0(3):85-91. 被引量：8
2李健旋.中国制造业智能化程度评价及其影响因素研究[J].中国软科学,2020(1):154-163. 被引量：69
3刘钊,谢金鹏,张明阳,付姗姗,徐言民.考虑避让紧迫度的数字化船舶领域模型[J].中国航海,2021,44(2):15-20. 被引量：3
4张照亿,李颖,董双,刘志晨.基于船舶领域模型的船舶碰撞危险识别方法[J].中国航海,2021,44(2):1-7. 被引量：8
5施子楷,刘敬,周海伦,王鑫,张枫华.基于GIS的钢铁企业智能化工厂管理系统初探[J].冶金自动化,2023,47(S01):248-252.
6孙远,葛秀欣,张晓峰,张永锋,朱晓风,朱志斌,马骏.大方坯连铸机数字化升级改造[J].冶金自动化,2023,47(S01):182-185.
7金晓晖,乔建基.基于三维模型的连铸数字化运营平台分析[J].冶金自动化,2020(5):34-38. 被引量：2
8黄从治,肖磊.建筑企业数字化转型面临的挑战和应对策略[J].铁道工程学报,2022,39(9):79-84. 被引量：8
9赵久强,冯毅萍,王凯军,李一鸣,易畅,解同辰.FlexiJet柔性上料综合创新实验平台研制[J].实验技术与管理,2020,37(2):86-89. 被引量：3
10张腾.煤机制造企业下料数字化车间的研究[J].能源与节能,2020,0(2):138-139. 被引量：2

1吴天昊,王欣,李海滨,倪生科,刘正江,林彬.多船确定性避碰行动最优决策模型[J].中国造船,2023,64(6):261-271.
2沈飞,钱立胜.智能与无人驾驶船舶的发展现状与趋势[J].航海,2024(1):3-5.
3陈蜀喆,龚彪,康杰,孙俊博.基于改进DBSCAN的船舶会遇识别模型[J].上海海事大学学报,2024,45(1):1-9.
4赵明.船舶操纵运动预报的实现及其在航行安全的应用[J].珠江水运,2024(4):154-156.
5田舒同.无人船的普及与《海商法》修改的立法内应[J].水上安全,2023(15):13-15.
6王荷醒.无人船舶,扬帆智慧海洋——海南科技职业大学“新型辅助无人船系统”项目[J].现代青年,2023(12):31-34.
7张荣翔,戴永寿,李立刚,金久才.基于漂角估计的无人船智能避碰方法[J].舰船电子工程,2023,43(12):65-70.
8崔浩,张新宇,王警,王程博,郑康洁.自主船舶与有人驾驶船舶动态博弈避碰决策[J].中国舰船研究,2024,19(1):238-247.
9赵贵祥,王晨旭,周健,李云淼.基于改进模糊评价法的无人艇碰撞风险计算[J].系统工程与电子技术,2024,46(3):1031-1037.
10王潋,陈霄,完颜娟.一种动态不确定海洋环境下的USV态势自主感知及避障算法[J].火力与指挥控制,2024,49(3):73-79.

大连海事大学学报

2024年第1期

浏览历史

内容加载中请稍等...

基于深度强化学习的无人驾驶船舶避碰行为决策方法

参考文献7

二级参考文献58

共引文献1278

相关作者

相关机构

相关主题

浏览历史