DDPG深度强化学习算法在无人船目标追踪与救援中的应用

Application of DDPG deep reinforcement learning algorithm in unmanned ship target tracking and rescue

下载PDF

导出

摘要为保证海上救援活动的高效性,研究结合深度确定性策略梯度算法(Deep Deterministic Policy Gradient,DDPG)从状态空间、动作空间、奖励函数方面对船只追踪救援目标算法进行设计,并实际应用到无人船追踪救援之中。结果显示DDPG算法的稳定成功率接近100%,性能优异。该设计的算法最终回合累积奖励值能够稳定在10左右,而平均时长则能稳定在80 s左右,能够根据周边环境的状态调整自己的运动策略,满足海上救援活动中的紧迫性要求,能为相关领域的研究提供一条新的思路。 In order to ensure the efficiency of maritime rescue activities,the ship tracking and rescue target algorithm from three aspects:state space,action space and reward function is designed and the unmanned ship tracking and rescue is applied.The results show that the stable success rate of ddpg algorithm is close to 100%and the performance is excellent.The cumulative reward value of the final round of the designed algorithm can be stable at about 10,while the average duration can be stable at about 80 s.It can adjust its movement strategy according to the state of the surrounding environment,meet the urgent requirements in maritime rescue activities,and provide a new idea for research in related fields.

作者宋雷震吕东芳 SONG Lei-Zhen;LV Dong-Fang(School of Information Engineering,Huainan Union University,Huainan 232038,Anhui,China)

机构地区淮南联合大学智能制造学院

出处《黑龙江大学工程学报（中英俄文）》 2024年第1期58-64,共7页 Journal of Engineering of Heilongjiang University

基金淮南联合大学校级自然科学项目(LZX1902) 安徽省自然科学重点项目(KJ2021A1311)。

关键词无人船目标追踪海上救援深度确定性策略梯度算法(DDPG) unmanned ship target tracking sea rescue Deep Deterministic Policy Gradient(DDPG)

分类号 TP249 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献12

1张静,韩立民.试论海洋产业结构的演进规律[J].中国海洋大学学报（社会科学版）,2006(6):1-3. 被引量：72
2楼东,谷树忠,钟赛香.中国海洋资源现状及海洋产业发展趋势分析[J].资源科学,2005,27(5):20-26. 被引量：104
3王凤武,吴兆麟,郑中义.海难事故原因分析与预防对策[J].世界海运,2003,26(1):9-11. 被引量：8
4刘琨,张永辉,任佳.基于改进人工势场法的无人船路径规划算法[J].海南大学学报（自然科学版）,2016,34(2):99-104. 被引量：16
5柳晨光,初秀民,毛庆洲,谢朔.无人船自适应路径跟踪控制系统[J].机械工程学报,2020,56(8):216-227. 被引量：20
6严汝建,庞硕,孙寒冰,庞永杰.Development and Missions of Unmanned Surface Vehicle[J].Journal of Marine Science and Application,2010,9(4):451-457. 被引量：73
7赵春晖,肖舒匀,宿南.基于注意力机制特征增强的舰船目标识别[J].黑龙江大学工程学报,2022,13(1):43-51. 被引量：8
8张浩昱,熊凯.改进深度确定性策略梯度算法及其在控制中的应用[J].计算机科学,2019,46(B06):555-557. 被引量：7
9刘胜祥,林群煦,杨智才,吴月玉,翟玉江.基于深度确定性策略梯度算法的双轮机器人平衡控制研究[J].机械工程师,2020,0(3):142-144. 被引量：2
10吴思凡,杜煜,徐世杰,杨硕,杜晨.基于深度确定性策略梯度的智能车汇流模型[J].计算机工程,2020,46(1):87-92. 被引量：4

二级参考文献51

1李擎,张超,韩彩卫,张婷,张维存.动态环境下基于模糊逻辑算法的移动机器人路径规划[J].中南大学学报（自然科学版）,2013,44(S2):104-108. 被引量：23
2陈高荣.大型散装船船体破损的原因及防荡措施[J].航海技术,1993(4):1-3. 被引量：1
3汪传旭.大型散货船舶海难事故原因及其防止对策[J].航海科技动态,1994(9):6-8. 被引量：2
4张耀光,胡新华,高辛萍.我国海洋经济高新技术的“瓶颈”制约及对策[J].人文地理,2002,17(3):90-92. 被引量：20
5徐玉如,苏玉民,庞永杰.海洋空间智能无人运载器技术发展展望[J].中国舰船研究,2006,1(3):1-4. 被引量：87
6[2]毛林根.产业经济学[M].上海:上海人民出版社,1998.
7邓聚龙.灰色控制系统[M].武汉：华中理工大学出版社,1993..
8陆大道.中国沿海地区21世纪持续发展[M].武汉:湖北科学技术出版社,1998.430～457.
9刘成武杨志荣方中权等.自然资源概论[M].北京:科学出版社,2001.277.
10Huang Y, Hu H, Liu X. Obstacles avoidance of artificial potential field method with memory function in complex environment : proceedings of the 8th World Congress on Intelligent Control and Automation, Jinan, July 7 - 9, 2010 [ C ]. [ S. 1. ] : IEEE, 2010.

共引文献307

1薛宗杭.基于蚁群算法的船舶自主避障路径规划[J].中国水运（下半月）,2023(1):19-21. 被引量：1
2杨阳,张明进,韩玉芳,王平义,初秀民,刘怀汉,张华庆.内河航道设施智能化监测预警与信息服务关键技术研究[J].中国基础科学,2021(1):26-33. 被引量：6
3徐小强,刘芃辉,冒燕.改进人工势场法和ID-BFS融合算法的无人艇路径规划研究[J].武汉理工大学学报,2021,43(5):85-91. 被引量：5
4方中华,褚宏宪,冯京,杨源.无人船艇在海洋地质调查中的应用及展望[J].海洋地质前沿,2020,0(3):72-77. 被引量：14
5仝世豪,孙建波,陈亚辉,冯伟,孙涛,王浩亮.面向海上搜救的ASV与AUV的协同控制[J].船舶工程,2023,45(7):1-8. 被引量：1
6刘合林.盐城市海岸带资源浅析及其产业发展抉择[J].资源与人居环境,2007(18):38-41. 被引量：1
7李晨云.河北省海洋产业结构现状分析与调整对策[J].海洋开发与管理,2009,26(1):86-91. 被引量：6
8谢子远.我国海洋产业结构的动态演化[J].改革与战略,2012,28(4):152-154. 被引量：5
9黄蔚艳.现代服务业与海洋产业协同发展研究[J].生态经济（学术版）,2012(1):310-313. 被引量：1
10武京军,刘晓雯.中国海洋产业结构分析及分区优化[J].中国人口·资源与环境,2010,20(S1):21-25. 被引量：22

1刘子昂.小型无人机在海上搜救活动中的应用研究[J].水上安全,2024(3):13-15. 被引量：2
2王秋实,蔡子雷,刘峻豪,施锐,张文译.半穿甲舰炮弹药侵彻舰船靶板数值仿真研究[J].指挥控制与仿真,2024,46(1):100-105.

黑龙江大学工程学报（中英俄文）

2024年第1期

浏览历史

内容加载中请稍等...

DDPG深度强化学习算法在无人船目标追踪与救援中的应用

参考文献12

二级参考文献51

共引文献307

相关作者

相关机构

相关主题

浏览历史