基于强化学习的海洋移动观测网络观测路径规划方法被引量：3

Path planning for mobile ocean observation network based on reinforcement learning

下载PDF

导出

摘要合理有效地对移动海洋环境观测平台进行规划,有利于海洋环境观测网络的设计和海洋环境信息的采集。针对庞大的海洋环境,在有限的观测资源下,使用深度强化学习算法对海洋环境观测网络进行规划。针对强化学习算法求解路径规划问题中的离散和连续动作设计问题,分别使用DQN和DDPG两种算法对该问题进行单平台和多平台实验,实验结果表明,使用离散动作的DQN算法的奖赏函数优于使用连续动作的DDPG算法。进一步对两种算法求解的移动海洋观测平台的采样路径结果进行分析,结果显示,使用离散动作的DQN算法的采样结果也更好。实验结果证明,使用离散动作的DQN算法可以最大化对海洋环境中有效资料信息采集,说明了该方法的有效性和可行性。 Reasonable and effective planning method of mobile vehicles for marine environmental observation is beneficial to the design of marine environmental observation network and the collection efficiency of marine environmental information.In view of the vast marine environment and limited observation resources,the deep reinforcement learning algorithm is used to plan the marine environmental observation network.In order to solve the problems in the design of discrete and continuous motion during the path planning,two algorithms,DQN and DDPG,are designed to solve the problem of single platform and multi-platform experiments.The experimental results show that the reward curve of DQN algorithm using discrete motion is better than DDPG algorithm using continuous motion.This paper further analyzes the sampling path results of the mobile vehicles for marine environmental observation,and the results show that the sampling result of DQN algorithm with discrete action is better.The experimental results show that the DQN algorithm using discrete motion can maximize the effective data information collection,which demonstrates effectiveness and feasibility of the method.

作者赵玉新杜登辉成小会周迪邓雄刘延龙 ZHAO Yuxin;DU Denghui;CHENG Xiaohui;ZHOU Di;DENG Xiong;LIU Yanlong(College of Intelligent Systems Science and Engineering,Harbin Engineering University,Harbin 150001,China;China Ship Development and Design Center,Wuhan 430064,China)

机构地区哈尔滨工程大学智能科学与工程学院中国舰船研究设计中心

出处《智能系统学报》 CSCD 北大核心 2022年第1期192-200,共9页 CAAI Transactions on Intelligent Systems

基金国家自然科学基金项目(41676088) 中央高校基本科研业务费项目(3072021CFJ0401).

关键词深度强化学习海洋环境观测路径规划无人测量船 Q学习多智能体深度确定性策略梯度高斯排序 deep reinforcement learning marine environmental observation path planning USV Q learning multiagent DDPG RankGauss

分类号 TP242.6 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献7

1王建友.习近平建设海洋强国战略探析[J].辽宁师范大学学报（社会科学版）,2019,42(5):103-112. 被引量：7
2尹路,李延斌,马金钢.海洋观测技术现状综述[J].舰船电子工程,2013,33(11):4-7. 被引量：30
3张燕武.自适应海洋观测[J].地球科学进展,2013,28(5):537-541. 被引量：4
4李颖虹,王凡,任小波.海洋观测能力建设的现状、趋势与对策思考[J].地球科学进展,2010,25(7):715-722. 被引量：43
5王毅然,经小川,贾福凯,孙宇健,佟轶.基于多智能体协同强化学习的多目标追踪方法[J].计算机工程,2020,46(11):90-96. 被引量：7
6韩向敏,鲍泓,梁军,潘峰,玄祖兴.一种基于深度强化学习的自适应巡航控制算法[J].计算机工程,2018,44(7):32-35. 被引量：13
7王毅然,经小川,田涛,孙运乾,从帅军.基于强化学习的多Agent路径规划方法研究[J].计算机应用与软件,2019,36(8):165-171. 被引量：25

二级参考文献57

1王景武,金立生.车辆自适应巡航控制系统控制技术的发展[J].汽车技术,2004(7):1-4. 被引量：19
2习近平.发挥海洋资源优势建设海洋经济强省——在全省海洋经济工作会议上的讲话[J].浙江经济,2003(16):6-11. 被引量：15
3Dean Reommich the Argo Steering Team. Argo, the challenge of continuing 10 years of progress[ J]. Oceanography,2009, 22 ( 3 ) : 46-55.
4Gregg W W. Assimilation of SeaWiFS ocean chlorophyll data into a three-dimensional global ocean model [ J ]. Journal of Marine Systems,2008,69(3/4) : 205-225.
5Zibordi G, Melin F, Berthon J F. Comparison of SeaWiFS, MODIS and MERIS radiometric products at a coastal site[ J]. Geophysical Research Letters ,2006,33 (6) :231-246.
6Westberry T, Behrenfeld M J, Siegel D A, et al. Carbon-based primary productivity modeling with vertically resolved photoacclimation[ J]. Global Biogeochemical Cycles,2008,22(2) :456-512.
7Moline M A, Schofield O. Remote real-time video-enabled docking for underwater autonomous platforms [ J ]. Journal of Atmospheric and Oceanic Technology,2009, 26 (12) : 2 665-2 672.
8Peterson T C, Baringer M O, Thorne P W, et al. State of the climate in 2008 [ J]. Bulletin of the American Meteorological Society, 2009, 90 ( 8 ) : 349-367.
9Jannasch H W, Coletti L J, Johnson K S, et al. The Land/Ocean Biogeochemical Observatory: A robust networked mooring system for continuously monitoring complex biogeochemical cycles in estuaries[ J ]. Limnology and Oceanography-Methods,2008,6 ( 1 ) : 263-276.
10Niemann H, Fischer D, Graffe D, et al. Biogeochemistry of a lowactivity cold seep in the Larsen B area, western Weddell Sea, Antarctica[ J]. Biogeosciences, 2009,6 ( 11 ) : 2 383-2 395.

共引文献120

1赵健,宋东鉴,朱冰,刘斌,陈志成,张培兴.基于自学习和监督学习混合驱动的智能汽车跟驰控制策略[J].中国公路学报,2022,35(3):55-65. 被引量：4
2陈述,田亚,袁越.风力作用下的大坝浇筑空间冲突频率研究[J].水力发电学报,2020(5):27-35. 被引量：9
3吴园涛,任小波,段晓男,文质彬,董丹宏,殷建平,沙忠利,赵宏宇,蒋磊,江丽霞,沈刚.构建自立自强的海洋科学观测探测技术体系的思考[J].中国科学院院刊,2022,37(7):861-869. 被引量：6
4张旭华.从“海上福州”到海洋强国——中国海洋强国战略的实践探索与理论升华[J].福建论坛（人文社会科学版）,2020(10):23-32. 被引量：6
5丛丕福,曲丽梅,韩庚辰,杨新梅,王臣立.辽东湾海水透明度的遥感估算模型[J].地球科学进展,2011,26(3):295-299. 被引量：11
6张建涛,韩家新.海上观测平台数据传输标准化技术研究[J].海洋技术,2011,30(2):41-45. 被引量：4
7张友权.福建海洋观测示范网建设与应用[J].海洋技术,2012,31(1):111-114. 被引量：5
8乔志香,赵明静,王立鹏,黄娟,郭敬天,王庚.海域使用论证中现状资料归档和信息化管理的建议[J].海洋开发与管理,2012,29(5):11-13.
9李健,陈荣裕,王盛安,毛华斌,何云开,隋丹丹,谢强,施平,杨跃忠,王东晓.国际海洋观测技术发展趋势与中国深海台站建设实践[J].热带海洋学报,2012,31(2):123-133. 被引量：28
10汪品先.从海洋内部研究海洋[J].地球科学进展,2013,28(5):517-520. 被引量：27

同被引文献37

1鲍庆勇,李舜酩,沈峘,门秀花.自主移动机器人局部路径规划综述[J].传感器与微系统,2009,28(9):1-4. 被引量：54
2史晓茹,侯媛彬,张涛.不完全信息博弈的机器人对抗决策[J].智能系统学报,2011,6(2):147-151. 被引量：7
3杨月全,韩飞,曹志强,谭民,金露.基于激光传感器的动态拟合避障控制与仿真[J].系统仿真学报,2013,25(4):704-708. 被引量：5
4杨忠振,郭利泉,董夏丹.不同市场环境下的班轮航线配船与航速优化[J].中国航海,2015,38(4):110-115. 被引量：5
5税斌.基于ORCA碰撞避免的人群疏散模拟[J].现代计算机（中旬刊）,2016,0(1):73-75. 被引量：3
6范云生,赵永生,石林龙,张月.基于电子海图栅格化的无人水面艇全局路径规划[J].中国航海,2017,40(1):47-52. 被引量：36
7徐里,丁炜,施进,张海林,胡小兵.带动态障碍区的自由区域路径实时优化问题的混合算法[J].公路交通科技,2017,34(11):116-125. 被引量：2
8马冉祺,黄连忠,魏茂苏,柳霆,刘伊凡,王寰宇.基于实船监测数据的定航线船舶智能航速优化[J].大连海事大学学报,2018,44(1):31-35. 被引量：17
9杜哲,文元桥,黄亮,周春辉,肖长诗.基于动态复杂度地图的船舶航迹规划[J].系统仿真学报,2018,30(6):2390-2397. 被引量：2
10杜胜,刘轶华,陈茜,闫化然.基于遗传算法的开敞水域帆船航线规划[J].上海海事大学学报,2018,39(2):1-6. 被引量：4

引证文献3

1李朝阳.基于遗传算法的航海路径规划优化研究[J].中国水运（下半月）,2023,23(8):41-43. 被引量：1
2张柏鑫,杨毅镔,朱华中,刘安东,倪洪杰.基于深度强化学习的移动机器人动态路径规划算法[J].计算机测量与控制,2023,31(1):153-159. 被引量：5
3鲁宇琦,魏长赟.海上布防任务中无人艇对可疑目标的驱逐方法研究[J].无人系统技术,2023,6(4):51-60. 被引量：1

二级引证文献7

1徐兴辉,唐大林,顾书豪,左家祺,王晓东,任同群.基于多智能体强化学习的微装配任务规划方法[J].计算机测量与控制,2023,31(8):217-223.
2夏文忠.基于遗传算法的计算机信息管理数据库系统[J].信息与电脑,2023,35(18):43-45. 被引量：1
3余娜,晁阳,孙小春,卿笛.基于农业搬运机器人的障碍物视觉识别技术研究[J].南方农机,2024,55(2):145-146.
4苏金涛.土耳其武装无人艇发展[J].无人系统技术,2024,7(3):83-92.
5姜佩贺,王敬,桑忠启,林立峰.改进A^(*)与DWA的室内服务机器人路径规划研究[J].计算机工程与应用,2024,60(15):327-335.
6骞虎.基于FA-DWA融合算法的人体运动机器人移动路径优化研究[J].自动化与仪器仪表,2024(8):219-222.
7耿飚,宋丽华,吴爱燕.一种改进的A*路径规划算法研究及其Qt实现[J].人工智能与机器人研究,2023,12(2):115-125.

1孙苗,王子珂,童心,符昱,王漪,康林冲,姜晓轶.典型海洋环境观测数据产品应用现状及对我国的启示[J].大数据,2022,8(1):73-83. 被引量：3
2方泗喃,高萍萍,肜郝捷,周心怡,鲁海燕.基于改进天牛须搜索算法的路径规划方法[J].信息技术与信息化,2021(11):23-28. 被引量：4
3何志强,王文浩,郭冉.基于GNSS的综合观测浮标系统初步设计[J].声学与电子工程,2021(3):22-26. 被引量：2
4唐庆辉,范开国,徐东洋.海洋无人观测装备发展与应用思考[J].数字海洋与水下攻防,2021,4(5):401-404. 被引量：3
5童傅娇,徐进,张守京.考虑工位优先级的智能车间双向物料配送路径规划[J].机电工程,2021,38(11):1465-1471. 被引量：5
6黄文青,陈凌珊,李婷婷,尚大伟.基于改进RRT算法的移动机器人路径规划[J].智能计算机与应用,2021,11(7):32-35. 被引量：1
7《海洋技术学报》编辑部.《海洋技术学报》投稿须知[J].海洋技术学报,2021,40(5):124-125.
8冯传奇,吴庆跃,周伶敏.双循环下消费金融业态格局:特点、问题和求解路径[J].银行家,2021(10):22-24.
9陈国青,任明,卫强,郭迅华,易成.数智赋能:信息系统研究的新跃迁[J].管理世界,2022,38(1):180-195. 被引量：125

智能系统学报

2022年第1期

浏览历史

内容加载中请稍等...

基于强化学习的海洋移动观测网络观测路径规划方法被引量：3

参考文献7

二级参考文献57

共引文献120

同被引文献37

引证文献3

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于强化学习的海洋移动观测网络观测路径规划方法 被引量：3

参考文献7

二级参考文献57

共引文献120

同被引文献37

引证文献3

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

基于强化学习的海洋移动观测网络观测路径规划方法被引量：3