基于深度Q网络的水面无人艇路径规划算法被引量：5

Path planning algorithm for unmanned surface vessels based on deep Q network

下载PDF

导出

摘要为实现水面无人艇(unmanned surface vessel,USV)在未知环境下的自主避障航行,提出一种基于深度Q网络的USV避障路径规划算法。该算法将深度学习应用到Q学习算法中,利用深度神经网络估计Q函数,有效解决传统Q学习算法在复杂水域环境的路径规划中容易产生维数灾难的问题。通过训练模型可有效地建立感知(输入)与决策(输出)之间的映射关系。依据此映射关系,USV在每个决策周期选择Q值最大的动作执行,从而能够成功避开障碍物并规划出最优路线。仿真结果表明,在迭代训练8000次时,平均损失函数能够较好地收敛,这证明USV有效学习到了如何避开障碍物并规划出最优路线。该方法是一种不依赖模型的端到端路径规划算法。 In order to realize the autonomous obstacle avoidance navigation of unmanned surface vessels(USVs)in unknown environment,a USV obstacle avoidance path planning algorithm based on the deep Q network is proposed.In this algorithm,the deep learning is applied to the Q-learning algorithm,and the Q function is estimated by the deep neural network,which effectively solves the problem of dimension disasters in the path planning of complex waters environment caused by the traditional Q-learning algorithm.The mapping relationship between the perception(input)and the decision(output)can be established effectively by the trained model.According to the mapping relationship,a USV chooses the action with the largest Q value in each decision cycle,so that it can successfully avoid obstacles and plan the optimal route.The simulation results show that,the average loss function can converge well through the iteration training of 8000 times,which proves that the USV has learned how to avoid obstacles and plan the optimal route effectively.This method is an end-to-end path planning algorithm which does not depend on models.

作者随博文黄志坚姜宝祥郑欢温家一 SUI Bowen;HUANG Zhijian;JIANG Baoxiang;ZHENG Huan;WEN Jiayi(Merchant Marine College, Shanghai Maritime University, Shanghai 201306, China)

机构地区上海海事大学商船学院

出处《上海海事大学学报》北大核心 2020年第3期1-5,116,共6页 Journal of Shanghai Maritime University

基金国家自然科学基金(61403250)。

关键词水面无人艇(USV) 自主避障路径规划深度Q网络卷积神经网络强化学习 unmanned surface vessel(USV) autonomous obstacle avoidance path planning deep Q network convolutional neural network reinforcement learning

分类号 U675.73 [交通运输工程—船舶及航道工程]

引文网络
相关文献

参考文献8

1陈超,耿沛文,张新慈.基于改进人工势场法的水面无人艇路径规划研究[J].船舶工程,2015,37(9):72-75. 被引量：24
2邱育红.GIS空间分析中两种改进的路径规划算法[J].计算机系统应用,2007,16(7):33-35. 被引量：6
3李金娜,尹子轩.基于非策略Q-学习的网络控制系统最优跟踪控制[J].控制与决策,2019,34(11):2343-2349. 被引量：3
4刘志荣,姜树海.基于强化学习的移动机器人路径规划研究综述[J].制造业自动化,2019,41(3):90-92. 被引量：16
5刘成勇,万伟强,陈蜀喆,甘浪雄.基于灰色马尔科夫模型的船舶交通流预测[J].中国航海,2018,41(3):95-100. 被引量：13
6卫玉梁,靳伍银.基于神经网络Q-learning算法的智能车路径规划[J].火力与指挥控制,2019,44(2):46-49. 被引量：18
7林景栋,吴欣怡,柴毅,尹宏鹏.卷积神经网络结构优化综述[J].自动化学报,2020,46(1):24-37. 被引量：134
8王程博,张新宇,邹志强,王少博.基于Q-Learning的无人驾驶船舶路径规划[J].船海工程,2018,47(5):168-171. 被引量：23

二级参考文献40

1黄炳强,曹广益,王占全.强化学习原理、算法及应用[J].河北工业大学学报,2006,35(6):34-38. 被引量：19
2邱育红.GIS空间分析中两种改进的路径规划算法[J].计算机系统应用,2007,16(7):33-35. 被引量：6
3龚洁辉白玲高健美.最短路径算法的改进及其实现[J].解放军测绘学院学报,1998,15(2):23-23.
4郭仁忠、空间分析[M],武汉:武汉测绘科技大学出版社,1996.
5徐立华.求解最短路径问题的一种计算机算法.系统工程,1993,33(4):62-67.
6Lee J.Calculation of the shortest path sbyoptimal decomposition.IEEE Trans Syst Man Cybern,1982 (3):410.
7Fengyun Cao, Jaswinder Pal Singh. Efficient Event Routing in Con-tent-based Publish-subscribe Service networks [C]//Proceedings of IEEE INFOCOM, Hong kong, 2004: 929-940.
8Gilbert E, G Johnson D. W. Distance Functions and Their Application to Robot Path Planning in the Rrescncc of Obstacles [J]. IEEE J Robotics amt Automation, 1985, RA-I(1): 21-30.
9Zhang b, Zhang L, Zhang J. An Algorithm for Find Path with Rotation. [C]//Proc. IEEE International Conference Robotics and Automation, 1988:917-921.
10Xiong Y L, Ding H. General Criterion and Control Strategy of Collision-free Movement for Manipulators[J]. International Journal of Robotics and Automation, 1989, 4(2): 75-40.

共引文献223

1黄富程,刘德新,曹杰,安天圣.基于ABC优化BP神经网络的船舶交通流量预测[J].中国航海,2021,44(2):78-83. 被引量：6
2阳雨妍,宋爱国,沈书馨,李会军.基于CNN-GRU的遥操作机器人操作者识别与自适应速度控制方法[J].仪器仪表学报,2021,42(3):123-131. 被引量：17
3徐雪松,曾智,邵红燕,杨胜杰,李想.基于个体-协同触发强化学习的多机器人行为决策方法[J].仪器仪表学报,2020(5):66-75. 被引量：10
4何龙健,钟子乐,邹大辉,黄灿斌,邓卓然,梁艳.面向医疗整容的三维人脸重建与编辑系统[J].计算机系统应用,2022,31(12):69-77.
5李小艳,宋亚林,乐飞.残差密集块的卷积神经网络图像去噪[J].计算机系统应用,2022,31(10):166-174. 被引量：2
6谢懿.基于大数据的船舶航行最优路径规划算法研究[J].舰船科学技术,2019,41(20):22-24. 被引量：5
7张余冉,段喜萍,李昀松,刘庭圆.基于ResNet-ACmix融合特征的ECO目标跟踪算法改进[J].哈尔滨师范大学自然科学学报,2023,39(1):75-82.
8王彦朋,郭佳佳,王晓君.基于Q-Learning的青霉素发酵过程控制方法[J].信息化研究,2023,49(3):31-35.
9漆阳华,杨战平,黄清华.A*的改进路径规划算法[J].信息与电子工程,2009,7(4):326-329. 被引量：17
10贾振华,斯庆巴拉,王慧娟.基于启发式机器人路径规划仿真研究[J].计算机仿真,2012,29(1):135-137. 被引量：8

同被引文献46

1褚善东.船舶在大风浪中航行产生的失速问题探讨[J].浙江国际海运职业技术学院学报,2008(2):1-3. 被引量：2
2刘全,翟建伟,章宗长,钟珊,周倩,章鹏,徐进.深度强化学习综述[J].计算机学报,2018,41(1):1-27. 被引量：468
3王程博,张新宇,邹志强,王少博.基于Q-Learning的无人驾驶船舶路径规划[J].船海工程,2018,47(5):168-171. 被引量：23
4湛佳,谢文俊,郭庆,毛声.不确定条件下多无人机侦察调度问题[J].火力与指挥控制,2018,43(10):25-30. 被引量：4
5梅斌,孙立成,史国友,马麟,李伟峰.一种高纬度区域船舶偏航距离的高精度求解算法[J].上海海事大学学报,2018,39(4):75-81. 被引量：2
6孙盛智,孟春宁,侯妍.无人机与巡航导弹自主协同作战模式及关键技术[J].航空兵器,2019,26(4):10-15. 被引量：17
7于赫年,白桦,李超.仓储式多AGV系统的路径规划研究及仿真[J].计算机工程与应用,2020,56(2):233-241. 被引量：37
8郭双全,董昱.基于雷达的列车直轨运行前方障碍物检测方法研究[J].铁道科学与工程学报,2020,17(1):224-231. 被引量：7
9张伟,廖煜雷,姜峰,赵铁军.无人水面艇技术发展回顾与趋势分析[J].无人系统技术,2019,2(6):1-9. 被引量：11
10王成才,商志刚,何宇帆,陈嘉真,井方才,王冬海.无人船信息融合与避障关键技术综述[J].中国电子科学研究院学报,2019,14(12):1228-1232. 被引量：7

引证文献5

1吴恭兴,王凌超,郑剑,汪超.考虑复杂气象变化的智能船舶动态航线规划方法[J].上海海事大学学报,2021,42(1):1-6. 被引量：10
2许志远.基于改进神经网络的船舶航行路径规划[J].舰船科学技术,2022,44(14):57-60. 被引量：3
3孙盛智,盛碧琦,刘玉,郑卫娟.舰载无人艇作战运用模式及关键技术[J].舰船科学技术,2023,45(9):89-93. 被引量：4
4安燕霞,郑晓霞.改进边缘梯度的机器人标定路径导航优化仿真[J].计算机仿真,2023,40(5):434-437. 被引量：1
5周治国,邸顺帆.基于Citespace的水面无人艇路径规划与避障算法研究[J].舰船科学技术,2023,45(16):59-63.

二级引证文献18

1韩泽旭.智能船舶的发展现状及趋势[J].船舶物资与市场,2021(5):3-4. 被引量：4
2王立鹏,张智,马山,王学武.考虑船舶操纵性约束的改进遗传算法航线规划[J].哈尔滨工程大学学报,2021,42(7):1056-1062. 被引量：11
3信晓艺.人工智能算法在船舶航线规划数学建模及求解中的应用[J].黑龙江工业学院学报（综合版）,2021,21(10):72-75.
4李颖,刘志晨,蔡小华.一种ENC数据在空间信息平台下的转换方法[J].测绘地理信息,2022,47(1):65-68.
5李成海,赵卫健,胡甚平.基于高斯模型的船舶航行避险航线设计研究[J].江苏航运职业技术学院学报,2022,21(1):41-47.
6张大恒,张英俊,张闯.基于BP神经网络的船舶气象航线决策系统[J].中国舰船研究,2022,17(4):98-106. 被引量：2
7崔金龙,李元奎,索基源,杨雪锋.基于改进A^(*)算算法的船舶航向航速协同优化方法[J].大连海事大学学报,2022,48(4):29-37. 被引量：6
8李成海,赵卫健,胡甚平.恶劣天气下小型船舶航行计划决策研究[J].青岛远洋船员职业学院学报,2023,44(1):1-4.
9黄国良,周毅,郑坤,李萌,蒙学昊.基于改进蚁群算法的全局船舶路径规划方法[J].船海工程,2023,52(2):97-101. 被引量：4
10郭东东,尹勇,肖方兵.智能船舶航线优化方法综述[J].中国舰船研究,2023,18(4):151-161. 被引量：2

1陈星达,陈英明,马小燕,吕志香.基于视觉检测和ABB机器人的牙刷分拣系统设计[J].扬州工业职业技术学院论丛,2020(1):36-41.
2何代毅,施文灶,林志斌,乔星星,刘芫汐,林耀辉.基于改进Mask-RCNN的遥感影像建筑物提取[J].计算机系统应用,2020,29(9):156-163. 被引量：13
3周贤良,辛绍杰,董帅帅.重版ROV推进器控制系统设计[J].自动化技术与应用,2020,39(9):6-10. 被引量：1
4郭欣,施芸,于振军.大型锻件缺陷磨削工业机器人的运动轨迹自动规划算法研究[J].机电信息,2020(26):35-36.
5姚建盛,刘艳玲,于海涛.景区游客突发安全事故疏散路径规划仿真[J].福建电脑,2020,36(9):50-52.
6姚建华,胡晟,王冠,沈云,姜林林,冯宇立,龚成亚,张照轩,柳伟.基于强化学习的孤岛微电网多源协调频率控制方法[J].电力建设,2020,41(9):69-75. 被引量：11
7袁蒙恩,陈立家,冯子凯.基于单目视觉的多种群粒子群机械臂路径规划算法[J].计算机应用,2020,40(10):2863-2871. 被引量：14
8Farbod KHOSHNOUD,Marco B.QUADRELLI,Ibrahim I.ESAT,Dario ROBINSON.Quantum Cooperative Robotics and Autonomy[J].Instrumentation,2019,6(3):93-111. 被引量：1

上海海事大学学报

2020年第3期

浏览历史

内容加载中请稍等...

基于深度Q网络的水面无人艇路径规划算法被引量：5

参考文献8

二级参考文献40

共引文献223

同被引文献46

引证文献5

二级引证文献18

相关作者

相关机构

相关主题

浏览历史

基于深度Q网络的水面无人艇路径规划算法 被引量：5

参考文献8

二级参考文献40

共引文献223

同被引文献46

引证文献5

二级引证文献18

相关作者

相关机构

相关主题

浏览历史

基于深度Q网络的水面无人艇路径规划算法被引量：5