基于深度强化学习的无人艇轨迹跟踪算法研究被引量：5

Study on trajectory tracking algorithm of unmanned surface vehicle based on deep reinforcement learning

导出

摘要针对欠驱动水面无人艇(USV)轨迹跟踪控制问题,提出一种基于近端策略优化(PPO)的深度强化学习轨迹跟踪控制算法.为引导控制器网络的正确收敛,构建基于长短时记忆(LSTM)网络层的深度强化学习控制器,设计了相应的状态空间和收益函数.为增强控制器的鲁棒性,生成轨迹任务数据集来模拟复杂的任务环境,以此作为深度强化学习控制器的训练样本输入.仿真结果表明:所提出的算法能有效收敛,具备扰动环境下的精确跟踪控制能力,有较大的实际应用潜力. Aiming at the problem of underactuated unmanned surface vehicle(USV)trajectory tracking control,a deep reinforcement learning(DRL)trajectory tracking control algorithm based on proximal policy optimization(PPO)was proposed.To guide the correct convergence of the controller network,a DRL controller based on long-short-term memory(LSTM)network layer was constructed,and the corresponding state space and reward function were designed.To enhance the robustness of the controller,trajectory task datasets were generated to simulate complex task environments,which were used as training samples input for the DRL controller.Simulation results show that the proposed algorithm converges effectively,and can achieve accurate tracking control in disturbed environments,which has favorable potential for practical application.

作者夏家伟朱旭芳罗亚松吴兆东 XIA Jiawei;ZHU Xufang;LUO Yasong;WU Zhaodong(School of Weaponry Engineering,Naval University of Engineering,Wuhan 430033,China;School of Electronic Engineering,Naval University of Engineering,Wuhan 430033,China)

机构地区海军工程大学兵器工程学院海军工程大学电子工程学院

出处《华中科技大学学报（自然科学版）》 EI CAS CSCD 北大核心 2023年第5期74-80,共7页 Journal of Huazhong University of Science and Technology(Natural Science Edition)

基金湖北省自然科学基金资助项目(2018CFC865) 中国博士后基金资助项目(2016T45686) 全军军事类研究资助项目(YJ2020B117).

关键词水面无人艇(USV) 轨迹跟踪深度强化学习(DRL) 近端策略优化(PPO) 轨迹任务数据集 unmanned surface vehicle(USV) trajectory tracking deep reinforcement learning(DRL) proximal policy optimization(PPO) trajectory task data set

分类号 TP24 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献9

1王石,张建强,杨舒卉,张博伦.国内外无人艇发展现状及典型作战应用研究[J].火力与指挥控制,2019,44(2):11-15. 被引量：50
2陈霄,刘忠,董蛟,张建强.欠驱动无人艇路径跟踪控制算法[J].海军工程大学学报,2018,30(3):107-112. 被引量：10
3张昕.欠驱动水面无人艇轨迹跟踪的反步滑模控制[J].数字技术与应用,2020,38(1):170-173. 被引量：9
4代珊珊,刘全.基于动作约束深度强化学习的安全自动驾驶方法[J].计算机科学,2021,48(9):235-243. 被引量：15
5王珂,卜祥津,李瑞峰,赵立军.景深约束下的深度强化学习机器人路径规划[J].华中科技大学学报（自然科学版）,2018,46(12):77-82. 被引量：19
6李宝安.基于深度强化学习的无人艇控制研究[J].中国造船,2020,61(S01):14-20. 被引量：3
7张法帅,李宝安,阮子涛.基于深度强化学习的无人艇航行控制[J].计测技术,2018,38(A01):207-211. 被引量：3
8祝亢,黄珍,王绪明.基于深度强化学习的智能船舶航迹跟踪控制[J].中国舰船研究,2021,16(1):105-113. 被引量：24
9任彧,赵师涛.磁导航AGV深度强化学习路径跟踪控制方法[J].杭州电子科技大学学报（自然科学版）,2019,39(2):28-34. 被引量：8

二级参考文献34

1王蕾,宋文忠.PID控制[J].自动化仪表,2004,25(4):1-6. 被引量：82
2俞建成,李强,张艾群,王晓辉.水下机器人的神经网络自适应控制[J].控制理论与应用,2008,25(1):9-13. 被引量：43
3刘杨,郭晨,沈智鹏,刘雨,郭迪.欠驱动船舶路径跟踪的神经网络稳定自适应控制[J].控制理论与应用,2010,27(2):169-174. 被引量：30
4严汝建,庞硕,孙寒冰,庞永杰.Development and Missions of Unmanned Surface Vehicle[J].Journal of Marine Science and Application,2010,9(4):451-457. 被引量：73
5李家良.水面无人艇发展与应用[J].火力与指挥控制,2012,37(6):203-207. 被引量：123
6欧青立,何克忠.室外智能移动机器人的发展及其关键技术研究[J].机器人,2000,22(6):519-526. 被引量：55
7宋磊.国外海军无人水面艇发展及关键技术[J].军事史林,2014(9):58-60. 被引量：8
8张国庆,张显库,关巍.欠驱动船舶简捷鲁棒自适应路径跟踪控制[J].哈尔滨工程大学学报,2014,35(9):1053-1059. 被引量：18
9闫超,张志雄,罗自荣,李坡.美国海军无人系统作战特点及关键技术分析[J].国防科技,2014,35(5):41-45. 被引量：20
10万接喜.外军无人水面艇发展现状与趋势[J].国防科技,2014,35(5):91-96. 被引量：38

共引文献127

1韩志豪,汪益兵,张宇,郝永志.基于深度强化学习的船舶航线自动规划[J].中国航海,2021,44(1):100-105. 被引量：9
2高子航.基于5G通信的四足机器人控制系统设计[J].电子技术（上海）,2021,50(5):140-141. 被引量：3
3姜明宇,张翠平,金子潇.自动驾驶环境下的网络安全预警系统设计[J].智能计算机与应用,2022,12(5):129-131. 被引量：2
4夏天冰,查伊倩,赵丽莉,李明原,王鸿东.无人船在港口安全保障中的应用研究[J].船舶工程,2023,45(7).
5冉龄玉.深度学习在实时配送路径优化中的应用研究[J].广西质量监督导报,2020(8):174-175.
6朱骋,庄佳园,张磊,许建辉,苏玉民.无人水面艇自适应路径跟踪算法[J].导航与控制,2019,18(1):44-50. 被引量：5
7董蛟,刘忠,张建强,陈霄,周德超.基于干扰观测的欠驱动无人艇自适应航迹跟踪控制算法[J].系统工程与电子技术,2019,41(7):1606-1616. 被引量：1
8庞燕,罗华丽,邢立宁,任腾.车辆路径优化问题及求解方法研究综述[J].控制理论与应用,2019,36(10):1573-1584. 被引量：62
9王青青,梁家海.基于RFID阵列的无轨AGV系统的研究与设计[J].广西科学,2019,26(4):391-397. 被引量：2
10马向峰,韩玮,谢杨柳.水面无人艇任务规划系统分析[J].舰船科学技术,2019,41(23):54-57. 被引量：4

同被引文献68

1谢进,王飞.煤矿智能掘进机器人关键技术探讨[J].工矿自动化,2021,47(S02):39-42. 被引量：5
2张捍东,郑睿,岑豫皖.移动机器人路径规划技术的现状与展望[J].系统仿真学报,2005,17(2):439-443. 被引量：120
3陈莹,韩崇昭.基于平方根Unscented卡尔曼滤波的车辆融合跟踪[J].西安交通大学学报,2005,39(6):594-597. 被引量：4
4赵熙俊,陈慧岩.智能车辆路径跟踪横向控制方法的研究[J].汽车工程,2011,33(5):382-387. 被引量：109
5吕文杰,马戎,李岁劳,付维平.基于纯追踪模型的路径跟踪改进算法[J].测控技术,2011,30(7):93-96. 被引量：22
6杨鑫,王天明,许端清.基于GPU的层次包围盒快速构造方法[J].浙江大学学报（工学版）,2012,46(1):84-89. 被引量：10
7裴九芳,王海,许德章.基于迭代学习控制的移动机器人轨迹跟踪控制[J].计算机工程与应用,2012,48(9):222-225. 被引量：14
8卜旭辉,侯忠生,余发山,付子义.基于迭代学习的农业车辆路径跟踪控制[J].自动化学报,2014,40(2):368-372. 被引量：21
9张国飚,张华,刘满禄,余慧.基于空间剖分的碰撞检测算法研究[J].计算机工程与应用,2014,50(7):46-49. 被引量：14
10赵少林,程杰.基于粒子群并行优化的煤矿井下机器人路径规划[J].计算机测量与控制,2014,22(5):1600-1602. 被引量：5

引证文献5

1李松.智能汽车轨迹跟踪控制算法研究综述[J].汽车文摘,2023(9):19-27. 被引量：1
2陈宏宇,谭飞,董早鹏.基于虚拟艇引导的无人艇轨迹跟踪模型预测控制[J].大连海事大学学报,2023,49(4):46-56.
3张旭辉,郑西利,杨文娟,李语阳,麻兵,董征,陈鑫.煤矿井下掘进机器人路径规划方法研究[J].煤田地质与勘探,2024,52(4):152-163. 被引量：1
4赖嘉雄,林忠华,陈晓昆,李先强,李海舰,范健宇.面向海水水质检测的无人船艏向角轨迹跟踪控制策略[J].广州航海学院学报,2024,32(2):26-32.
5曲星儒,江雨泽,李初,龙飞飞,张汝波.基于改进TD3的欠驱动无人水面艇路径跟踪控制[J].上海海事大学学报,2024,45(3):1-9.

二级引证文献2

1孔凡伟,冯帆.关于巷道锚杆支护的煤矿井下掘进装备工艺研究[J].现代制造技术与装备,2024,60(5):97-99. 被引量：1
2李旭阳,许鸣珠,韩刚,陈旭升.智能汽车自适应工况路径跟踪控制[J].中国测试,2024,50(9):37-45.

1王欢.基于一致性和自抗扰的多智能体编队控制方法[J].软件,2023,44(4):88-93.
2杨天翔,程志江,杨涵棣,田峰.基于自抗扰控制的风电并网变流器锁相环设计[J].太阳能学报,2023,44(4):147-155. 被引量：5
3刘贝妮,魏巍.组织正念:数字变局中保持组织可靠性的关键[J].清华管理评论,2023(4):34-40.
4邢永民,朱盈玫.涵养西藏公学初心坚守内地办学使命——略论西藏公学的红色文化基因[J].西藏民族大学学报（哲学社会科学版）,2023,44(1):45-53.
5刘晓超,曹占光.基于CAXA制造工程师的可乐瓶底数控加工研究[J].南方农机,2023,54(13):160-162.
6文旋豪,曹华军,李洪丞,葛威威,黄子轩.离散制造单元生产扰动识别模型及其自适应节能控制方法[J].机械工程学报,2023,59(7):252-264. 被引量：1

华中科技大学学报（自然科学版）

2023年第5期

浏览历史

内容加载中请稍等...

基于深度强化学习的无人艇轨迹跟踪算法研究被引量：5

参考文献9

二级参考文献34

共引文献127

同被引文献68

引证文献5

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于深度强化学习的无人艇轨迹跟踪算法研究 被引量：5

参考文献9

二级参考文献34

共引文献127

同被引文献68

引证文献5

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于深度强化学习的无人艇轨迹跟踪算法研究被引量：5