小型无人有缆遥控水下机器人智能控制方法

Intelligent Control Method of Small Unmanned Cabled Remote-controled Underwater Robot

下载PDF

导出

摘要针对深度确定性策略梯度(DDPG)算法应用于无人有缆遥控水下机器人(ROV)运动控制时存在的坏样本影响学习稳定性、缺少环境探索能力以及学习时间长难收敛等问题,从神经网络结构、噪声引入和融合监督学习3个方面对DDPG算法进行改进,并提出了基于混合神经网络结构和参数噪声的监督式DDPG算法。仿真结果表明,监督式DDPG算法比常规DDPG算法和传统比例-积分-微分(PID)算法更加有效。 When the depth deterministic strategy gradient(DDPG)algorithm is applied to the motion control of unmanned cabled remote-controled underwater robot,several new problems such as the bad samples affect the learning stability,lack the ability to explore the environment are happened,and the learning time is difficult to cover the teaching of the algorithm.Hence,the DDPG algorithm is improved from three aspects:neural network structure,noise introduction and fusion supervised learning,and a supervised DDPG control algorithm based on hybrid neural network structure and parameter noise is proposed.The simulation results show that the improved DDPG algorithm is more effective than the conventional DDPG algorithm and the traditional PID algorithm.

作者黄兆军曾明如 HUANG Zhaojun;ZENG Mingru(School of Mechanical and Electrical Engineering,Zhuhai City Polytechnic,Zhuhai 519090,Guangdong,China;School of Information Engineering,Nanchang University,Nanchang 330031,China)

机构地区珠海城市职业技术学院机电工程学院南昌大学信息工程学院

出处《实验室研究与探索》 CAS 北大核心 2024年第7期34-38,53,共6页 Research and Exploration In Laboratory

基金 2023年广东省普通高校特色创新项目(2023KTSCX330)。

关键词深度确定性策略梯度算法混合神经网络参数噪声监督学习无人有缆遥控水下机器人运动控制 depth deterministic strategy gradient(DDPG)algorithm hybrid neural network parametric noise supervised learning unmanned cabled remote-controled underwater robot motion control

分类号 TP242.3 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献11

1杨辉,王禹,李中奇,付雅婷,谭畅.专家监督的SAC强化学习重载列车运行优化控制[J].控制理论与应用,2022,39(5):799-808. 被引量：3
2江铃燚,郑艺峰,陈澈,李国和,张文杰.有监督深度学习的优化方法研究综述[J].中国图象图形学报,2023,28(4):963-983. 被引量：7
3王鹃,张冲,龚家新,李俊娥.基于机器学习的模糊测试研究综述[J].信息网络安全,2023(8):1-16. 被引量：2
4张云燕,魏瑶,刘昊,杨尧.基于深度强化学习的端到端无人机避障决策[J].西北工业大学学报,2022,40(5):1055-1064. 被引量：6
5杨青青,陈剑,彭艺.基于DDPG的无人机轨迹规划及功率控制算法[J].北京邮电大学学报,2023,46(3):43-48. 被引量：2
6陈恺丰,田博睿,李和清,赵晨阳,陆祖兴,李新德,邓勇.基于DDPG算法的双轮腿机器人运动控制研究[J].系统工程与电子技术,2023,45(4):1144-1151. 被引量：6
7张严心,孔涵,殷辰堃,王子豪,黄志清.一类基于概率优先经验回放机制的分布式多智能体软行动-评论者算法[J].北京工业大学学报,2023,49(4):459-466. 被引量：3
8蔡军,苟文耀,刘颜.基于actor-critic框架的在线积分强化学习算法研究[J].电子测量与仪器学报,2023,37(3):194-201. 被引量：3
9李凌霄,王伟明,贺佳飞,闻程.基于DDPG的自主水下机器人角度控制研究[J].计算机仿真,2023,40(4):422-426. 被引量：1
10马睿宸,白雪剑,王宇,王睿,王硕.基于强化学习的波动鳍推进水下作业机器人悬停控制[J].控制理论与应用,2022,39(11):2092-2099. 被引量：1

二级参考文献32

1俞建成,李强,张艾群,王晓辉.水下机器人的神经网络自适应控制[J].控制理论与应用,2008,25(1):9-13. 被引量：43
2邹权臣,张涛,吴润浦,马金鑫,李美聪,陈晨,侯长玉.从自动化到智能化:软件漏洞挖掘技术进展[J].清华大学学报（自然科学版）,2018,58(12):1079-1094. 被引量：37
3张雄,李舟军.模糊测试技术研究综述[J].计算机科学,2016,43(5):1-8. 被引量：32
4赵旭宝,魏伟,张军,胡杨.缓冲器分段阻抗特性对重载列车纵向冲动的影响[J].铁道学报,2017,39(10):33-42. 被引量：14
5于浩洋,李普强.无缆自主式水下机器人航向的模糊控制[J].黑龙江工程学院学报,2017,31(5):33-36. 被引量：3
6刘全,翟建伟,章宗长,钟珊,周倩,章鹏,徐进.深度强化学习综述[J].计算机学报,2018,41(1):1-27. 被引量：456
7马琼雄,余润笙,石振宇,黄晁星,李腾龙.基于深度强化学习的水下机器人最优轨迹控制[J].华南师范大学学报（自然科学版）,2018,50(1):118-123. 被引量：9
8孙巧梅,陈金国,余万.基于模糊自适应滑模方法的AUV轨迹跟踪控制[J].舰船科学技术,2017,39(12):53-58. 被引量：11
9孙鸿宇,何远,王基策,董颖,朱立鹏,王鹤,张玉清.人工智能技术在安全漏洞领域的应用[J].通信学报,2018,39(8):1-17. 被引量：29
10马艳彤,郑荣,于闯.过渡目标值的非线性PID对自治水下机器人变深运动的稳定控制[J].控制理论与应用,2018,35(8):1120-1125. 被引量：12

共引文献32

1王昊,林远山,李然,于红,王芳.面向养殖网箱巡检任务的强化学习训练系统[J].计算机与数字工程,2023,51(1):103-111.
2崔立,宋玉,张进.基于自适应DDPG方法的复杂场景下AUV动动对接[J].船舶工程,2023,45(8):8-14.
3晋军伟,钱彬,虞力英,王军华,顾席光.基于小样本的境外驾驶证分类方法[J].中国公共安全,2023(4):53-59.
4穆杨.基于认知结构SOAR的机器人路径规划[J].海军航空工程学院学报,2019,34(3):297-302.
5侯超众,侯超群.基于改进RBF的工业机器人轨迹跟踪模型构建及仿真[J].赤峰学院学报（自然科学版）,2019,35(11):110-112.
6陈东军,吴家鸣.带缆水下机器人控制仿真模拟与水动力分析[J].船舶力学,2020,24(2):170-178. 被引量：11
7刘智心,初秀民,郑茂,张代勇.智能船舶船岸协同实验关键技术研究[J].交通信息与安全,2020,38(2):63-70. 被引量：8
8杨昊岩,栾涛,韩仲志,倪建功,高霁月.基于深度学习声谱图分类的“听声识风”[J].华南师范大学学报（自然科学版）,2021,53(5):10-16. 被引量：2
9李凌霄,王伟明,贺佳飞,闻程.基于DDPG的自主水下机器人角度控制研究[J].计算机仿真,2023,40(4):422-426. 被引量：1
10王正琳,付宇,宋澳举,王路茗.无人机物资运输与智能避障系统设计[J].自动化与仪表,2023,38(7):5-9.

1黄明泉,徐景平,栾振东,刘猛,李学成,刘彬.东方1-1海管悬跨分布特征及治理效果分析[J].海洋科学,2021,45(3):77-87. 被引量：4
2李阳康,王睿,王磊,张文彦,施晓松.电控空气半主动悬架控制策略分析[J].汽车实用技术,2023,48(15):134-138.
3张旭蕊,王菊,于晋龙,苏学敏,马闯.基于注入锁定激光器和光相位补偿的相干解调方案[J].激光与光电子学进展,2024,61(5):179-184.
4王贤明,杨超群,曹向辉,龚成龙,张恒.基于欺骗中继技术的无人机主动监听优化方法研究[J].无人系统技术,2024,7(3):67-74.
5丁雅楠,石绥祥,刘克修,张连新,但博,高志刚,宋帅,赵亚明.基于高分辨率再分析海流数据的三种涡旋识别方法在南海的评估[J].海洋通报,2024,43(3):301-311.
6左玲玲.基于CiteSpace的学习共同体研究[J].办公自动化,2024,29(13):36-39.
7白冰,董飞,彭文启,刘晓波.基于深度强化学习的水质模型参数率定[J].环境科学学报,2024,44(7):271-280.
8曹莉凌,刘威,代堃鹏,周国峰.采用转角补偿LQR的自动驾驶集卡路径跟踪控制[J].汽车安全与节能学报,2024,15(3):413-423.
9盛蕾,陈希亮,赖俊.基于潜在状态分布GPT的离线多智能体强化学习方法[J].计算机科学与探索,2024,18(8):2169-2179.
10颜志,禹怀龙,欧阳博,王耀南.一种基于近端策略优化的服务功能链部署算法[J].电子与信息学报,2024,46(7):2869-2878.

实验室研究与探索

2024年第7期

浏览历史

内容加载中请稍等...

小型无人有缆遥控水下机器人智能控制方法

参考文献11

二级参考文献32

共引文献32

相关作者

相关机构

相关主题

浏览历史