-
题名基于深度强化学习的无人艇集群博弈对抗
被引量:2
- 1
-
-
作者
苏震
张钊
陈聪
刘殿勇
梁霄
-
机构
珠海云洲智能科技股份有限公司工业发展部
大连海事大学船舶与海洋工程学院
-
出处
《兵器装备工程学报》
CAS
CSCD
北大核心
2022年第9期9-14,共6页
-
基金
国家自然科学基金项目(52271302)。
-
文摘
开展基于深度强化学习的无人艇集群动态博弈对抗中的协同围捕决策研究。建立受距离和相对角度影响的无人艇围捕环境模型,利用基于策略网络和双评价网络的深度强化学习方法求解围捕策略,立足协同围捕任务,基于距离和相对角度设计引导型奖励函数,避免奖励稀疏。仿真结果表明,基于深度强化学习的红方无人艇集群能够对蓝方无人艇进行有效的协同围捕。研究成果可为无人艇集群博弈对抗演练提供参考。
-
关键词
无人艇集群
博弈对抗
深度强化学习
协同围捕
-
Keywords
USV swarm
game confrontation
deep reinforcement learning
coordinated hunting
-
分类号
TP24
[自动化与计算机技术—检测技术与自动化装置]
-
-
题名基于路径参数一致的水下机器人编队与避障控制
- 2
-
-
作者
苏震
刘殿勇
孙达智
梁霄
-
机构
珠海云洲智能科技股份有限公司工业发展部
大连海事大学船舶与海洋工程学院
-
出处
《智能科学与技术学报》
2022年第4期533-541,共9页
-
基金
国家自然科学基金资助项目(No.52271302)。
-
文摘
面向大范围、自主化的水下协同作业任务,研究了基于路径参数一致的水下机器人编队与避障控制问题。首先,构建基于虚拟结构的机器人编队误差模型,将路径引导下的编队控制解耦为路径跟踪控制与路径参数同步。其次,考虑机器人与虚拟参考点之间的路径跟踪控制,设计基于位置和速度误差反馈的个体跟踪控制律;考虑状态信息非全局已知的路径参数同步,设计基于路径参数一致的编队控制律;进一步考虑障碍物约束,利用人工势函数设计基于速度修正的避障控制律,实现机器人编队与避障控制。仿真结果表明,编队系统能够以期望队形跟踪给定参数化路径,且能够对障碍物进行有效规避。
-
关键词
水下机器人
编队控制
避障控制
虚拟结构
路径参数一致
-
Keywords
autonomous underwater vehicle
formation control
obstacle avoidance control
virtual structure
path parameter consensus
-
分类号
TP24
[自动化与计算机技术—检测技术与自动化装置]
-