检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到2篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

基于DE-MADDPG多智能体强化学习机械臂装配: 1; 作者王晶苏工兵 +2 位作者袁梦曾文豪于楚飞《组合机床与自动化加工技术》北大核心 2023年第12期183-187,192,共6页; 为了提高机械臂在复杂装配任务中智能程度,提出了一种基于深度强化学习的多智能体装配策略。以六自由度机械臂Pieper准则构型为基础,将末端的位置和姿态分开独立控制,应用解耦多智能体深度确定性策略梯度算法(DE-MADDPG),依据其不同的... 展开更多; 关键词深度强化学习 de-maddpg 轴孔装配奖励函数; 下载PDF 职称材料

基于DE-MADDPG的多无人机协同追捕策略被引量：23: 2; 作者符小卫王辉徐哲《航空学报》 EI CAS CSCD 北大核心 2022年第5期522-535,共14页; 针对多无人机协同对抗快速目标的追逃博弈问题,研究了多无人机的协同追捕策略。基于解耦多智能体深度确定性策略梯度算法DE-MADDPG研究了多无人机协同对抗快速目标的追捕策略,设计了多无人机协同追捕的全局奖励和局部奖励两种奖励函数,... 展开更多; 关键词多无人机协同追捕 de-maddpg 多智能体强化学习对抗策略; 原文传递

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部