期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于最近双经验SAC算法的无人分队控制研究
1
作者
李海川
阳周明
+2 位作者
王洋
崔新悦
王娜
《火力与指挥控制》
CSCD
北大核心
2023年第6期70-75,83,共7页
针对无人分队控制,如何进行行为决策以更好地完成任务,是当前无人驾驶的一个研究热点。基于SAC算法,提出最近双经验回放SAC算法模型。该模型主要从两方面入手:1)使用最近经验采样代替随机采样;2)使用双经验池代替单经验池。实验结果表明...
针对无人分队控制,如何进行行为决策以更好地完成任务,是当前无人驾驶的一个研究热点。基于SAC算法,提出最近双经验回放SAC算法模型。该模型主要从两方面入手:1)使用最近经验采样代替随机采样;2)使用双经验池代替单经验池。实验结果表明,改进后的SAC算法相比传统SAC算法,提升了学习效率与稳定性,降低了策略网络误差,使无人分队能有更高的任务成功率。
展开更多
关键词
深度强化学习
SAC算法
最近双经验池回放
无人分队行为决策
下载PDF
职称材料
题名
基于最近双经验SAC算法的无人分队控制研究
1
作者
李海川
阳周明
王洋
崔新悦
王娜
机构
北方自动控制技术研究所
出处
《火力与指挥控制》
CSCD
北大核心
2023年第6期70-75,83,共7页
文摘
针对无人分队控制,如何进行行为决策以更好地完成任务,是当前无人驾驶的一个研究热点。基于SAC算法,提出最近双经验回放SAC算法模型。该模型主要从两方面入手:1)使用最近经验采样代替随机采样;2)使用双经验池代替单经验池。实验结果表明,改进后的SAC算法相比传统SAC算法,提升了学习效率与稳定性,降低了策略网络误差,使无人分队能有更高的任务成功率。
关键词
深度强化学习
SAC算法
最近双经验池回放
无人分队行为决策
Keywords
deep reinforcement learning
soft actor-critic algorithm(SAC algorithm)
dual experience replay playback
unmanned squad behavior decision-making
分类号
TJ812 [兵器科学与技术—武器系统与运用工程]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于最近双经验SAC算法的无人分队控制研究
李海川
阳周明
王洋
崔新悦
王娜
《火力与指挥控制》
CSCD
北大核心
2023
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部