期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
结合先验知识的多智能体博弈对抗研究
1
作者 袁婷帅 冯宇 李永强 《高技术通讯》 CAS 北大核心 2024年第3期256-264,共9页
无实时奖励的复杂对抗环境是目前深度强化学习(DRL)领域的研究热点,面对此类环境,纯粹使用深度强化学习算法会导致智能体训练无法快速收敛以及对抗效果不佳等问题。基于此,本文提出了一种基于先验知识与深度强化学习相结合的智能博弈流... 无实时奖励的复杂对抗环境是目前深度强化学习(DRL)领域的研究热点,面对此类环境,纯粹使用深度强化学习算法会导致智能体训练无法快速收敛以及对抗效果不佳等问题。基于此,本文提出了一种基于先验知识与深度强化学习相结合的智能博弈流程框架,设计了数据处理、增强机制以及动作决策3个模块,通过威胁评估、任务调度和损失比率3种增强机制来提升智能体在复杂对抗环境下的收敛速度和对抗效果。在数据堡垒(DC)平台上进行仿真,实验结果验证了本文所提出的智能博弈流程框架训练的智能体相较于单纯基于深度强化学习的智能体拥有更快的收敛速度以及更高的胜率。 展开更多
关键词 智能博弈 先验知识 深度强化学习(DRL) 威胁评估 任务调度
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部