期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
稀疏奖励场景下基于个体落差情绪的多智能体协作算法
1
作者 王浩 汪京 方宝富 《模式识别与人工智能》 EI CSCD 北大核心 2022年第5期451-460,共10页
针对在多智能体环境中强化学习面临的稀疏奖励问题,借鉴情绪在人类学习和决策中的作用,文中提出基于个体落差情绪的多智能体协作算法.对近似联合动作值函数进行端到端优化以训练个体策略,将每个智能体的个体动作值函数作为对事件的评估... 针对在多智能体环境中强化学习面临的稀疏奖励问题,借鉴情绪在人类学习和决策中的作用,文中提出基于个体落差情绪的多智能体协作算法.对近似联合动作值函数进行端到端优化以训练个体策略,将每个智能体的个体动作值函数作为对事件的评估.预测评价与实际情况的差距产生落差情绪,以该落差情绪模型作为内在动机机制,为每个智能体产生一个内在情绪奖励,作为外在奖励的有效补充,以此缓解外在奖励稀疏的问题.同时内在情绪奖励与具体任务无关,因此具有一定的通用性.在不同稀疏程度的多智能体追捕场景中验证文中算法的有效性和鲁棒性. 展开更多
关键词 稀疏奖励 多智能体协作 强化学习 个体落差情绪 内在情绪奖励
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部