期刊文献+

基于协同多智能体值分解的频谱共享

下载PDF
导出
摘要 在随机博弈频谱竞拍机制模型的基础上,给出基于值分解多智能体合作的频谱管理算法,算法不需要状态转移概率,考虑次用户之间的合作,把团队奖励分解为次用户的价值函数,之后将误差反向传播给各个次用户的价值函数。团队奖励分解可避免出现虚假奖励信号,提高了学习效率。
作者 张涌逸
出处 《电脑编程技巧与维护》 2021年第10期122-123,共2页 Computer Programming Skills & Maintenance
  • 相关文献

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部