期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
联邦强化学习文献综述 被引量:1
1
作者 李骏琪 邵俊 蔺静茹 《金融科技时代》 2021年第10期87-89,共3页
深度学习技术能够快速有效地从大量历史数据中学习规律和模式,但很多实际应用场景无法提供足够的训练数据,且要求模型对外部环境的变化快速作出反应。近一年来,联邦强化学习的发展为解决以上行业痛点带来了新思路,联邦强化学习不仅可以... 深度学习技术能够快速有效地从大量历史数据中学习规律和模式,但很多实际应用场景无法提供足够的训练数据,且要求模型对外部环境的变化快速作出反应。近一年来,联邦强化学习的发展为解决以上行业痛点带来了新思路,联邦强化学习不仅可以在隐私保护的条件下扩大样本数据,而且训练出的智能体可以跟随外部环境的变化作出合适的决策,比传统监督学习具有更好的泛化性和自适应性。本文总结了近一年来联邦强化学习的研究成果,包括基于深度Q学习算法和演员评论家算法的联邦强化学习算法,并从联邦模式、隐私保护和应用场景3方面展望其未来的研究方向。 展开更多
关键词 联邦强化学习 隐私保护 深度Q学习算法 演员评论家算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部