期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于HSARSA(λ)算法的水库长期随机优化调度研究 被引量:5
1
作者 李文武 刘江鹏 +2 位作者 蒋志强 裴本林 李黄强 《水电能源科学》 北大核心 2020年第12期53-57,共5页
针对强化学习的SARSA算法在求解水库随机优化问题中存在的优化性能不高、收敛速度较慢的问题,提出采用基于强化学习的HSARSA(λ)算法进行求解。先在SARSA算法基础上引入效用迹函数得到SARSA(λ)算法,然后加入启发函数得到HSARSA(λ)算法... 针对强化学习的SARSA算法在求解水库随机优化问题中存在的优化性能不高、收敛速度较慢的问题,提出采用基于强化学习的HSARSA(λ)算法进行求解。先在SARSA算法基础上引入效用迹函数得到SARSA(λ)算法,然后加入启发函数得到HSARSA(λ)算法,最后通过不断调整HSARSA(λ)算法的学习率α、折扣因子γ、衰减因子λ等参数求解水库长期随机优化调度问题。实例应用表明,HSARSA(λ)相较于SARSA、SARSA(λ)算法可提升求解精度,减少最优近似解寻优迭代次数,为水库随机优化调度问题提供了一种新的求解思路。 展开更多
关键词 随机优化调度 强化学习 HSARSA(λ)算法 效用迹函数 启发函数
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部