期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于态势利导的需求响应自学习优化调度方法 被引量:3
1
作者 明威宇 李妍 +3 位作者 程时杰 龙禹 徐菁 王少荣 《电力系统自动化》 EI CSCD 北大核心 2022年第23期109-116,共8页
针对多随机场景下用户可选择需求响应(CCR)的场景组合激增问题,利用深度强化学习算法实现CCR群组的优选及其所包含节点的优化调度。首先,根据CCR优化调度的约束条件与目标函数,分析其数学模型及日调度周期的求解复杂度;然后,基于马尔可... 针对多随机场景下用户可选择需求响应(CCR)的场景组合激增问题,利用深度强化学习算法实现CCR群组的优选及其所包含节点的优化调度。首先,根据CCR优化调度的约束条件与目标函数,分析其数学模型及日调度周期的求解复杂度;然后,基于马尔可夫决策过程将CCR优化调度过程映射至态势感知元组,并基于竞争深度Q网络架构建立态势利导函数,通过多次态势推演,利用小批量梯度下降法对态势利导函数求导,不断反馈更新算法参数,实现决策优化;最后,基于IEEE 33节点算例,通过不同规模的随机样本数量,在随机运行方式下实现了待选CCR群组的优选,并制定相应的优化调度策略。 展开更多
关键词 可选择需求响应 深度强化学习 竞争深度Q网络 马尔可夫决策过程 态势感知 态势利导
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部