-
题名基于态势利导的需求响应自学习优化调度方法
被引量:3
- 1
-
-
作者
明威宇
李妍
程时杰
龙禹
徐菁
王少荣
-
机构
强电磁工程与新技术国家重点实验室
-
出处
《电力系统自动化》
EI
CSCD
北大核心
2022年第23期109-116,共8页
-
基金
国家重点研发计划智能电网技术与装备重点专项资助项目(2017YFB0902800)。
-
文摘
针对多随机场景下用户可选择需求响应(CCR)的场景组合激增问题,利用深度强化学习算法实现CCR群组的优选及其所包含节点的优化调度。首先,根据CCR优化调度的约束条件与目标函数,分析其数学模型及日调度周期的求解复杂度;然后,基于马尔可夫决策过程将CCR优化调度过程映射至态势感知元组,并基于竞争深度Q网络架构建立态势利导函数,通过多次态势推演,利用小批量梯度下降法对态势利导函数求导,不断反馈更新算法参数,实现决策优化;最后,基于IEEE 33节点算例,通过不同规模的随机样本数量,在随机运行方式下实现了待选CCR群组的优选,并制定相应的优化调度策略。
-
关键词
可选择需求响应
深度强化学习
竞争深度Q网络
马尔可夫决策过程
态势感知
态势利导
-
Keywords
consumer choice resource(CCR)
deep reinforcement learning(DRL)
dueling deep Q network(DDQN)
Markov decision process(MDP)
situation awareness
situation orientation
-
分类号
TM73
[电气工程—电力系统及自动化]
TP18
[自动化与计算机技术—控制理论与控制工程]
-