期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于价值分解深度强化学习的分布式光伏主动电压控制方法
被引量:
1
1
作者
刘硕
郭创新
+2 位作者
冯斌
张勇
王艺博
《电力自动化设备》
EI
CSCD
北大核心
2023年第10期152-159,共8页
针对主动电压控制问题,深度强化学习能够有效地解决数学优化方法在精确性和实时性方面的不足。但传统多智能体深度强化学习方法存在信用分配、过度泛化等问题,难以学习到全局最优的协调策略,控制效果较差。为此,提出了一种基于价值分解...
针对主动电压控制问题,深度强化学习能够有效地解决数学优化方法在精确性和实时性方面的不足。但传统多智能体深度强化学习方法存在信用分配、过度泛化等问题,难以学习到全局最优的协调策略,控制效果较差。为此,提出了一种基于价值分解深度强化学习的分布式光伏主动电压控制方法。将主动电压控制问题建模为分布式部分可观测马尔可夫决策过程,然后基于中心化训练和去中心化执行框架,提出分解式价值网络、集中式策略梯度2项改进措施:将全局价值网络分解为个体价值网络和混合网络,并采用所有智能体的当前策略进行集中参数更新。改进的IEEE 33节点配电网系统的算例结果表明,所提方法表现出了优越的稳压减损控制性能,且在训练速度、场景鲁棒性等方面具备一定的优势。
展开更多
关键词
主动电压控制
分布式光伏
深度强化学习
多智能体
价值分解
集中式策略梯度
下载PDF
职称材料
题名
基于价值分解深度强化学习的分布式光伏主动电压控制方法
被引量:
1
1
作者
刘硕
郭创新
冯斌
张勇
王艺博
机构
浙江大学电气工程学院
国家电网有限公司华北分部
出处
《电力自动化设备》
EI
CSCD
北大核心
2023年第10期152-159,共8页
基金
国家电网公司科技项目(5100⁃20212570A⁃0⁃5⁃SF)。
文摘
针对主动电压控制问题,深度强化学习能够有效地解决数学优化方法在精确性和实时性方面的不足。但传统多智能体深度强化学习方法存在信用分配、过度泛化等问题,难以学习到全局最优的协调策略,控制效果较差。为此,提出了一种基于价值分解深度强化学习的分布式光伏主动电压控制方法。将主动电压控制问题建模为分布式部分可观测马尔可夫决策过程,然后基于中心化训练和去中心化执行框架,提出分解式价值网络、集中式策略梯度2项改进措施:将全局价值网络分解为个体价值网络和混合网络,并采用所有智能体的当前策略进行集中参数更新。改进的IEEE 33节点配电网系统的算例结果表明,所提方法表现出了优越的稳压减损控制性能,且在训练速度、场景鲁棒性等方面具备一定的优势。
关键词
主动电压控制
分布式光伏
深度强化学习
多智能体
价值分解
集中式策略梯度
Keywords
active voltage control
distributed photovoltaic
deep reinforcement learning
multi-agent
value de⁃composition
centralized policy gradient
分类号
TM73 [电气工程—电力系统及自动化]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于价值分解深度强化学习的分布式光伏主动电压控制方法
刘硕
郭创新
冯斌
张勇
王艺博
《电力自动化设备》
EI
CSCD
北大核心
2023
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部