现有深度强化学习(deep reinforcement learning,DRL)方法在解决配电网电压优化问题时,存在信用分配难、探索效率低等问题,在模型训练速度和优化效果等方面表现欠佳。为此,结合配电网分区降损与模仿学习的思想,提出一种基于指导信号的...现有深度强化学习(deep reinforcement learning,DRL)方法在解决配电网电压优化问题时,存在信用分配难、探索效率低等问题,在模型训练速度和优化效果等方面表现欠佳。为此,结合配电网分区降损与模仿学习的思想,提出一种基于指导信号的多智能体深度确定性策略梯度(guidance signal based multi-agent deep deterministic policy gradient,GS-MADDPG)的电压优化方法。首先,将电动汽车(electric vehicles,EV)集群、分布式电源(distributed generations,DG)和无功调节装置作为决策智能体,构建强化学习优化模型。然后,通过配电网分区,解耦多智能体的外部奖励,并结合模仿学习,利用指导信号引入内部奖励,帮助智能体快速寻优。最后,基于改进IEEE33节点系统进行算例测试。结果表明,所提电压优化策略较传统DRL方法具有更高的样本利用率,实现了更稳定的收敛及更高的模型训练效率,提升了配电网电压的优化效果。展开更多
电压质量低和系统网损较大是困扰偏远地区配电系统的两个主要问题,也是近几年配电网研究的重点。基于美国电科院(EPRI)开发的Open Distribution System Simulator(Open DSS)平台,进行了三相不平衡配电系统的潮流计算,分析了三相平衡负...电压质量低和系统网损较大是困扰偏远地区配电系统的两个主要问题,也是近几年配电网研究的重点。基于美国电科院(EPRI)开发的Open Distribution System Simulator(Open DSS)平台,进行了三相不平衡配电系统的潮流计算,分析了三相平衡负荷与不平衡负荷对电压和有功网损的影响。以Matlab为平台,设计了Open DSS的COM接口,使得在Matlab程序中能够反复调取Open DSS对配电网进行三相潮流计算,由此建立了配电网无功优化和低电压治理决策模型,将电压分段罚函数引入扩展的无功优化目标函数中,并将高斯罚函数用于处理无功优化变量,使得最终得到的解尽可能地逼近离散值。基于粒子群优化算法(PSO)实现了无功优化问题的求解。实际仿真算例验证了所建立的无功优化模型和算法的有效性与可行性。展开更多
文摘现有深度强化学习(deep reinforcement learning,DRL)方法在解决配电网电压优化问题时,存在信用分配难、探索效率低等问题,在模型训练速度和优化效果等方面表现欠佳。为此,结合配电网分区降损与模仿学习的思想,提出一种基于指导信号的多智能体深度确定性策略梯度(guidance signal based multi-agent deep deterministic policy gradient,GS-MADDPG)的电压优化方法。首先,将电动汽车(electric vehicles,EV)集群、分布式电源(distributed generations,DG)和无功调节装置作为决策智能体,构建强化学习优化模型。然后,通过配电网分区,解耦多智能体的外部奖励,并结合模仿学习,利用指导信号引入内部奖励,帮助智能体快速寻优。最后,基于改进IEEE33节点系统进行算例测试。结果表明,所提电压优化策略较传统DRL方法具有更高的样本利用率,实现了更稳定的收敛及更高的模型训练效率,提升了配电网电压的优化效果。
文摘电压质量低和系统网损较大是困扰偏远地区配电系统的两个主要问题,也是近几年配电网研究的重点。基于美国电科院(EPRI)开发的Open Distribution System Simulator(Open DSS)平台,进行了三相不平衡配电系统的潮流计算,分析了三相平衡负荷与不平衡负荷对电压和有功网损的影响。以Matlab为平台,设计了Open DSS的COM接口,使得在Matlab程序中能够反复调取Open DSS对配电网进行三相潮流计算,由此建立了配电网无功优化和低电压治理决策模型,将电压分段罚函数引入扩展的无功优化目标函数中,并将高斯罚函数用于处理无功优化变量,使得最终得到的解尽可能地逼近离散值。基于粒子群优化算法(PSO)实现了无功优化问题的求解。实际仿真算例验证了所建立的无功优化模型和算法的有效性与可行性。