本文提出了一种多目标决策与强化学习相结合的改进的逼近于理想解的排序(technique for order preference similar to an ideal solution,TOPSIS)-Q算法,有效解决了自动发电控制(automatic generation control,AGC)总功率指令分配到风...本文提出了一种多目标决策与强化学习相结合的改进的逼近于理想解的排序(technique for order preference similar to an ideal solution,TOPSIS)-Q算法,有效解决了自动发电控制(automatic generation control,AGC)总功率指令分配到风电、水电、火电等各类AGC机组的动态随机多目标优化问题.算法采用3个不同的目标Q值矩阵进行迭代更新,然后利用改进TOPSIS方法对Q值矩阵进行多目标决策处理,客观地给出各目标的动态最优权重系数,从而得到各状态-动作对的综合评价判据.IEEE标准两区域模型仿真研究验证了改进TOPSIS-Q算法在AGC机组功率多目标动态优化分配过程应用的可行性和有效性,在复杂随机扰动的环境中提高系统CPS性能的同时,有效降低了AGC机组调节成本和碳排放.展开更多
文摘该文在频率辅助服务市场环境下,建立了综合能源系统的自动发电控制(automatic generation control,AGC)的发电功率指令分配算法优化模型。通过对AGC发电功率指令的动态优化分配,以减小区域控制偏差和调频里程补偿费用。采用多经验池概率回放的双延迟深度确定性策略梯度算法(multiple experience pool experience replay twin delayed deep deterministic policy Gradient,ME-TD3),对双延迟深度确定性策略梯度中的经验池进行分类,采用不同概率从不同经验池采样来训练,提高智能体的训练效率,增加智能体的寻优正确率,从而提高最优解的质量。最后,分别利用扩展的两区域负荷频率控制(load frequency control,LFC)模型和某省电网模型验证所提算法的性能。
文摘本文提出了一种多目标决策与强化学习相结合的改进的逼近于理想解的排序(technique for order preference similar to an ideal solution,TOPSIS)-Q算法,有效解决了自动发电控制(automatic generation control,AGC)总功率指令分配到风电、水电、火电等各类AGC机组的动态随机多目标优化问题.算法采用3个不同的目标Q值矩阵进行迭代更新,然后利用改进TOPSIS方法对Q值矩阵进行多目标决策处理,客观地给出各目标的动态最优权重系数,从而得到各状态-动作对的综合评价判据.IEEE标准两区域模型仿真研究验证了改进TOPSIS-Q算法在AGC机组功率多目标动态优化分配过程应用的可行性和有效性,在复杂随机扰动的环境中提高系统CPS性能的同时,有效降低了AGC机组调节成本和碳排放.