期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于执行器-评价器学习的自适应PID控制 被引量:14
1
作者 陈学松 杨宜民 《控制理论与应用》 EI CAS CSCD 北大核心 2011年第8期1187-1192,共6页
针对传统PID控制器无法在线自整定参数的不足,提出了一种基于执行器-评估器(Actor-Critic,AC)学习的自适应PID控制器结构与学习算法.该控制器利用AC学习实现PID参数的自适应整定,采用一个径向基函数网络同时对Actor的策略函数和Critic... 针对传统PID控制器无法在线自整定参数的不足,提出了一种基于执行器-评估器(Actor-Critic,AC)学习的自适应PID控制器结构与学习算法.该控制器利用AC学习实现PID参数的自适应整定,采用一个径向基函数网络同时对Actor的策略函数和Critic的值函数进行逼近.径向基函数网络的输入为系统误差、误差的一次差分和二次差分,Actor实现系统状态到PID参数的映射,Critic则对Actor的输出进行评判并且生成时序差分(temporal difference,TD)误差信号.基于AC学习的体系结构和TD误差性能指标,给出了控制器设计的步骤流程图.两个仿真实验表明:与传统的PID控制器相比,基于AC学习的PID控制器在响应速度和自适应能力方面要优于传统PID控制器. 展开更多
关键词 强化学习 执行器-评价器 自适应PID控制
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部