期刊文献+

基于Policy Gradient的机械臂运动跟踪控制器参数整定 被引量:3

Parameter tuning of manipulator motion tracking controller based on Policy Gradient
下载PDF
导出
摘要 针对机械臂运动跟踪控制器的参数自整定问题,设计了一种基于强化学习Policy Gradient法的参数整定器。首先,介绍了机械臂的一种混合动力学模型,根据该系统模型进行了比例微分(proportional-derivative,PD)控制器设计和李雅普诺夫稳定性证明,并由此给出了参数矩阵的范围。其次,设计了基于Policy Gradient的参数整定器,通过引入积分器的方法对其进行改进,使其控制下的参数行为连续化以进一步提高PD控制器的控制效果。最后,以二阶机械臂系统为例进行了仿真验证。实验数据证明了该参数整定器的有效性和可行性,并能有效提升系统的动态性能。 Aiming at the parameter self-tuning problem of the manipulator motion tracking controller, a parameter tuning device based on reinforcement learning Policy Gradient method is designed. Firstly, a hybrid dynamic model of manipulator is introduced. According to the system model, the design of proportional-derivative (PD) controller and the stability of LyapunoVare carried out, and the range of parameter matrix is given. Secondly, the parameter tuning device based on Policy Gradient is designed. The integrator is introduced to improve the parameter tuning of gradient, sOas to further improve the control effect of PD controller. Finally, a second-order manipulator system is taken as an example to verify the effectiveness and feasibility of the parameter tuning device, which effectively improves the dynamic performance of the proposed system.
作者 韩霖骁 胡剑波 宋仕元 王应洋 贺子厚 张鹏 HAN Linxiao;HU Jianbo;SONG Shiyuan;WANG Yingyang;HE Zihou;ZHANG Peng(Equipment Management and Unmanned Aerial Vehicle Engineering College,Airforce and Engineering University,Xi’an 710051,China)
出处 《系统工程与电子技术》 EI CSCD 北大核心 2021年第9期2605-2611,共7页 Systems Engineering and Electronics
基金 工业控制技术国家重点实验室开放课题(ICT20063)资助课题。
关键词 机械臂 运动跟踪 Policy Gradient 参数整定 比例微分控制 manipulator motion tracking Policy Gradient parameter tuning proportional-derivative(PD)control
  • 相关文献

参考文献4

二级参考文献16

共引文献27

同被引文献34

引证文献3

二级引证文献8

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部