基于Policy Gradient的机械臂运动跟踪控制器参数整定被引量：3

Parameter tuning of manipulator motion tracking controller based on Policy Gradient

下载PDF

导出

摘要针对机械臂运动跟踪控制器的参数自整定问题,设计了一种基于强化学习Policy Gradient法的参数整定器。首先,介绍了机械臂的一种混合动力学模型,根据该系统模型进行了比例微分(proportional-derivative,PD)控制器设计和李雅普诺夫稳定性证明,并由此给出了参数矩阵的范围。其次,设计了基于Policy Gradient的参数整定器,通过引入积分器的方法对其进行改进,使其控制下的参数行为连续化以进一步提高PD控制器的控制效果。最后,以二阶机械臂系统为例进行了仿真验证。实验数据证明了该参数整定器的有效性和可行性,并能有效提升系统的动态性能。 Aiming at the parameter self-tuning problem of the manipulator motion tracking controller, a parameter tuning device based on reinforcement learning Policy Gradient method is designed. Firstly, a hybrid dynamic model of manipulator is introduced. According to the system model, the design of proportional-derivative (PD) controller and the stability of LyapunoVare carried out, and the range of parameter matrix is given. Secondly, the parameter tuning device based on Policy Gradient is designed. The integrator is introduced to improve the parameter tuning of gradient, sOas to further improve the control effect of PD controller. Finally, a second-order manipulator system is taken as an example to verify the effectiveness and feasibility of the parameter tuning device, which effectively improves the dynamic performance of the proposed system.

作者韩霖骁胡剑波宋仕元王应洋贺子厚张鹏 HAN Linxiao;HU Jianbo;SONG Shiyuan;WANG Yingyang;HE Zihou;ZHANG Peng(Equipment Management and Unmanned Aerial Vehicle Engineering College,Airforce and Engineering University,Xi’an 710051,China)

机构地区空军工程大学装备管理与无人机工程学院

出处《系统工程与电子技术》 EI CSCD 北大核心 2021年第9期2605-2611,共7页 Systems Engineering and Electronics

基金工业控制技术国家重点实验室开放课题(ICT20063)资助课题。

关键词机械臂运动跟踪 Policy Gradient 参数整定比例微分控制 manipulator motion tracking Policy Gradient parameter tuning proportional-derivative(PD)control

分类号 O231.2 [理学—运筹学与控制论]

引文网络
相关文献

参考文献4

1李小华,杨瑞芳,刘辉,何帅.一类机械臂系统自适应有限时间有界H_(∞)跟踪控制[J].控制理论与应用,2021,38(1):147-156. 被引量：13
2杨彪,梁贵安,彭金辉,郭胜惠,李玮,张世敏,李英伟,白松.Self-adaptive PID controller of microwave drying rotary device tuning on-line by genetic algorithms[J].Journal of Central South University,2013,20(10):2685-2692. 被引量：6
3LIU Lu,SHAN Liang,DAI Yuewei,LIU Chenglin,QI Zhidong.Improved quantum bacterial foraging algorithm for tuning parameters of fractional-order PID controller[J].Journal of Systems Engineering and Electronics,2018,29(1):166-175. 被引量：8
4宋仕元,胡剑波,王应洋,韩霖晓.滑模控制器参数整定的Actor-Critic学习算法[J].电光与控制,2020,27(9):24-27. 被引量：4

二级参考文献16

1杨旭,刘俊杰,杨存志.微波干燥设备的性能特点及其市场前景分析[J].农机化研究,2007,29(1):41-42. 被引量：10
2杨智,陈志堂,范正平,李晓东.基于改进粒子群优化算法的PID控制器整定[J].控制理论与应用,2010,27(10):1345-1352. 被引量：59
3刘福才,高娟娟,王芳.地面装调的空间机械臂在空间应用时的自适应鲁棒控制[J].控制理论与应用,2013,30(1):69-76. 被引量：13
4董玉明,俞立,朱俊威.基于自适应滑模的移动机械臂跟踪控制[J].控制工程,2019,26(1):43-49. 被引量：27
5王三秀,俞立,徐建明,邢科新,王正初.机械臂自适应鲁棒轨迹跟踪控制[J].控制工程,2015,22(2):241-245. 被引量：52
6Hongyuan Gao,Chenwan Li.Quantum-inspired bacterial foraging algorithm for parameter adjustment in green cognitive radio[J].Journal of Systems Science & Complexity,2015,28(5):897-907. 被引量：5
7赵冬斌,邵坤,朱圆恒,李栋,陈亚冉,王海涛,刘德荣,周彤,王成红.深度强化学习综述:兼论计算机围棋的发展[J].控制理论与应用,2016,33(6):701-717. 被引量：131
8聂建斌,陈劭,徐向波.基于退火遗传算法的电子节气门滑模控制参数优化[J].微电机,2017,50(5):52-57. 被引量：5
9沈智鹏,代昌盛.欠驱动船舶路径跟踪的强化学习迭代滑模控制[J].哈尔滨工程大学学报,2017,38(5):697-704. 被引量：20
10黄健,周端.基于改进差分进化算法的滑模控制参数整定[J].控制工程,2018,25(3):484-487. 被引量：9

共引文献27

1杨彪,母其海,朱娜,邓卓,刘志邦.响应面法和一维卷积神经网络优化微波碳热还原低品位钛精矿工艺的研究[J].现代化工,2021,41(S01):134-138.
2杨彪,成宬,李鑫培,代忠仿,郭祥.一种基于预测模型的微波加热过程温度控制策略[J].昆明理工大学学报（自然科学版）,2020,45(5):1-8. 被引量：4
3黄长强,蚩军祥,黄汉桥,周欢.基于轨迹线性化的鲁棒制导控制一体化设计[J].中南大学学报（自然科学版）,2016,47(11):3735-3741. 被引量：1
4刘晓琳,李卓.飞机舵机电动加载系统多余力矩抑制方法[J].系统工程与电子技术,2019,41(6):1366-1373. 被引量：14
5赵亚亚,黄姣茹,钱富才,陈超波.基于粒子群优化算法的分数阶系统二次型最优控制算法[J].科学技术与工程,2019,19(36):212-216. 被引量：7
6蒋天伦,王艳.融合案例推理与混合群智能的离散制造系统能效优化方法[J].信息与控制,2020,49(3):323-334. 被引量：2
7赵亚亚,黄姣茹,钱富才,陈超波.基于蚁群算法的分数阶随机系统状态最优估计[J].计算机应用与软件,2020,37(11):224-228. 被引量：4
8杨彪,母其海,朱娜,邓卓,刘志邦.基于一维卷积神经网络的微波加热钛精矿温度预测[J].有色金属工程,2021,11(9):56-61. 被引量：2
9王刚,李小华.柔性关节机械臂的自抗扰预设定有限时间跟踪控制[J].辽宁科技大学学报,2021,44(5):363-370. 被引量：2
10张洁,廖一鹏,戴路,李雪艳.基于量子和声搜索模糊集的低亮度图像NSCT增强[J].激光与光电子学进展,2021,58(24):363-374. 被引量：2

同被引文献34

1黄自鑫,赖旭芝,王亚午,吴敏.基于轨迹规划的平面三连杆欠驱动机械臂位置控制[J].控制与决策,2020,35(2):382-388. 被引量：22
2谢天,谢良喜,孙欢,吴攀峰.基于51单片机的液压机械臂闭环控制系统设计[J].机床与液压,2020,48(5):6-10. 被引量：16
3黄玲涛,王彬,倪水,杨劲松,倪涛.基于力传感器重力补偿的机器人柔顺控制研究[J].农业机械学报,2020,51(3):386-393. 被引量：26
4潘平盛.自动化生产线搬运机械手控制系统的设计研究[J].机械设计与制造,2020(4):8-11. 被引量：29
5徐永利,李潇男,刘勇,杨明毅,刘明洋.空间机械臂地面竖直方向重力补偿控制系统设计[J].机器人,2020,42(2):191-198. 被引量：18
6于树友,孟凌宇,许芳,曲婷,陈虹.基于三步法的机械臂轨迹跟踪控制[J].控制理论与应用,2020,37(5):1034-1044. 被引量：20
7王勇,陈荟西.基于三流联合卷积神经网络的机械臂抓取检测[J].小型微型计算机系统,2020,41(5):1112-1116. 被引量：7
8孙军,张鹏,沈卓群,崔楠.LabVIEW环境下的机械臂轨迹跟踪控制算法研究[J].机械设计与制造,2020(6):245-248. 被引量：15
9段纯,顾建华.基于逆动力学的机械臂鲁棒位置控制方法的设计[J].中国工程机械学报,2020,18(3):242-247. 被引量：8
10曾伟鹏,邵辉,洪雪梅,聂卓赟,郭东生.采用非线性干扰观测器的机械臂补偿型滑模控制[J].华侨大学学报（自然科学版）,2020,41(4):415-422. 被引量：9

引证文献3

1李崇智.基于模糊PID的悬吊式机械臂重力补偿控制系统设计[J].计算机测量与控制,2023,31(1):100-105. 被引量：5
2段伟浩,赵瑾,梁家瑞,曹锐.基于深度强化学习的多智能体动态寻路算法[J].计算机仿真,2023,40(1):441-446. 被引量：2
3朱威汉.基于卷积神经网络的机械臂抓取控制系统设计[J].计算机测量与控制,2023,31(11):181-186. 被引量：1

二级引证文献8

1陈连业,刘雪丽.模糊PID在收卷张力控制系统中的应用[J].当代化工研究,2023(13):66-68.
2郑岩,罗强,龙颖,王昌洪.基于改进PID算法的柔性机械臂路径规划技术研究[J].现代农机,2023(5):76-78. 被引量：2
3杭彤,李玲,柳燕菲,罗紫弦.基于ROS的小车运动控制系统设计[J].电子制作,2023,31(18):3-6. 被引量：1
4宋燕宇,陈定君.数据驱动的舞蹈机器人设计[J].自动化与仪器仪表,2023(11):187-191.
5孙灏.二自由度机械臂网络远程控制系统设计[J].造纸装备及材料,2024,53(1):84-86.
6杜泳韬,赵岭忠,翟仲毅.基于注意力机制的信息预处理多智能体强化学习算法[J].国外电子测量技术,2024,43(3):91-97.
7娄红岩,刘永鑫.基于人工智能及增强现实技术的智慧乡村平台景点模拟系统[J].自动化与仪器仪表,2024(7):317-321.
8宋磊,杨耀宁.控制-传感信号时滞补偿下柔性机械臂控制方法设计[J].机械设计与研究,2024,40(3):152-156.

1张勤,刘丰溥,蒋先平,熊征,徐灿.番茄串收机械臂运动规划方法与试验[J].农业工程学报,2021,37(9):149-156. 被引量：10
2周颖文,王勇.基于多目红外视觉的室内无人车导航系统研究[J].中国新技术新产品,2021(10):31-33. 被引量：1
3邓丰曼.基于UG的液压机械臂建模与故障诊断方法研究[J].液压气动与密封,2021,41(8):69-71. 被引量：6
4杨浩宇,张士光,许东洋.化工工艺装置的安全评价探讨[J].产城（上半月）,2021(6):245-245.
5刘海全,朱敬,王建.特厚煤层回采巷道顶煤稳定特征研究[J].煤炭科技,2021,42(4):62-68. 被引量：2
6陈勇,孙娟.基于改进粒子滤波算法的农业物联网养殖跟踪研究[J].科学技术创新,2021(22):113-114.
7李刚,于金鹏,刘加朋,于海生.基于指令滤波的机械臂有限时间输出约束阻抗控制[J].机械制造与自动化,2021,50(4):150-155. 被引量：3
8王仲林,王卫民,朱乐俊.Siamese-ELECTRA网络结合对抗训练的FAQ问答模型研究[J].软件导刊,2021,20(8):58-64.
9戈海龙,金硕,李文龙,马新强,成巍.FANUC多轴同步控制技术及在大型伺服压力机中的应用[J].制造技术与机床,2021(8):203-207. 被引量：2
10张文昊.格点QCD中有限体积下形状因子的内插计算[J].原子核物理评论,2021,38(2):136-146.

系统工程与电子技术

2021年第9期

浏览历史

内容加载中请稍等...

基于Policy Gradient的机械臂运动跟踪控制器参数整定被引量：3

参考文献4

二级参考文献16

共引文献27

同被引文献34

引证文献3

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

基于Policy Gradient的机械臂运动跟踪控制器参数整定 被引量：3

参考文献4

二级参考文献16

共引文献27

同被引文献34

引证文献3

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

基于Policy Gradient的机械臂运动跟踪控制器参数整定被引量：3