基于Q学习的高超声速飞行器自抗扰控制研究

Research on Active Disturbance Rejection Control of Hypersonic Vehicle Based on Q-learning

下载PDF

导出

摘要为实现高超声速飞行器姿态自抗扰控制的参数整定,提出一种模糊Q学习算法。首先,采用强化学习中的Q学习算法来实现姿态自抗扰控制参数的离线闭环快速自适应整定;然后,根据模糊控制的思路,将控制参数划分为不同区域,通过设定奖励,不断更新Q表;最后,将训练好的Q表用于飞行器的控制。仿真结果表明,相对于传统的线性自抗扰控制(linear active disturbance rejection control,LADRC)和滑模控制,基于Q学习的LADRC省去了人工调试参数的繁琐过程,且仍具有良好的跟踪效果。蒙特卡罗仿真测试结果验证了基于Q学习的LADRC的鲁棒性。 A fuzzy Q-learning algorithm is proposed to adjust the parameters of attitude active disturbance rejection control for hypersonic vehicles.Firstly,the Q-learning algorithm in reinforcement learning is used to realize the fast off-line closed-loop adaptive tuning of attitude active disturbance rejection control parameters.Then,according to the idea of fuzzy control,the control parameters are divided into different areas,and the Q-table is constantly updated by setting rewards.Finally,the trained Q-table is used to control the aircraft.Compared with conventional linear active disturbance rejection control(LADRC)and sliding mode control,simulation results show that LADRC based on Q-learning saves the tedious process of manual parameter tuning,and still has good tracking performance.Monte Carlo simulation results verify the robustness of LADRC based on Q-learning.

作者高强李旭吉月辉刘俊杰 GAO Qiang;LI Xu;JI Yuehui;LIU Junjie(School of Electrical Engineering and Automation,Tianjin University of Technology,Tianjin 300384,China)

机构地区天津理工大学电气工程与自动化学院

出处《控制工程》 CSCD 北大核心 2024年第4期577-582,共6页 Control Engineering of China

基金国家自然科学基金资助项目(61975151,61308120)。

关键词高超声速飞行器姿态控制自抗扰控制 Q学习参数整定 Hypersonic vehicle attitude control active disturbance rejection control Q-learning parameter tuning

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

1王正齐,徐浩,王德全.基于线性自抗扰控制的柔性多状态开关直流电压控制策略[J].电力电容器与无功补偿,2024,45(2):107-116.
2刘一琦,孙明哲,胡存刚,李振杰,班明飞.基于LADRC的柔性多状态开关平滑切换策略[J].电网技术,2024,48(4):1663-1671.
3于瀛祯,林娜,池荣虎.迭代学习控制器参数的数据驱动自适应整定方法[J].青岛科技大学学报（自然科学版）,2024,45(1):121-128.
4万春秋,李擎,崔家瑞,杨旭,李希胜.基于离散特性的飞行器姿态智能控制方法研究及实验设计[J].实验技术与管理,2024,41(3):83-92.
5赵文佳,石小伟,赵茜,杨璐,张艳丽,张亦敏.基于强化学习的盾构抗扰纠偏控制研究[J].隧道建设（中英文）,2024,44(2):282-287.
6龚传姣,祝龙记,王小虎.矿用宽输入电压DC/DC变换电源的研究[J].电力电子技术,2023,57(9):16-19.
7李良杰,李锦锦,杜丽艳.基于LVRT能力光伏电源的配电网继电保护增强技术研究[J].能源与环保,2024,46(2):216-222.
8方宁,董翔,梁参军,郝丽娟.基于BP神经网络PID的中子发生器离子源阳极电流控制研究[J].核电子学与探测技术,2024,44(1):94-100.
9Chenggang Wang,Jianhu Yan,Wenlong Li,Liang Shan,Le Sun.Disturbances rejection optimization based on improved two-degree-of-freedom LADRC for permanent magnet synchronous motor systems[J].Defence Technology（防务技术）,2024,33(3):518-531.
10王超,侯凯翔,吴铁洲,张强祥,张晓星.基于动态级联自抗扰的交流微网直流母线稳压控制[J].电力系统保护与控制,2024,52(7):115-124.

控制工程

2024年第4期

浏览历史

内容加载中请稍等...

基于Q学习的高超声速飞行器自抗扰控制研究

相关作者

相关机构

相关主题

浏览历史