基于增量式策略强化学习算法的飞行控制系统的容错跟踪控制被引量：3

Fault-tolerant tracking control for continuous flight control system based on reinforcement learning algorithm with incremental strategy

下载PDF

导出

摘要针对发生故障的飞行控制系统,在强化学习算法的基础上,提出了一种基于增量式策略的强化学习容错方法.本方法利用传感器获取的系统状态值,根据系统预先设定的奖励函数对当前控制系统状况做出最优的决策并不断更新价值网络,将系统的容错控制过程转换为强化学习Agent的贯序决策过程,并使用一种改进型的增量式策略实现对当前故障的正确补偿策略的逐渐逼近.同时,针对连续控制系统,提出一种状态转移预测网络来得到下一步状态值.最后,通过南京航空航天大学“先进飞行器导航、控制与健康管理”工信部重点实验室的飞行器故障诊断实验平台验证了该方法的有效性. A reinforcement learning method based on incremental strategy is proposed to make fault-tolerant tracking control for continuous flight control system with faults.The system state value obtained by the sensor is used in the method proposed by this paper,The fault-tolerant system makes optimal decisions on the current control system conditions based on pre-set reward functions and continuously updates the value network,This transforms the fault-tolerant control process of the system into a sequential decision-making process of the reinforcement learning agent,and gradually approximates the specific fault value using an improved incremental strategy.what’s more,A state transition prediction network is proposed for the continuous control system to obtain the next state value.Finally,The effectiveness of the proposed method is verified by the aircraft fault diagnosis experimental platform of the Key Laboratory of Advanced Aircraft Navigation,Control and Health Management of Nanjing University of Aeronautics and Astronautics.

作者任坚刘剑慰杨蒲 REN Jian;LIU Jian-wei;YANG Pu(College of Automation Engineering,Nanjing University of Aeronautics and Astronautics,Nanjing Jiangsu 211106,China)

机构地区南京航空航天大学自动化学院

出处《控制理论与应用》 EI CAS CSCD 北大核心 2020年第7期1429-1438,共10页 Control Theory & Applications

基金民航飞机健康监测与智能维护重点实验室基金项目(NJ2018012) 先进飞行器导航、控制与健康管理工业和信息化部重点实验室(南京航空航天大学)项目中央高校基本科研业务费项目(NS2017017) 国家自然科学基金项目(61533008,61490703)资助。

关键词飞行控制系统故障诊断故障容错强化学习 Q-learning算法增量式策略状态转移预测网络 flight control systems fault diagnosis fault tolerance reinforcement learning Q-learning algorithm incremental strategy state transition prediction

分类号 V249 [航空宇航科学与技术—飞行器设计]

引文网络
相关文献

参考文献7

1姜斌,杨浩.飞控系统主动容错控制技术综述[J].系统工程与电子技术,2007,29(12):2106-2110. 被引量：24
2余伶俐,邵玄雅,龙子威,魏亚东,周开军.智能车辆深度强化学习的模型迁移轨迹规划方法[J].控制理论与应用,2019,36(9):1409-1422. 被引量：25
3张柯,姜斌.基于故障诊断观测器的输出反馈容错控制设计[J].自动化学报,2010,36(2):274-281. 被引量：42
4杨荟憭,姜斌,张柯.四旋翼直升机姿态系统的直接自修复控制[J].控制理论与应用,2014,31(8):1053-1060. 被引量：24
5ZHANG Ying-Wei,ZHOU Hong,QIN S. Joe.Decentralized Fault Diagnosis of Large-scale Processes Using Multiblock Kernel Principal Component Analysis[J].自动化学报,2010,36(4):593-597. 被引量：23
6周东华,DingX.容错控制理论及其应用[J].自动化学报,2000,26(6):788-797. 被引量：98
7刘聪,钱坤,李颖晖,刘勇智,丁奇.一体化执行器饱和线性矩阵不等式跟踪容错控制器设计[J].控制理论与应用,2019,36(1):79-86. 被引量：7

二级参考文献92

1耿淼,姜斌,郭玉英,杨浩.执行器故障参数不可测飞行系统的模型跟踪重构控制[J].东南大学学报（自然科学版）,2009,39(S1):177-182. 被引量：2
2韩兵,陈新海.导弹的最小方差容错控制[J].航空学报,1993,14(7). 被引量：1
3南英,陈士橹.容错控制进展[J].航空与航天,1993(4):62-67. 被引量：4
4赵亚斌,高金源.多模型方法在飞控系统故障重构控制中的应用[J].飞行力学,2004,22(3):76-79. 被引量：3
5陈茂银,周东华.一类非线性系统的故障诊断[J].自动化学报,2004,30(6):1011-1016. 被引量：10
6孙金生,李军,冯缵刚,胡寿松.鲁棒容错控制系统设计[J].控制理论与应用,1994,11(3):376-380. 被引量：36
7胡泽新.多变量系统故障诊断和容错控制新方法及其在精馏过程中的应用[J].控制与决策,1994,9(4):286-290. 被引量：1
8周东华,王庆林.基于模型的控制系统故障诊断技术的最新进展[J].自动化学报,1995,21(2):244-248. 被引量：33
9葛建华,孙优贤,周春晖.故障系统容错能力判别的研究[J].信息与控制,1989,18(4):8-12. 被引量：5
10孙金生,李军,王执铨.离散系统鲁棒容错线性调节器设计[J].控制与决策,1996,11(1):68-72. 被引量：11

共引文献233

1罗鑫辉,戴邵武,戴洪德.基于改进自适应卡尔曼滤波的容错控制[J].信息与控制,2020,49(1):122-128. 被引量：7
2黄孝彬,刘吉臻,牛玉广.控制系统执行机构故障的检测与诊断[J].控制工程,2003,10(z1):165-169. 被引量：9
3韩忠旭.广义智能控制的稳定鲁棒性与容错能力[J].控制工程,2010,17(4):486-493.
4李洁,姜斌,刘春生.基于T-S模糊模型的飞控系统故障诊断研究[J].控制工程,2009,16(S3):71-73.
5吴忠强,奥顿,刘坤,王子洋.不确定非线性系统的模糊保性能容错控制[J].系统仿真学报,2004,16(5):1105-1107. 被引量：9
6王敏,臧曙,周东华.非线性动态系统的容错控制[J].计算技术与自动化,2004,23(4):7-10. 被引量：8
7任俊超,胡刚.参数不确定广义系统鲁棒H_∞容错控制器的设计[J].电机与控制学报,2003,7(1):43-46. 被引量：1
8朱宝彦,张庆灵,笪可宁,李海燕.参数不确定的广义T-S模糊系统的鲁棒容错保性能控制[J].东北大学学报（自然科学版）,2005,26(7):613-616. 被引量：8
9吴建国,张培建,吴建国,张培建.容错控制在DCS中的应用[J].电气自动化,2005,27(4):71-73.
10李善田.容错控制在浓硝酸高压反应釜中的应用研究[J].工业控制计算机,2006,19(11):83-85.

同被引文献54

1苗建国,王剑宇,张恒,苗强.无人机故障诊断技术研究进展概述[J].仪器仪表学报,2020(9):56-69. 被引量：24
2曹杭炜,李秀娟.OLS算法在无人机传感器故障诊断中的应用[J].飞机设计,2006,26(2):56-59. 被引量：6
3赵志刚,赵伟.基于动态不确定度理论的多传感器系统传感器失效检测方法[J].传感技术学报,2006,19(6):2723-2726. 被引量：15
4胡晓煜.无人机推进系统技术研究[J].燃气涡轮试验与研究,2008,21(1):58-61. 被引量：3
5孙玉绘,李璐,吴峻.定位传感器异常信号处理的方法[J].传感器与微系统,2008,27(6):56-58. 被引量：1
6张娅玲,陈伟民,章鹏,胡顺仁,黄晓微,郑伟.传感器故障诊断技术概述[J].传感器与微系统,2009,28(1):4-6. 被引量：43
7王海斌,葛雪雁,宋玉珍.无人机的发展趋势与技术预测[J].飞航导弹,2009(11):46-52. 被引量：19
8车录锋,周晓军,程耀东.考虑传感器失效的多传感器加权数据融合算法[J].工程设计学报,1999,6(1):38-40. 被引量：13
9吴浩中,戴小文,王开文.摆式列车用传感器的故障检测与识别[J].测控技术,2001,20(6):19-21. 被引量：4
10高云红,赵丁,李一波.基于LS_SVM与PCA的小型无人机传感器故障诊断[J].火力与指挥控制,2014,39(7):111-114. 被引量：3

引证文献3

1郭冬子,黄荣,许河川,孙立伟,崔乃刚.再入飞行器深度确定性策略梯度制导方法研究[J].系统工程与电子技术,2022,44(6):1942-1949. 被引量：1
2刘金富,黄頔,王文林.无人机故障诊断研究进展[J].控制工程,2022,29(3):428-434. 被引量：6
3杨凡,黄颖,陈云松,曾皓.基于微分几何反馈线性化的高超声速飞行器控制系统实现[J].计算机测量与控制,2022,30(12):125-130. 被引量：1

二级引证文献8

1周国峰,严大卫,梁卓.基于强化学习的冲压发动机飞行器爬升段轨迹优化控制[J].中国惯性技术学报,2022,30(1):135-140. 被引量：1
2黄庆南,祁静茹,戴喜生,吴其琦.基于观测器的四旋翼无人机故障诊断方法[J].广西科技大学学报,2023,34(2):69-75. 被引量：1
3赵章红,常升龙,赵迪,陈琳,胡昊,张丹.基于UAV-RS虚拟仿真系统的教学模式探究[J].控制工程,2023,30(9):1606-1615.
4安雪,李少波,张仪宗,张安思.无人机飞控系统故障诊断技术研究综述[J].计算机工程与应用,2023,59(24):1-15. 被引量：2
5桑可可,祖家奎,叶晓宇,刘世龙.无人机多源冗余传感器容错估计算法研究[J].机械与电子,2024,42(1):47-52.
6高红彦.电子信息装备运行策划探讨[J].电子质量,2024(5):101-105. 被引量：1
7莫文静,宋博文,柯旭,曹琪,向胜华.基于多信号流图的大气数据系统故障诊断[J].测控技术,2024,43(5):66-71.
8景丽.“微分几何”的直观性、研究性教学[J].科技风,2024(26):115-117.

1顾江涛,胡新平.基于深度强化学习的无人机飞行路线规划[J].计算机与数字工程,2020,48(6):1372-1378. 被引量：3
2彭阳,余芳强,许璟琳.基于长短期记忆网络的空调机组故障诊断与风险评估[J].计算机应用,2020,40(S01):248-252.
3肖坚.基于强化学习的大数据频繁项集挖掘算法[J].信息通信,2020(6):62-63. 被引量：1
4孙嘉浩,陈劲杰.基于强化学习的无人驾驶仿真研究[J].农业装备与车辆工程,2020,58(6):102-106.
5张瑞瑞,夏浪,陈立平,谢春春,陈梅香,王维佳.基于U-Net网络和无人机影像的松材线虫病变色木识别[J].农业工程学报,2020,36(12):61-68. 被引量：27
6李诗瑶.采煤机检测系统研究设计[J].自动化应用,2020(5):41-43. 被引量：1
7张兆峰.信息化时代初中英语教师专业发展初探[J].校园英语,2020(21):233-233.
8陈杏琼.中职英语技能大赛赛项内容渗透到英语课堂教学的策略研究[J].校园英语,2020(19):46-47.
9马婉春.大数据时代学校体育改革与发展探究[J].山海经,2020(14):0052-0052.
10盛建国.物理实验教学中学生经验分享的有效策略[J].新课程研究,2020(16):37-39. 被引量：2

控制理论与应用

2020年第7期

浏览历史

内容加载中请稍等...

基于增量式策略强化学习算法的飞行控制系统的容错跟踪控制被引量：3

参考文献7

二级参考文献92

共引文献233

同被引文献54

引证文献3

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

基于增量式策略强化学习算法的飞行控制系统的容错跟踪控制 被引量：3

参考文献7

二级参考文献92

共引文献233

同被引文献54

引证文献3

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

基于增量式策略强化学习算法的飞行控制系统的容错跟踪控制被引量：3