一种通过强化学习的四旋翼姿态控制算法被引量：4

Quadrotor Attitude Control Algorithm Based on Reinforcement Learning

下载PDF

导出

摘要本文提出通过深度强化学习实现四旋翼姿态控制.通过对深度强化学习中的近端策略优化实现姿态稳定的控制学习任务.飞行器直接通过神经网络进行训练,直接将状态输入映射到控制输出.其次提出一种崭新的算法通过将传统的控制模型引入来提高强化学习算法的训练速度.经过实验验证,该算法可以有效控制四旋翼在任意姿态下的稳定性,且该算法可以在比一般强化学习方法更具泛用性更快收敛. In this paper,through deep reinforcement learning,a quadrotor attitude control algorithm was proposed.Through the optimization of the proximal policy optimization in deep reinforcement learning,the learning of control task with stable attitude is realized.The aircraft is trained directly through the neural network and directly maps the state input to the actuators.Secondly,a newalgorithm is proposed to improve the training speed of the reinforcement algorithm by introducing the traditional control model.Experiments showthat the algorithm can effectively stabilize the quadcopter in any attitude,and the algorithm can be more general and faster convergence than the general reinforcement learning algorithm.

作者贾振宇刘子龙 JIA Zhen-yu;LIU Zi-long(School of Optical-Electrical and Computer Engineering,University of Shanghai for Science and Technology,Shanghai 200093,China)

机构地区上海理工大学光电信息与计算机工程学院

出处《小型微型计算机系统》 CSCD 北大核心 2021年第10期2074-2078,共5页 Journal of Chinese Computer Systems

基金国家自然科学基金项目(61573246)资助。

关键词深度强化学习四旋翼无人机自然梯度下降姿态控制 deep reinforcement learning quadrotor nature gradient descent attitude control

分类号 TP24 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献2

1郭妍,吴美平,唐康华,王雪莹.基于积分反步法的四旋翼飞行器控制设计[J].智能科学与技术学报,2019,0(2):133-139. 被引量：4
2Huan HU,Qing-ling WANG.Proximal policy optimization with an integral compensator for quadrotor control[J].Frontiers of Information Technology & Electronic Engineering,2020,21(5):777-795. 被引量：6

二级参考文献3

1姚乐,管业鹏,金星.基于改进单神经元的四旋翼PID控制器设计[J].计算机测量与控制,2016,24(4):68-70. 被引量：3
2滕雄,吴怀宇,陈洋,余辉.基于反步法的四旋翼飞行器轨迹跟踪研究[J].计算机仿真,2016,33(5):78-83. 被引量：20
3Hossein Bolandi,Mohammad Rezaei,Reza Mohsenipour,Hossein Nemati,S. M. Smailzadeh.Attitude Control of a Quadrotor with Optimized PID Controller[J].Intelligent Control and Automation,2013,4(3):335-342. 被引量：14

共引文献8

1方星辰,崔鹏,王庆领.SC2LE场景下基于QMIX算法的多智能体协同控制[J].指挥信息系统与技术,2021,12(2):21-26. 被引量：1
2刘安林,时正华.基于DDPG策略的四旋翼飞行器目标高度控制[J].陕西科技大学学报,2021,39(6):141-147. 被引量：1
3魏彬,唐凤轩,梁畅,张爱军.基于变论域模糊PID的航空转台控制系统研究[J].北京化工大学学报（自然科学版）,2022,49(2):107-115. 被引量：3
4杨兴昊,宋建梅,佘浩平,吴程杰,杨钦宁,付伟达.基于深度强化学习的无人机空中目标自主跟踪[J].计算机测量与控制,2022,30(10):88-94. 被引量：2
5郭大力,赵中原,罗子娟.基于极值搜索的四旋翼无人机姿态跟踪控制[J].智能科学与技术学报,2023,5(4):486-493.
6黄鹤,谢飞宇,杨澜,王会峰,高涛,无.四旋翼无人机滑模-CPCMAC联合控制半物理仿真系统[J].复旦学报（自然科学版）,2024,63(1):1-17.
7杨宗月,刘磊,刘晨.基于PPO算法的四旋翼无人机位置控制[J].计算机仿真,2024,41(2):462-467.
8曹凡,王军,张驰宸,鲍尚华,谢姜琪,杨玉充.全驱动倾转四旋翼式飞枪的建模与控制[J].上海航天（中英文）,2024,41(3):159-166.

同被引文献35

1张广玉,张洪涛,李隆球,王林.四旋翼微型飞行器设计[J].哈尔滨理工大学学报,2012,17(3):110-114. 被引量：25
2韩京清.从PID技术到“自抗扰控制”技术[J].控制工程,2002,9(3):13-18. 被引量：778
3杨航,刘凌,阎治安,杨娴.双闭环Buck变换器系统模糊PID控制[J].西安交通大学学报,2016,50(4):35-40. 被引量：44
4卢捡森,马龙,裴昕,黄超,周德新,苏志刚.多传感器可变参数互补滤波算法设计[J].电光与控制,2017,24(2):30-34. 被引量：4
5姜雪莹,苏成利,徐亚鹏,刘凯,施惠元,李平.四旋翼无人机飞行姿态的自适应反演滑模控制（英文）[J].Journal of Central South University,2018,25(3):616-631. 被引量：16
6张建扬,于春梅,叶剑晓.基于扩张状态观测器和反步滑模法的四旋翼无人机轨迹跟踪控制[J].计算机应用,2018,38(9):2742-2746. 被引量：13
7卢艳军,陈雨荻,李元龙.四旋翼飞行器姿态解算算法试验研究[J].电光与控制,2019,26(11):45-50. 被引量：7
8胡文华,曹仁赢.改进粒子群优化算法的四旋翼ADRC姿态控制[J].电光与控制,2019,26(12):12-16. 被引量：9
9张萍.四旋翼飞行器姿态控制建模与仿真[J].电机与控制应用,2019,46(12):70-74. 被引量：7
10邵星灵,刘俊,李东光.面向目标对峙跟踪的四旋翼协同编队控制方法[J].无人系统技术,2020,3(1):11-18. 被引量：3

引证文献4

1田欣然,邵星灵,张飞.基于非线性自抗扰的四旋翼姿态控制[J].无人系统技术,2022,5(6):86-93. 被引量：1
2戴宇轩,崔承刚.基于深度强化学习的Boost变换器控制策略[J].系统仿真学报,2023,35(5):1109-1119.
3弋英民,王柯颖,苑易伟,薛向宏,李余兴,刘柏均,王烨琛.基于扩展卡尔曼滤波的固定翼无人机姿态解算方法[J].小型微型计算机系统,2023,44(11):2384-2391.
4李彦铃,罗飞舟,葛致磊.基于鲁棒观测器的深度强化学习垂直起降运载器姿态稳定研究[J].系统工程与电子技术,2024,46(3):1038-1047.

二级引证文献1

1王栋,吕洋,马子飞.控制输入受限无人机轨迹跟踪与防撞一体化导引控制[J].无人系统技术,2023,6(2):52-60. 被引量：1

1黄智,张建强,苏润丛.基于混合滤波的四旋翼无人机抗干扰姿态控制系统设计[J].计算机测量与控制,2021,29(9):105-109. 被引量：4
2焦东丹.基于机器学习的经济周期对银行信贷影响的研究[J].市场周刊·理论版,2021(27):128-129.
3周诗嘉,杨光源,彭光强,武霁阳,辛清明.基于18相风力发电系统的最大功率跟踪控制策略研究[J].湖南电力,2021,41(5):14-21. 被引量：4
4艾廷华.深度学习赋能地图制图的若干思考[J].测绘学报,2021,50(9):1170-1182. 被引量：30
5刘青,张彤钰,田艳军.直流配电网光伏变流器柔性出力自适应分段下垂控制[J].电力建设,2021,42(10):60-70. 被引量：7

小型微型计算机系统

2021年第10期

浏览历史

内容加载中请稍等...

一种通过强化学习的四旋翼姿态控制算法被引量：4

参考文献2

二级参考文献3

共引文献8

同被引文献35

引证文献4

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

一种通过强化学习的四旋翼姿态控制算法 被引量：4

参考文献2

二级参考文献3

共引文献8

同被引文献35

引证文献4

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

一种通过强化学习的四旋翼姿态控制算法被引量：4