基于强化学习的随机振动主动控制策略被引量：4

A active vibration control strategy based on reinforcement learning

下载PDF

导出

摘要针对被控系统的不确定性和非线性特征,提出了一种基于强化学习的随机振动主动控制策略。采用深度确定性策略梯度(DDPG)的强化学习算法设计振动控制器,该过程不涉及专家经验,完全由算法和数据自主交互学习完成。控制器是一个多层神经网络模型,这种由强化学习算法设计的控制器称为RL-NN控制器。通过两个数值仿真算例验证了RL-NN控制器的性能,其中考虑不确定性的单自由度系统主动控制效果达97%,考虑不确定性和非线性的车辆1/4悬架系统半主动控制效果达74%,结果表明RL-NN控制器对不确定性和非线性系统具有优异的振动控制能力。强化学习算法仅仅花费数小时设计的随机振动主动控制策略便优于专家经验数年来设计的控制策略,这为复杂系统振动主动/半主动控制器的设计提供了一种新的实现途径。 Concerning the uncertainty and nonlinearity of a controlled system,an active control strategy for random vibration based on reinforcement learning was proposed.The vibration controller was designed by a reinforcement learning algorithm-deep deterministic policy gradient(DDPG).This process does not involve expert experience and was entirely completed by the autonomous interactive learning of DDPG algorithms and data.The controller is a multi-layer neural network model,and this kind of controller designed by reinforcement learning algorithm is called neural network controller designed by reinforcement learning(RL-NN)controller.The performance of the RL-NN controller was verified through two numerical simulation examples:the active control effect of a single degree of freedom system with uncertainty reaches 97%.The semi-active control effect of the 1/4 vehicle suspension system with uncertainty and nonlinearity reaches 74%.The results show that the RL-NN controller has excellent vibration control capabilities for systems with uncertain and nonlinear.The random vibration active control strategy designed by the reinforcement learning algorithm in only a few hours is better than the control strategy designed by experts over few years.This provides a new approach to design active/semi-active controllers for complex systems.

作者周嘉明董龙雷孟超孙海亮 ZHOU Jiaming;DONG Longlei;MENG Chao;SUN Hailiang(State Key Laboratory for Strength and Vibration of Mechanical Structures,School of Aerospace Engineering,Xi’an Jiaotong University,Xi’an 710049,China;Beijing Institute of Astronautical Systems Engineering,Beijing 100076,China)

机构地区西安交通大学航天航空学院北京宇航系统工程研究所

出处《振动与冲击》 EI CSCD 北大核心 2021年第16期281-286,共6页 Journal of Vibration and Shock

基金战略火箭创新基金(Y20054)。

关键词强化学习神经网络不确定性非线性振动主动控制 reinforcement learning neural network uncertainty nonlinearity active vibration control

分类号 O328 [理学—一般力学与力学基础]

引文网络
相关文献

参考文献2

1Zhang Shunqi,Rdiger Schmidt,Qin Xiansheng.Active vibration control of piezoelectric bonded smart structures using PID algorithm[J].Chinese Journal of Aeronautics,2015,28(1):305-313. 被引量：9
2卜锋斌,蒋爱华.自适应控制算法在振动主动控制中的应用[J].噪声与振动控制,2014,34(2):46-49. 被引量：3

二级参考文献6

1汪光森,王乘.自适应主动噪声控制系统的仿真研究[J].电声技术,2004,28(8):57-59. 被引量：7
2尹建民,周雅莉,张奇志,关碧华.考虑约束的频域算法在有源噪声控制中的应用[J].噪声与振动控制,2004,24(3):18-21. 被引量：5
3陈克安,马远良.自适应有源消声与滤波-XLMS算法及实现[J].应用声学,1993,12(4):27-33. 被引量：10
4陈克安,尹雪飞.应用于多通道有源控制的自适应组合逆算法[J].信号处理,2006,22(3):366-369. 被引量：5
5赵剑,徐健,李晓东,田静.基于多模型的自适应有源噪声控制算法研究[J].振动工程学报,2007,20(6):549-555. 被引量：6
6张涛,周亚丽,张奇志.Filter-S LMS算法的非线性有源噪声控制的研究[J].噪声与振动控制,2008,28(2):62-65. 被引量：3

共引文献10

1胡世峰,朱石坚,何其伟.混合隔振系统逆解耦多线谱主动控制[J].噪声与振动控制,2015,35(5):25-29. 被引量：1
2Li Lin,Deng Pengcheng,Fan Yu.Dynamic characteristics of a cyclic-periodic structure with a piezoelectric network[J].Chinese Journal of Aeronautics,2015,28(5):1426-1437. 被引量：5
3黄武雄,沈建平,张志谊.多通道主动隔振中的通道窜扰抑制算法[J].噪声与振动控制,2016,36(2):176-179.
4张书扬,张顺琦,李靖,白晶,秦现生.基于PID算法的压电智能结构形状与主动振动控制[J].西北工业大学学报,2017,35(1):74-81. 被引量：9
5李明明,黄春蓉,方勃,段磊.主被动混合压电网络悬臂梁结构的建模与比较[J].振动与冲击,2017,36(3):98-104. 被引量：3
6张顺琦,于喜红,王战玺,秦现生.压电智能悬臂梁模糊振动抑制研究[J].振动工程学报,2017,30(1):110-117. 被引量：17
7白亮,冯蕴雯,薛小锋.压电智能结构振动的一致性PID(CPID)控制[J].振动与冲击,2017,36(22):192-198. 被引量：7
8Mariana MORETTI,Emilio C.N.SILVA.Topology optimization of piezoelectric bi-material actuators with velocity feedback control[J].Frontiers of Mechanical Engineering,2019,14(2):190-200. 被引量：1
9于香杰,游斌弟,魏承,赵阳,夏斌,刘朝旭.中性线修正型变截面梁类构件压电控制[J].力学学报,2022,54(1):209-219. 被引量：1
10Dongyang SHANG,Xiaopeng LI,Men YIN,Sainan ZHOU.Vibration suppression for rotating space slender flexible structures based on novel deformation description and NNSMC controller with hyperbolic tangent function[J].Chinese Journal of Aeronautics,2024,37(10):339-364.

同被引文献50

1丰志强,阎楚良,张书明.飞机机载设备振动环境谱的数据处理与编制[J].航空学报,2006,27(2):289-293. 被引量：22
2陈双,宗长富,刘立国.主动悬架车辆平顺性和操纵稳定性协调控制的联合仿真[J].汽车工程,2012,34(9):791-797. 被引量：15
3宋攀,董兴建,孟光.柔性基础主动隔振系统的缩聚建模和时滞问题研究[J].振动与冲击,2012,31(23):57-61. 被引量：6
4李运动,孙树旺.机载稳定框架平台减振特性设计与分析[J].机械强度,2014,36(1):30-34. 被引量：10
5李美超,陈龙祥,蔡国平.不确定线性时滞系统模型参考自适应控制研究[J].应用力学学报,2018,35(6):1207-1213. 被引量：6
6李睿,李学森,刘璇,徐红.数字化模拟振动台液压系统模型的建立与分析[J].机床与液压,2015,43(7):13-17. 被引量：1
7袁秋帆,刘延芳,马明阳,齐乃明.集成压电元件的挠性太阳帆板振动抑制控制系统[J].振动与冲击,2016,35(9):86-93. 被引量：3
8罗梦翔,高明周,蔡国平.机翼颤振的时滞反馈控制研究[J].振动与冲击,2016,35(18):58-61. 被引量：3
9丁有爽,肖曦.基于极点配置的永磁同步电机驱动柔性负载PI调节器参数确定方法[J].中国电机工程学报,2017,37(4):1225-1238. 被引量：32
10孙洪鑫,李建强,王修勇,方聪.基于磁致伸缩作动器的拉索主动控制时滞补偿研究[J].振动与冲击,2017,36(14):208-215. 被引量：8

引证文献4

1张聪,刘爽,姜思远,刘世纪.多作动器协同的特种车辆行车调平控制方法[J].兵工学报,2023,44(1):98-107. 被引量：4
2李娟,邱瑞康,李生权,崔荣华,张禄进.智能结构振动实验教学平台的设计与实现[J].实验室研究与探索,2023,42(11):141-145.
3张猛,王晓宇,文浩.时滞影响下压电悬臂梁强化学习振动控制[J].振动与冲击,2024,43(16):77-83.
4蔡赫,李科,王燕波,邓松波,陈志鸿.机载悬臂体结构的主被动联合抑振[J].应用力学学报,2024,41(5):1015-1026.

二级引证文献4

1鞠爽,王晶,王灏,周萌.基于GWO-WOA的执行器严重故障多移动机器人编队重构控制[J].兵工学报,2023,44(S02):114-125.
2郭庚鑫,王帅,李阁强,董振乐,毛波,于善利.基于遗传算法的重型特种车辆主动悬架H_(2)/H_(∞)控制研究[J].河南科技学院学报（自然科学版）,2024,52(2):65-75. 被引量：1
3赵龙飞,苏娟,张圣卓,李荣.基于动态基准误差分析的多作动器协同调平控制方法[J].自动化应用,2024,65(7):156-158.
4商涛,鲍成文,寇士营,王文宗,石震宇.一种太阳翼对接用调姿机构虚腿调平策略[J].航天控制,2024,42(4):78-84.

1陈添定,杨铎,李鹤.非线性磨削中颤振抑制的研究[J].制造技术与机床,2021(8):175-178.
2黄皓.跨学科融合教学的实践探索——以“原电池内的化学反应”为例[J].基础教育参考,2021,12(8):45-47. 被引量：1
3李金桥,吴红英.核心素养下初中几何知识跨学科试题设计初探——几何知识在初中物理光学中的应用[J].中学数学教学,2021(4):30-33. 被引量：4
4孙培东,张婷婷.社区学习共同体的内涵与价值解析[J].中国成人教育,2021(11):63-68. 被引量：1
5林泽宏,李敬光,陈威洪,张鑫,赖伟坚,余涛.基于交互式教-学优化算法的阴影条件下光伏系统最大功率跟踪[J].电测与仪表,2021,58(8):154-159. 被引量：3
6刘磊,张燕.基于自适应匹配的矢量图符号模糊识别仿真[J].计算机仿真,2021,38(7):401-404. 被引量：1

振动与冲击

2021年第16期

浏览历史

内容加载中请稍等...

基于强化学习的随机振动主动控制策略被引量：4

参考文献2

二级参考文献6

共引文献10

同被引文献50

引证文献4

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于强化学习的随机振动主动控制策略 被引量：4

参考文献2

二级参考文献6

共引文献10

同被引文献50

引证文献4

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于强化学习的随机振动主动控制策略被引量：4