基于近似Q-学习算法的数据驱动控制仿真被引量：1

Data Driven Control Simulation Based on Approximate Q-Learning Algorithm

下载PDF

导出

摘要为解决依赖受控系统数学模型而导致的数据驱动控制性能不完善,控制跟踪结果误差较大的问题,提出一种基于近似Q-学习算法的数据驱动控制方法。为使Q被充分学习,在时间轴的立即回报序列上估计训练值,因此修改确定性规则,使其采用当前Q值和修正后估计衰减值计算加权平均值计算,实现算法收敛。采用以Q-学习算法为结构的控制器代替受控数据当前工作点的一般非线性模型,并且仅使用被控对象提供的数据来评估模型中的伪偏导函数,实现无模型数据驱动控制。仿真结果证明,所提方法的信号扰动较小,且控制跟踪结果误差较小,整体性能要优于传统方法。 A data-driven control method based on approximate Q-learning algorithm is proposed to solve the problems of imperfect data-driven control performance and large error of control tracking results caused by relying on the mathematical model of the controlled system.In order to make Q be fully learned,the training value was estimated on the immediate return sequence of the time axis,so that the deterministic rule was modified.Then,the weighted average value was calculated based on current Q value and the estimated attenuation value after the correction,so that the convergence of algorithm was achieved.The controller based on Q-learning algorithm was used to replace the general nonlinear model of the current working point of the controlled data.Meanwhile,only the data provided by the controlled object were used to evaluate the pseudo partial derivative in model.Finally,the data-driven control without model was completed.Simulation results show that the proposed method has smaller signal disturbance and smaller error in control and track,so its overall performance is better than the traditional method.

作者于子航王改云 YU Zi-hang;WANG Gai-yun(School of Electrical Engineering and Automation,Guilin University of Electronic Technology,Guilin Guangxi 541000,China)

机构地区桂林电子科技大学花江校区电子工程与自动化学院

出处《计算机仿真》北大核心 2022年第5期344-347,379,共5页 Computer Simulation

关键词数据驱动控制衰减值估计非线性离散模型伪偏导函数 Data-driven control Attenuation estimation Nonlinear discrete model Pseudo partial derivative

分类号 TP472 [自动化与计算机技术]

引文网络
相关文献

参考文献12

1尹二新,董泽,曹晓玲.基于状态寻优的工业系统动态数据驱动建模[J].计算机仿真,2018,35(5):133-136. 被引量：3
2黄朝志,王兵兵,刘赣伟,陈海东.基于加加速度连续的函数逼近加减速算法[J].机械设计与制造,2018(11):150-153. 被引量：5
3张风云,李傅山,陈祥平.非线性粘弹性Klein-Gordon方程的一致衰减（英文）[J].应用数学,2019,32(2):262-271. 被引量：1
4张明锐,宋柏慧,王佳莹,韦莉.基于模型预测控制的固态变压器控制策略研究[J].电力系统保护与控制,2019,47(1):129-137. 被引量：15
5杨帆,张燕,李晓晓.拟逆正则化方法结合离散随机扰动反演初值问题[J].兰州理工大学学报,2019,45(3):153-158. 被引量：2
6范永青,王文庆,江祥奎,刘颖.一类不确定非线性离散系统的模糊自适应控制器设计[J].控制与决策,2019,34(3):542-548. 被引量：4
7苏鹏,田茂再.基于最小化复合分位损失函数的尺度参数估计和异质性检验[J].系统科学与数学,2018,38(9):1055-1066. 被引量：6
8李晓理,王康,于秀明,苏伟.基于CPS框架的微粉生产过程多模型自适应控制[J].自动化学报,2019,45(7):1354-1365. 被引量：8
9蒋峰岭,张海涛,杨静,孔斌.背景吸收的马尔可夫显著性目标检测[J].中国图象图形学报,2018,23(6):857-865. 被引量：1
10殷林飞,余涛.基于深度Q学习的强鲁棒性智能发电控制器设计[J].电力自动化设备,2018,38(5):12-19. 被引量：14

二级参考文献75

1徐创文.数控进给系统加减速控制研究[J].仪器仪表学报,2002,23(z1):360-362. 被引量：9
2张化光,王智良,黎明,全永兵,张明君.广义模糊双曲正切模型:一个万能逼近器[J].自动化学报,2004,30(3):416-422. 被引量：19
3王伟,易建强,赵冬斌,刘殿通.桥式吊车系统的分级滑模控制方法[J].自动化学报,2004,30(5):784-788. 被引量：34
4王佐伟,吴宏鑫.非线性离散时间系统的自适应模糊补偿控制[J].控制与决策,2005,20(2):147-151. 被引量：3
5李加文,陈宗雨,李从心.基于函数逼近的三角函数加减速方法[J].机床与液压,2006,34(3):66-67. 被引量：16
6龙汉,谌永祥,李永桥.NURBS曲线实时插补算法研究[J].机械设计与制造,2006(5):3-5. 被引量：8
7陈友东,王田苗,魏洪兴,潘月斗.数控系统的直线和S形加减速研究[J].中国机械工程,2006,17(15):1600-1604. 被引量：55
8邓良才,王广军,陈红.锅炉汽温对象的在线模糊辨识[J].中国电机工程学报,2006,26(18):111-115. 被引量：12
9侯忠生.无模型自适应控制的现状与展望[J].控制理论与应用,2006,23(4):586-592. 被引量：119
10郭雷,魏晨.基于LS算法的离散时间非线性系统自适应控制——可行性及局限性[J].中国科学（A辑）,1996,26(4):289-299. 被引量：4

共引文献59

1吴漾,王鹏宇,缪新萍,柳林溪,田钺.基于改进深度强化学习算法的电网缺陷文本挖掘模型研究[J].科技通报,2021,37(2):47-55. 被引量：4
2许杨子,强文,刘俊,孙鸿雁,胡成刚.基于改进深度强化学习算法的电力市场监测模型研究[J].国外电子测量技术,2020,39(1):82-87. 被引量：4
3杨挺,赵黎媛,王成山.人工智能在电力系统及综合能源系统中的应用综述[J].电力系统自动化,2019,43(1):2-14. 被引量：207
4戴彦,王刘旺,李媛,颜拥,韩嘉佳,文福拴.新一代人工智能在智能电网中的应用研究综述[J].电力建设,2018,39(10):1-11. 被引量：50
5吴倩,范家璐,姜艺,柴天佑.无线网络环境下数据驱动混合选别浓密过程双率控制方法[J].自动化学报,2019,45(6):1122-1135. 被引量：5
6刘佳男,孙宗耀,刘彩云.基于新传感器排布的电磁导航式智能车循迹算法研究[J].曲阜师范大学学报（自然科学版）,2019,45(4):59-64. 被引量：2
7陶彩霞,赵凯旋,牛青.考虑滑模抖振的永磁同步电机模糊超螺旋滑模观测器[J].电力系统保护与控制,2019,47(23):11-18. 被引量：29
8徐航,张依恋,朱瑾,范勤勤.基于模型预测的自动导引车区间轨迹跟踪控制[J].控制理论与应用,2020,37(1):23-30. 被引量：4
9吴熙,唐子逸,徐青山,周亦洲.基于Q学习算法的综合能源系统韧性提升方法[J].电力自动化设备,2020,40(4):146-152. 被引量：10
10曹朝阳,吴庆涛.信息数据融合技术支持下的自动化制造管理系统设计[J].制造业自动化,2020,42(5):125-128. 被引量：7

同被引文献18

1谢敏.大数据背景下企业档案馆数据能力建设[J].中国档案,2015,0(2):56-58. 被引量：7
2许建新,侯忠生.学习控制的现状与展望[J].自动化学报,2005,31(6):943-955. 被引量：75
3王协舟,王露露.“互联网＋”时代对档案工作的挑战[J].档案学研究,2016(6):66-69. 被引量：46
4祝振媛,李广建.“数据—信息—知识”整体视角下的知识融合初探——数据融合、信息融合、知识融合的关联与比较[J].情报理论与实践,2017,40(2):12-18. 被引量：52
5何嘉荪,张淑霞.大数据引发的思考——哲学界相关讨论的启示[J].浙江档案,2017,0(6):8-11. 被引量：11
6陶水龙.海量档案数字资源智能管理及挖掘分析方法研究[J].档案学研究,2017(6):75-79. 被引量：30
7刘越男.大数据政策背景下政务文件归档面临的挑战[J].档案学研究,2018(2):107-114. 被引量：63
8田力.“数据驱动环境下图情档学科前沿学术论坛”成功举办[J].情报资料工作,2018,39(4):107-107. 被引量：1
9杨来青.大数据背景下档案信息资源挖掘策略与方法研究[J].中国档案,2018(8):60-61. 被引量：30
10李颖.数据时代档案服务实现的动力原理研究[J].档案学通讯,2018,0(5):8-12. 被引量：7

引证文献1

1巩淑芳.DT时代基于DIKW模型的档案数据驱动过程解析[J].兰台世界,2023(9):54-58.

1张书波,钟廷勇,贾宇明.能量制约耦合比值一致性约束的图像匹配算法[J].电子测量与仪器学报,2020,32(3):9-16. 被引量：4
2景慧丽,方晓峰.一道求二阶偏导数题目的解法探讨[J].高等数学研究,2020,23(2):30-32.
3董伯麟,杨瑞伟.串联弹性驱动器的设计及力矩控制研究[J].机械设计与制造,2022(6):167-171.
4李云峰,杨店飞.低通滤波器调节下逆变器的不稳定现象分析[J].电工电气,2022(6):30-35.
5胡玉林,华宇,刘扬,吴增强.超灵敏检测中信号扰动分析及应用[J].分析化学进展,2022,12(2):111-124.
6盛蔚,张玉民.基于云平台的远程实验条件建设与科研实践[J].实验室科学,2022,25(2):85-89. 被引量：1
7李欣雪,花元涛,龙小丽.多模态电磁涡旋波复用天线通信误差控制仿真[J].计算机仿真,2022,39(5):196-200.
8查蕾蕾,黄亚宇,杜林昕.基于EDEM的滚筒烘丝过程物料运动行为研究[J].农业装备与车辆工程,2022,60(6):32-35.
9王浩.电气传动设备低频-前馈复合控制技术[J].机械与电子,2022,40(5):57-60.
10钟荣花,韦维.一类带逻辑脉冲线性系统的最优控制问题[J].应用数学,2022,35(3):722-730. 被引量：1

计算机仿真

2022年第5期

浏览历史

内容加载中请稍等...

基于近似Q-学习算法的数据驱动控制仿真被引量：1

参考文献12

二级参考文献75

共引文献59

同被引文献18

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于近似Q-学习算法的数据驱动控制仿真 被引量：1

参考文献12

二级参考文献75

共引文献59

同被引文献18

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于近似Q-学习算法的数据驱动控制仿真被引量：1