-
题名融合自适应评判的随机系统数据驱动策略优化
- 1
-
-
作者
王鼎
王将宇
乔俊飞
-
机构
北京工业大学信息学部
计算智能与智能系统北京市重点实验室
北京人工智能研究院
智慧环保北京实验室
-
出处
《自动化学报》
EI
CAS
CSCD
北大核心
2024年第5期980-990,共11页
-
基金
国家自然科学基金(62222301,61890930-5,62021003)
科技创新2030——“新一代人工智能”重大项目(2021ZD0112302,2021ZD0112301)资助。
-
文摘
自适应评判技术已经广泛应用于求解复杂非线性系统的最优控制问题,但利用其求解离散时间非线性随机系统的无限时域最优控制问题还存在一定局限性.本文融合自适应评判技术,建立一种数据驱动的离散随机系统折扣最优调节方法.首先,针对宽松假设下的非线性随机系统,研究带有折扣因子的无限时域最优控制问题.所提的随机系统Q-learning算法能够将初始的容许策略单调不增地优化至最优策略.基于数据驱动思想,随机系统Q-learning算法在不建立模型的情况下直接利用数据进行策略优化.其次,利用执行−评判神经网络方案,实现了随机系统Q-learning算法.最后,通过两个基准系统,验证本文提出的随机系统Q-learning算法的有效性.
-
关键词
自适应评判设计
数据驱动
离散系统
神经网络
Q-LEARNING
随机最优控制
-
Keywords
Adaptive critic design
data-driven
discrete-time systems
neural networks
Q-learning
stochastic optimal control
-
分类号
TP13
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于非线性拟合的电容传感器测量
被引量:1
- 2
-
-
作者
秦娟
王将宇
李琨
姜道连
吕联荣
-
机构
天津理工大学集成电路科学与工程学院
-
出处
《实验室科学》
2022年第1期51-54,57,共5页
-
基金
2019年教育部产学合作协同育人项目(项目编号:201902094003)
天津理工大学重点教学改革项目(项目编号:ZD19-09)。
-
文摘
针对电容传感器的非线性严重影响工程中的测量,进行非线性校正。采用拉格朗日插值算法,对电容值进行拟合,对以往的单点校准改进为分段三点校准,改善了测量精度。设计的方案采用STM32为微控制器,以两片平行板电容器作为纸张厚度信息采集设备,使用CD4046将采集的电容值转换为不同频率的方波信号,使用拉格朗日插值算法得到纸张的数目和不同频率方波信号的非线性关系。实验证明了拉格朗日插值算法在非线性的电容测量中的合理性和有效性。
-
关键词
非线性拟合
电容式位移传感器
三次拉格朗日插值
-
Keywords
nonlinear fitting
capacitive displacement sensor
cubic Lagrange interpolation
-
分类号
TP212.9
[自动化与计算机技术—检测技术与自动化装置]
-