期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于增量式策略强化学习算法的飞行控制系统的容错跟踪控制 被引量:3
1
作者 任坚 刘剑慰 杨蒲 《控制理论与应用》 EI CAS CSCD 北大核心 2020年第7期1429-1438,共10页
针对发生故障的飞行控制系统,在强化学习算法的基础上,提出了一种基于增量式策略的强化学习容错方法.本方法利用传感器获取的系统状态值,根据系统预先设定的奖励函数对当前控制系统状况做出最优的决策并不断更新价值网络,将系统的容错... 针对发生故障的飞行控制系统,在强化学习算法的基础上,提出了一种基于增量式策略的强化学习容错方法.本方法利用传感器获取的系统状态值,根据系统预先设定的奖励函数对当前控制系统状况做出最优的决策并不断更新价值网络,将系统的容错控制过程转换为强化学习Agent的贯序决策过程,并使用一种改进型的增量式策略实现对当前故障的正确补偿策略的逐渐逼近.同时,针对连续控制系统,提出一种状态转移预测网络来得到下一步状态值.最后,通过南京航空航天大学“先进飞行器导航、控制与健康管理”工信部重点实验室的飞行器故障诊断实验平台验证了该方法的有效性. 展开更多
关键词 飞行控制系统 故障诊断 故障容错 强化学习 Q-learning算法 增量式策略 状态转移预测网络
下载PDF
基于压缩感知的分布式协同估计算法 被引量:3
2
作者 张亚东 姚彦鑫 《电讯技术》 北大核心 2017年第4期377-381,共5页
为了降低分布式协同估计算法的计算量并改善其收敛性能,提出了基于压缩感知(CS)和递归最小二乘(RLS)的分布式协同估计算法。该算法在传统RLS分布式协同估计算法的基础上引入压缩感知技术,首先在压缩域中进行递归最小二乘运算,然后利用... 为了降低分布式协同估计算法的计算量并改善其收敛性能,提出了基于压缩感知(CS)和递归最小二乘(RLS)的分布式协同估计算法。该算法在传统RLS分布式协同估计算法的基础上引入压缩感知技术,首先在压缩域中进行递归最小二乘运算,然后利用压缩感知重构算法得到未知参数向量的估计值。提出的算法能够在增量式策略和两种模式的扩散式策略下实现对未知向量的有效估计。理论分析和仿真结果表明,该算法一方面降低了RLS分布式协同估计算法的计算量,另一方面保持较快的收敛速度与良好的均方误差性能。 展开更多
关键词 分布式估计 压缩感知 递归最小二乘 增量式策略 扩散式策略
下载PDF
一种移动机器人对运动目标的检测跟踪方法 被引量:5
3
作者 刘伟 王建平 张崇巍 《计算机技术与发展》 2009年第4期105-108,111,共5页
从序列图像中有效地自动提取运动目标区域和跟踪运动目标是自主机器人运动控制的研究热点之一。给出了连续图像帧差分和二次帧差分改进的图像HIS差分模型,采用自适应运动目标区域检测、自适应阴影部分分割和噪声消除算法,对无背景图像... 从序列图像中有效地自动提取运动目标区域和跟踪运动目标是自主机器人运动控制的研究热点之一。给出了连续图像帧差分和二次帧差分改进的图像HIS差分模型,采用自适应运动目标区域检测、自适应阴影部分分割和噪声消除算法,对无背景图像条件下自动提取运动目标区域。定义了一些运动目标的特征分析和计算,通过特征匹配识别所需跟踪目标的区域。采用Kalman预报器对运动目标状态的一步预测估计和两步增量式跟踪算法,能快速平滑地实现移动机器人对运动目标的跟踪驱动控制。实验结果表明该方法有效。 展开更多
关键词 改进的HIS差分模型 KALMAN滤波器 增量式跟踪控制策略
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部