期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于增量式策略强化学习算法的飞行控制系统的容错跟踪控制
被引量:
3
1
作者
任坚
刘剑慰
杨蒲
《控制理论与应用》
EI
CAS
CSCD
北大核心
2020年第7期1429-1438,共10页
针对发生故障的飞行控制系统,在强化学习算法的基础上,提出了一种基于增量式策略的强化学习容错方法.本方法利用传感器获取的系统状态值,根据系统预先设定的奖励函数对当前控制系统状况做出最优的决策并不断更新价值网络,将系统的容错...
针对发生故障的飞行控制系统,在强化学习算法的基础上,提出了一种基于增量式策略的强化学习容错方法.本方法利用传感器获取的系统状态值,根据系统预先设定的奖励函数对当前控制系统状况做出最优的决策并不断更新价值网络,将系统的容错控制过程转换为强化学习Agent的贯序决策过程,并使用一种改进型的增量式策略实现对当前故障的正确补偿策略的逐渐逼近.同时,针对连续控制系统,提出一种状态转移预测网络来得到下一步状态值.最后,通过南京航空航天大学“先进飞行器导航、控制与健康管理”工信部重点实验室的飞行器故障诊断实验平台验证了该方法的有效性.
展开更多
关键词
飞行控制系统
故障诊断
故障容错
强化学习
Q-learning算法
增量式策略
状态转移预测网络
下载PDF
职称材料
基于压缩感知的分布式协同估计算法
被引量:
3
2
作者
张亚东
姚彦鑫
《电讯技术》
北大核心
2017年第4期377-381,共5页
为了降低分布式协同估计算法的计算量并改善其收敛性能,提出了基于压缩感知(CS)和递归最小二乘(RLS)的分布式协同估计算法。该算法在传统RLS分布式协同估计算法的基础上引入压缩感知技术,首先在压缩域中进行递归最小二乘运算,然后利用...
为了降低分布式协同估计算法的计算量并改善其收敛性能,提出了基于压缩感知(CS)和递归最小二乘(RLS)的分布式协同估计算法。该算法在传统RLS分布式协同估计算法的基础上引入压缩感知技术,首先在压缩域中进行递归最小二乘运算,然后利用压缩感知重构算法得到未知参数向量的估计值。提出的算法能够在增量式策略和两种模式的扩散式策略下实现对未知向量的有效估计。理论分析和仿真结果表明,该算法一方面降低了RLS分布式协同估计算法的计算量,另一方面保持较快的收敛速度与良好的均方误差性能。
展开更多
关键词
分布式估计
压缩感知
递归最小二乘
增量式策略
扩散式
策略
下载PDF
职称材料
一种移动机器人对运动目标的检测跟踪方法
被引量:
5
3
作者
刘伟
王建平
张崇巍
《计算机技术与发展》
2009年第4期105-108,111,共5页
从序列图像中有效地自动提取运动目标区域和跟踪运动目标是自主机器人运动控制的研究热点之一。给出了连续图像帧差分和二次帧差分改进的图像HIS差分模型,采用自适应运动目标区域检测、自适应阴影部分分割和噪声消除算法,对无背景图像...
从序列图像中有效地自动提取运动目标区域和跟踪运动目标是自主机器人运动控制的研究热点之一。给出了连续图像帧差分和二次帧差分改进的图像HIS差分模型,采用自适应运动目标区域检测、自适应阴影部分分割和噪声消除算法,对无背景图像条件下自动提取运动目标区域。定义了一些运动目标的特征分析和计算,通过特征匹配识别所需跟踪目标的区域。采用Kalman预报器对运动目标状态的一步预测估计和两步增量式跟踪算法,能快速平滑地实现移动机器人对运动目标的跟踪驱动控制。实验结果表明该方法有效。
展开更多
关键词
改进的HIS差分模型
KALMAN滤波器
增量式
跟踪控制
策略
下载PDF
职称材料
题名
基于增量式策略强化学习算法的飞行控制系统的容错跟踪控制
被引量:
3
1
作者
任坚
刘剑慰
杨蒲
机构
南京航空航天大学自动化学院
出处
《控制理论与应用》
EI
CAS
CSCD
北大核心
2020年第7期1429-1438,共10页
基金
民航飞机健康监测与智能维护重点实验室基金项目(NJ2018012)
先进飞行器导航、控制与健康管理工业和信息化部重点实验室(南京航空航天大学)项目
+1 种基金
中央高校基本科研业务费项目(NS2017017)
国家自然科学基金项目(61533008,61490703)资助。
文摘
针对发生故障的飞行控制系统,在强化学习算法的基础上,提出了一种基于增量式策略的强化学习容错方法.本方法利用传感器获取的系统状态值,根据系统预先设定的奖励函数对当前控制系统状况做出最优的决策并不断更新价值网络,将系统的容错控制过程转换为强化学习Agent的贯序决策过程,并使用一种改进型的增量式策略实现对当前故障的正确补偿策略的逐渐逼近.同时,针对连续控制系统,提出一种状态转移预测网络来得到下一步状态值.最后,通过南京航空航天大学“先进飞行器导航、控制与健康管理”工信部重点实验室的飞行器故障诊断实验平台验证了该方法的有效性.
关键词
飞行控制系统
故障诊断
故障容错
强化学习
Q-learning算法
增量式策略
状态转移预测网络
Keywords
flight control systems
fault diagnosis
fault tolerance
reinforcement learning
Q-learning algorithm
incremental strategy
state transition prediction
分类号
V249 [航空宇航科学与技术—飞行器设计]
下载PDF
职称材料
题名
基于压缩感知的分布式协同估计算法
被引量:
3
2
作者
张亚东
姚彦鑫
机构
北京信息科技大学信息与通信工程学院
出处
《电讯技术》
北大核心
2017年第4期377-381,共5页
基金
国家自然科学基金资助项目(61302073)
北京市自然科学基金面上项目(4172021)
+1 种基金
北京市自然科学基金资助项目(Z160002)
北京市教委面上项目(KM201711232010)
文摘
为了降低分布式协同估计算法的计算量并改善其收敛性能,提出了基于压缩感知(CS)和递归最小二乘(RLS)的分布式协同估计算法。该算法在传统RLS分布式协同估计算法的基础上引入压缩感知技术,首先在压缩域中进行递归最小二乘运算,然后利用压缩感知重构算法得到未知参数向量的估计值。提出的算法能够在增量式策略和两种模式的扩散式策略下实现对未知向量的有效估计。理论分析和仿真结果表明,该算法一方面降低了RLS分布式协同估计算法的计算量,另一方面保持较快的收敛速度与良好的均方误差性能。
关键词
分布式估计
压缩感知
递归最小二乘
增量式策略
扩散式
策略
Keywords
distributed estimation
compressed sensing
recursive least square
incremental strategy
diffu-sion strategy
分类号
TN911 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
一种移动机器人对运动目标的检测跟踪方法
被引量:
5
3
作者
刘伟
王建平
张崇巍
机构
合肥工业大学电气与自动化工程学院
合肥学院机器视觉与智能控制重点实验室
出处
《计算机技术与发展》
2009年第4期105-108,111,共5页
基金
安徽省自然科学基金(KJ2008B121)
合肥学院自然科学基金(08KY006ZR)
文摘
从序列图像中有效地自动提取运动目标区域和跟踪运动目标是自主机器人运动控制的研究热点之一。给出了连续图像帧差分和二次帧差分改进的图像HIS差分模型,采用自适应运动目标区域检测、自适应阴影部分分割和噪声消除算法,对无背景图像条件下自动提取运动目标区域。定义了一些运动目标的特征分析和计算,通过特征匹配识别所需跟踪目标的区域。采用Kalman预报器对运动目标状态的一步预测估计和两步增量式跟踪算法,能快速平滑地实现移动机器人对运动目标的跟踪驱动控制。实验结果表明该方法有效。
关键词
改进的HIS差分模型
KALMAN滤波器
增量式
跟踪控制
策略
Keywords
HSI image difference model
Kalman filer
increment control tracking strategy
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于增量式策略强化学习算法的飞行控制系统的容错跟踪控制
任坚
刘剑慰
杨蒲
《控制理论与应用》
EI
CAS
CSCD
北大核心
2020
3
下载PDF
职称材料
2
基于压缩感知的分布式协同估计算法
张亚东
姚彦鑫
《电讯技术》
北大核心
2017
3
下载PDF
职称材料
3
一种移动机器人对运动目标的检测跟踪方法
刘伟
王建平
张崇巍
《计算机技术与发展》
2009
5
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部