期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
二次多阶段不确定系统的Bang-Bang最优控制(英文)
1
作者
康玉洁
《周口师范学院学报》
CAS
2016年第2期26-33,共8页
在多阶段系统中,当系统转移方程受到不确定变量的干扰,该问题就称为多阶段不确定控制问题.本文把目标函数的期望值的最小值作为最优解,在贝尔曼最优性原理的基础上提出递推公式,采用动态规划方法,对问题进行求解,最终得出Bang-Bang最优...
在多阶段系统中,当系统转移方程受到不确定变量的干扰,该问题就称为多阶段不确定控制问题.本文把目标函数的期望值的最小值作为最优解,在贝尔曼最优性原理的基础上提出递推公式,采用动态规划方法,对问题进行求解,最终得出Bang-Bang最优控制和相应的最优解.
展开更多
关键词
多阶段系统
不确定最优控制
贝尔曼最优性原理
Bang-Bang最优控制
下载PDF
职称材料
基于强化学习的微小型弹药两回路驾驶仪设计
被引量:
2
2
作者
范军芳
张鑫
《战术导弹技术》
北大核心
2019年第4期48-54,共7页
利用强化学习及自适应动态规划原理,设计了一种适用于微小型弹药的两回路驾驶仪,并建立了纵向通道控制模型。由于跟踪器问题的最优解不易获得,将系统矩阵与期望输出信号进行增广,构成增广系统并引入折扣因子,将系统的跟踪器设计问题转...
利用强化学习及自适应动态规划原理,设计了一种适用于微小型弹药的两回路驾驶仪,并建立了纵向通道控制模型。由于跟踪器问题的最优解不易获得,将系统矩阵与期望输出信号进行增广,构成增广系统并引入折扣因子,将系统的跟踪器设计问题转换为调节器设计问题。基于贝尔曼最优性原理,采用策略迭代的方法对黎卡提方程进行求解,并证明了该算法的收敛性。最后仿真验证了通过策略评估及策略更新两步迭代计算,可以收敛至跟踪器的最优解。
展开更多
关键词
微小型弹药
两回路自动驾驶仪
策略迭代
代数黎卡提方程
强化学习
贝尔曼最优性原理
原文传递
存贮问题的优化算法
3
作者
李敏
《Journal of Mathematical Research and Exposition》
CSCD
北大核心
2003年第2期367-370,共4页
本文根据经济模型的特殊结构,利用对偶线性规划的理论和其它技巧,简化求解过程,有利于模型的普及应用.
关键词
存贮问题
优化算法
贝尔曼最优性原理
对偶线性规划
下载PDF
职称材料
题名
二次多阶段不确定系统的Bang-Bang最优控制(英文)
1
作者
康玉洁
机构
周口师范学院数学与统计学院
出处
《周口师范学院学报》
CAS
2016年第2期26-33,共8页
基金
Supported by Youth Research Foundation of Zhoukou Normal University(No.zknuc0218)
文摘
在多阶段系统中,当系统转移方程受到不确定变量的干扰,该问题就称为多阶段不确定控制问题.本文把目标函数的期望值的最小值作为最优解,在贝尔曼最优性原理的基础上提出递推公式,采用动态规划方法,对问题进行求解,最终得出Bang-Bang最优控制和相应的最优解.
关键词
多阶段系统
不确定最优控制
贝尔曼最优性原理
Bang-Bang最优控制
Keywords
multi-stage system
uncertain optimal control
Bellman’s principle of optimality
Bang-Bang optimal control
分类号
O224 [理学—运筹学与控制论]
下载PDF
职称材料
题名
基于强化学习的微小型弹药两回路驾驶仪设计
被引量:
2
2
作者
范军芳
张鑫
机构
北京信息科技大学高动态导航技术北京市重点实验室
出处
《战术导弹技术》
北大核心
2019年第4期48-54,共7页
基金
北京市科技新星计划(xxjh2015B041)
北京市委组织部青年拔尖人才计划(2015000026833ZK03)
+1 种基金
北京市教委青年拔尖人才项目(CIT&TCD201504055)
高动态导航技术北京市重点实验室开放课题(HDN2018002)
文摘
利用强化学习及自适应动态规划原理,设计了一种适用于微小型弹药的两回路驾驶仪,并建立了纵向通道控制模型。由于跟踪器问题的最优解不易获得,将系统矩阵与期望输出信号进行增广,构成增广系统并引入折扣因子,将系统的跟踪器设计问题转换为调节器设计问题。基于贝尔曼最优性原理,采用策略迭代的方法对黎卡提方程进行求解,并证明了该算法的收敛性。最后仿真验证了通过策略评估及策略更新两步迭代计算,可以收敛至跟踪器的最优解。
关键词
微小型弹药
两回路自动驾驶仪
策略迭代
代数黎卡提方程
强化学习
贝尔曼最优性原理
Keywords
miniature ammunition
two-loop autopilot
policy iteration
algebraic Riccati equation
reinforcement learning
Bellman optimality principle
分类号
TJ410.3 [兵器科学与技术—火炮、自动武器与弹药工程]
原文传递
题名
存贮问题的优化算法
3
作者
李敏
机构
东北财经大学数经系
出处
《Journal of Mathematical Research and Exposition》
CSCD
北大核心
2003年第2期367-370,共4页
文摘
本文根据经济模型的特殊结构,利用对偶线性规划的理论和其它技巧,简化求解过程,有利于模型的普及应用.
关键词
存贮问题
优化算法
贝尔曼最优性原理
对偶线性规划
Keywords
model
dual programming
分类号
O221.1 [理学—运筹学与控制论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
二次多阶段不确定系统的Bang-Bang最优控制(英文)
康玉洁
《周口师范学院学报》
CAS
2016
0
下载PDF
职称材料
2
基于强化学习的微小型弹药两回路驾驶仪设计
范军芳
张鑫
《战术导弹技术》
北大核心
2019
2
原文传递
3
存贮问题的优化算法
李敏
《Journal of Mathematical Research and Exposition》
CSCD
北大核心
2003
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部