期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
二次多阶段不确定系统的Bang-Bang最优控制(英文)
1
作者 康玉洁 《周口师范学院学报》 CAS 2016年第2期26-33,共8页
在多阶段系统中,当系统转移方程受到不确定变量的干扰,该问题就称为多阶段不确定控制问题.本文把目标函数的期望值的最小值作为最优解,在贝尔曼最优性原理的基础上提出递推公式,采用动态规划方法,对问题进行求解,最终得出Bang-Bang最优... 在多阶段系统中,当系统转移方程受到不确定变量的干扰,该问题就称为多阶段不确定控制问题.本文把目标函数的期望值的最小值作为最优解,在贝尔曼最优性原理的基础上提出递推公式,采用动态规划方法,对问题进行求解,最终得出Bang-Bang最优控制和相应的最优解. 展开更多
关键词 多阶段系统 不确定最优控制 贝尔曼最优性原理 Bang-Bang最优控制
下载PDF
基于强化学习的微小型弹药两回路驾驶仪设计 被引量:2
2
作者 范军芳 张鑫 《战术导弹技术》 北大核心 2019年第4期48-54,共7页
利用强化学习及自适应动态规划原理,设计了一种适用于微小型弹药的两回路驾驶仪,并建立了纵向通道控制模型。由于跟踪器问题的最优解不易获得,将系统矩阵与期望输出信号进行增广,构成增广系统并引入折扣因子,将系统的跟踪器设计问题转... 利用强化学习及自适应动态规划原理,设计了一种适用于微小型弹药的两回路驾驶仪,并建立了纵向通道控制模型。由于跟踪器问题的最优解不易获得,将系统矩阵与期望输出信号进行增广,构成增广系统并引入折扣因子,将系统的跟踪器设计问题转换为调节器设计问题。基于贝尔曼最优性原理,采用策略迭代的方法对黎卡提方程进行求解,并证明了该算法的收敛性。最后仿真验证了通过策略评估及策略更新两步迭代计算,可以收敛至跟踪器的最优解。 展开更多
关键词 微小型弹药 两回路自动驾驶仪 策略迭代 代数黎卡提方程 强化学习 贝尔曼最优性原理
原文传递
存贮问题的优化算法
3
作者 李敏 《Journal of Mathematical Research and Exposition》 CSCD 北大核心 2003年第2期367-370,共4页
本文根据经济模型的特殊结构,利用对偶线性规划的理论和其它技巧,简化求解过程,有利于模型的普及应用.
关键词 存贮问题 优化算法 贝尔曼最优性原理 对偶线性规划
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部