-
题名模态跳变概率可控的Markov跳变线性系统的优化
被引量:1
- 1
-
-
作者
徐琰恺
陈曦
-
机构
清华大学智能与网络化系统研究中心
-
出处
《控制与决策》
EI
CSCD
北大核心
2008年第3期246-250,共5页
-
基金
国家自然科学基金项目(60574064)
-
文摘
研究模态跳变概率可控的Markov跳变线性二次模型的最优控制问题.考虑两类模态跳变控制策略:开环模态控制和闭环模态控制,应用策略迭代和性能势的概念,给出了最优的闭环模态控制优于最优的开环模态控制的充分条件,以指导最优控制器的设计.在已知最优的开环模态控制策略的基础上,应用策略迭代给出了构造闭环模态控制策略的方法,以进一步改善系统的性能.
-
关键词
MARKOV跳变系统
最优控制
策略迭代
-
Keywords
Markov jump system
Optimal control
Policy iteration
-
分类号
TP13
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于强化学习的JLQ模型的直接自适应最优控制
- 2
-
-
作者
徐琰恺
陈曦
-
机构
清华大学自动化系
清华大学智能与网络化系统研究中心
-
出处
《控制与决策》
EI
CSCD
北大核心
2008年第12期1359-1362,1372,共5页
-
基金
国家自然科学基金项目(60574064
60736027)
-
文摘
研究离散时间跳变线性二次(JLQ)模型的直接自适应最优控制问题.将强化学习的理论和方法应用于JLQ模型,设计基于Q函数的策略迭代算法,以优化系统性能.在系统参数以及模态跳变概率未知的情况下,Q函数对应的参数矩阵,可通过观察给定策略下系统行为,应用递归最小二乘算法在线估计.基于此参数矩阵,可构造出新的策略使得系统性能更优.该算法可收敛到最优策略.
-
关键词
Markov跳变线性系统
策略迭代
Q函数
直接自适应最优控制
-
Keywords
Markov jump linear system
Policy iteration
Q function
Direct adaptive optimal control
-
分类号
TP13
[自动化与计算机技术—控制理论与控制工程]
-
-
题名高考状元谈学习计划
- 3
-
-
作者
徐琰恺
夏冰
-
出处
《招生考试通讯(高考版)》
2001年第10期38-38,共1页
-
文摘
我的学习计划包括短期计划、中期计划、长期计划以及复习计划。每天要有一个计划,这是最短期的计划。稍长一点,如一周或一月,也有个计划。如把一个月内遇见的英语生词整理一下,复习一遍;又如把一个月的错题都订正一遍等。这样的计划实施起来用时不是很长,但非常重要,实施得好,可以对课程有一个整体的把握,学得更扎实,更有后劲。半学期、一个学期的计划可作为长期计划,其中目标的成分多一点。
-
关键词
学习计划
错题
复习计划
高考状元
课程
短期
生词
计划实施
目标
标的
-
分类号
G633
[文化科学—教育学]
-