摘要
研究了应用于离散时间非仿射非线性系统的基于值迭代的自适应动态规划的收敛条件,指出了迭代性能指标函数初始化为半正定函数可保证值迭代收敛到最优,并给出了证明.
The convergence condition of value-iteration based adaptive dynamic programming which is applied to discrete time nonlinear non-affine system is studied. Convergence of value-iteration based adaptive dynamic programming is proven. The proof shows that value iteration will converge to the optimal when the initial iterative performance index function is a positive semi-definite function.
出处
《广东工业大学学报》
CAS
2017年第5期10-14,共5页
Journal of Guangdong University of Technology
基金
国家自然科学基金资助项目(U1501251
51307025)
高等学校博士学科点专项科研基金资助项目(20124420130001)
关键词
自适应动态规划
值迭代
收敛
adaptive dynamic programming
value iteration
convergence