期刊文献+
共找到28篇文章
< 1 2 >
每页显示 20 50 100
Approximate Dynamic Programming for Stochastic Resource Allocation Problems 被引量:4
1
作者 Ali Forootani Raffaele Iervolino +1 位作者 Massimo Tipaldi Joshua Neilson 《IEEE/CAA Journal of Automatica Sinica》 SCIE EI CSCD 2020年第4期975-990,共16页
A stochastic resource allocation model, based on the principles of Markov decision processes(MDPs), is proposed in this paper. In particular, a general-purpose framework is developed, which takes into account resource... A stochastic resource allocation model, based on the principles of Markov decision processes(MDPs), is proposed in this paper. In particular, a general-purpose framework is developed, which takes into account resource requests for both instant and future needs. The considered framework can handle two types of reservations(i.e., specified and unspecified time interval reservation requests), and implement an overbooking business strategy to further increase business revenues. The resulting dynamic pricing problems can be regarded as sequential decision-making problems under uncertainty, which is solved by means of stochastic dynamic programming(DP) based algorithms. In this regard, Bellman’s backward principle of optimality is exploited in order to provide all the implementation mechanisms for the proposed reservation pricing algorithm. The curse of dimensionality, as the inevitable issue of the DP both for instant resource requests and future resource reservations,occurs. In particular, an approximate dynamic programming(ADP) technique based on linear function approximations is applied to solve such scalability issues. Several examples are provided to show the effectiveness of the proposed approach. 展开更多
关键词 approximate dynamic programming(adp) dynamic programming(DP) Markov decision processes(MDPs) resource allocation problem
下载PDF
Optimal Constrained Self-learning Battery Sequential Management in Microgrid Via Adaptive Dynamic Programming 被引量:16
2
作者 Qinglai Wei Derong Liu +1 位作者 Yu Liu Ruizhuo Song 《IEEE/CAA Journal of Automatica Sinica》 SCIE EI CSCD 2017年第2期168-176,共9页
This paper concerns a novel optimal self-learning battery sequential control scheme for smart home energy systems. The main idea is to use the adaptive dynamic programming U+0028 ADP U+0029 technique to obtain the opt... This paper concerns a novel optimal self-learning battery sequential control scheme for smart home energy systems. The main idea is to use the adaptive dynamic programming U+0028 ADP U+0029 technique to obtain the optimal battery sequential control iteratively. First, the battery energy management system model is established, where the power efficiency of the battery is considered. Next, considering the power constraints of the battery, a new non-quadratic form performance index function is established, which guarantees that the value of the iterative control law cannot exceed the maximum charging/discharging power of the battery to extend the service life of the battery. Then, the convergence properties of the iterative ADP algorithm are analyzed, which guarantees that the iterative value function and the iterative control law both reach the optimums. Finally, simulation and comparison results are given to illustrate the performance of the presented method. © 2017 Chinese Association of Automation. 展开更多
关键词 Adaptive control systems Automation Battery management systems Control theory Electric batteries Energy management Energy management systems Intelligent buildings Iterative methods Number theory Secondary batteries
下载PDF
An Optimal Control Scheme for a Class of Discrete-time Nonlinear Systems with Time Delays Using Adaptive Dynamic Programming 被引量:17
3
作者 WEI Qing-Lai ZHANG Hua-Guang +1 位作者 LIU De-Rong ZHAO Yan 《自动化学报》 EI CSCD 北大核心 2010年第1期121-129,共9页
关键词 非线性系统 最优控制 控制变量 动态规划
下载PDF
多车型回程车辆调度问题的ADP算法研究
4
作者 吴万国 李林林 孙良旭 《计算机应用研究》 CSCD 北大核心 2013年第7期1991-1994,共4页
采用近似动态规划(ADP)方法对钢铁物流运输过程中的车辆调度问题进行了分析,设计了车辆和运输货物的状态向量空间、动作向量空间等,充分考虑运输成本和能力约束,建立状态转移函数、目标函数,并对近似动态规划算法进行改进。在基于决策... 采用近似动态规划(ADP)方法对钢铁物流运输过程中的车辆调度问题进行了分析,设计了车辆和运输货物的状态向量空间、动作向量空间等,充分考虑运输成本和能力约束,建立状态转移函数、目标函数,并对近似动态规划算法进行改进。在基于决策后状态的ADP算法的基础上,采用Boltzmann探索策略对所有的状态空间进行遍历,避免局部最优和低效问题。通过对比实验,比较Q学习算法、基于决策后状态的ADP算法以及采用Boltzmann探索策略的ADP算法的实验结果,证明了采用Boltzmann探索策略的ADP算法具有更快的收敛速度,执行效率更高。 展开更多
关键词 近似动态规划 车辆调度 Q学习 探索策略
下载PDF
Direct heuristic dynamic programming based on an improved PID neural network 被引量:2
5
作者 Jian SUN Feng LIU +1 位作者 Jennie SI Shengwei MEI 《控制理论与应用(英文版)》 EI 2012年第4期497-503,共7页
In this paper, an improved PID-neural network (IPIDNN) structure is proposed and applied to the critic and action networks of direct heuristic dynamic programming (DHDP). As one of online learning algorithm of app... In this paper, an improved PID-neural network (IPIDNN) structure is proposed and applied to the critic and action networks of direct heuristic dynamic programming (DHDP). As one of online learning algorithm of approximate dynamic programming (ADP), DHDP has demonstrated its applicability to large state and control problems. Theoretically, the DHDP algorithm requires access to full state feedback in order to obtain solutions to the Bellman optimality equation. Unfortunately, it is not always possible to access all the states in a real system. This paper proposes a solution by suggesting an IPIDNN configuration to construct the critic and action networks to achieve an output feedback control. Since this structure can estimate the integrals and derivatives of measurable outputs, more system states are utilized and thus better control performance are expected. Compared with traditional PIDNN, this configuration is flexible and easy to expand. Based on this structure, a gradient decent algorithm for this IPIDNN-based DHDP is presented. Convergence issues are addressed within a single learning time step and for the entire learning process. Some important insights are provided to guide the implementation of the algorithm. The proposed learning controller has been applied to a cart-pole system to validate the effectiveness of the structure and the algorithm. 展开更多
关键词 approximate dynamic programming (adp Direct heuristic dynamic programming (DHDP) ImprovedPID neural network (IPIDNN)
原文传递
Distributed and Risk-averse ADP Algorithm for Stochastic Economic Dispatch of Power System with Multiple Offshore Wind Farms
6
作者 Xiangyong Feng Shunjiang Lin +2 位作者 Yutao Liang Guansheng Fan Mingbo Liu 《CSEE Journal of Power and Energy Systems》 SCIE EI CSCD 2024年第5期1977-1993,共17页
With more and more offshore wind power being increasingly connected to power grids,fluctuations in offshore wind speeds result in risks of high operation costs.To mitigate this problem,a risk-averse stochastic economi... With more and more offshore wind power being increasingly connected to power grids,fluctuations in offshore wind speeds result in risks of high operation costs.To mitigate this problem,a risk-averse stochastic economic dispatch(ED)model of power system with multiple offshore wind farms(OWFs)is proposed in this paper.In this model,a novel GlueVaR method is used to measure the tail risk of the probability distribution of operation cost.The weighted sum of the expected operation cost and the GlueVaR is used to reflect the risk of operation cost,which can consider different risk requirements including risk aversion and risk neutrality flexibly by adjusting parameters.Then,a risk-averse approximate dynamic programming(ADP)algorithm is designed for solving the proposed model,in which multi-period ED problem is decoupled into a series of single-period ED problems.Besides,GlueVaR is introduced into the approximate value function training process for risk aversion.Finally,a distributed and risk-averse ADP algorithm is constructed based on the alternating direction method of multipliers,which can further decouple single-period ED between transmission system and multiple OWFs for ensuring information privacy.Case studies on the modified IEEE 39-bus system with an OWF and an actual provincial power system with four OWFs demonstrate correctness and efficiency of the proposed model and algorithm. 展开更多
关键词 approximate dynamic programming(adp) alternating direction method of multipliers GlueVaR offshore wind farm risk-averse stochastic optimization
原文传递
基于数据的自学习优化控制:研究进展与展望 被引量:22
7
作者 刘德荣 李宏亮 王鼎 《自动化学报》 EI CSCD 北大核心 2013年第11期1858-1870,共13页
自适应动态规划(Adaptive dynamic programming,ADP)方法可以解决传统动态规划中的"维数灾"问题,已经成为控制理论和计算智能领域最新的研究热点.ADP方法采用函数近似结构来估计系统性能指标函数,然后依据最优性原理来获得近... 自适应动态规划(Adaptive dynamic programming,ADP)方法可以解决传统动态规划中的"维数灾"问题,已经成为控制理论和计算智能领域最新的研究热点.ADP方法采用函数近似结构来估计系统性能指标函数,然后依据最优性原理来获得近优的控制策略.ADP是一种具有学习和优化能力的智能控制方法,在求解复杂非线性系统的最优控制问题中具有极大的潜力.本文对ADP的理论研究、算法实现、相关应用等方面进行了全面的梳理,涵盖了最新的研究进展,并对ADP的未来发展趋势进行了分析和展望. 展开更多
关键词 自适应动态规划 近似动态规划 强化学习 神经网络 智能控制
下载PDF
微电网多目标随机动态优化调度算法 被引量:21
8
作者 王雅平 林舜江 +2 位作者 杨智斌 孙兴鲁 刘明波 《电工技术学报》 EI CSCD 北大核心 2018年第10期2196-2207,共12页
针对含风光发电和储能电池的微电网多目标随机动态优化调度问题,建立以微电源总运行费用和系统总网损为目标函数,同时以多个蓄电池剩余电量的和作为资源存储量的微电网多目标随机型存储模型。模型中采用交流潮流模型准确描述配电线路的... 针对含风光发电和储能电池的微电网多目标随机动态优化调度问题,建立以微电源总运行费用和系统总网损为目标函数,同时以多个蓄电池剩余电量的和作为资源存储量的微电网多目标随机型存储模型。模型中采用交流潮流模型准确描述配电线路的传输功率安全约束,并考虑了各种分布式电源的电压无功特性。结合自适应加权和法(AWS)和近似动态规划法(ADP)求解多目标随机动态优化调度问题,先采用AWS法将多目标随机动态优化模型转化为一系列单目标随机动态优化模型,再采用ADP的近似值函数迭代算法实现对单目标随机动态优化模型的逐时段递推解耦求解,并通过对AWS法中分割段新增Pareto点对应权值的调整以得到均匀分布的Pareto前沿。通过某一实际微电网的算例仿真,证明了所提出模型与算法的正确性和有效性。 展开更多
关键词 微电网调度 随机优化 多目标优化 近似动态规划 自适应加权和法
下载PDF
随机动态经济调度问题的存储器建模及近似动态规划算法 被引量:17
9
作者 简淦杨 刘明波 林舜江 《中国电机工程学报》 EI CSCD 北大核心 2014年第25期4333-4340,共8页
将含有风电场和抽水蓄能电站的电力系统随机动态经济调度问题描述为随机型存储器问题,以考虑风电场出力所具有的随机性。该模型含数学期望的计算,且实际问题状态空间、决策空间都是高维的,难以对其准确求解。因此,采用近似动态规划算法... 将含有风电场和抽水蓄能电站的电力系统随机动态经济调度问题描述为随机型存储器问题,以考虑风电场出力所具有的随机性。该模型含数学期望的计算,且实际问题状态空间、决策空间都是高维的,难以对其准确求解。因此,采用近似动态规划算法将值函数近似表示成分段线性函数的逼近形式,从而将随机存储器问题转化为一系列多阶段线性规划问题。通过扫描误差场景并相应求解所对应的线性规划问题,可实现对值函数进行训练,逐次修正各分段斜率值,直至值函数收敛后,再用来对预测场景下的线性规划问题进行求解,即得动态经济调度结果。该算法避免了求解准确解时面临的"维数灾"问题,具有较快的计算速度。以含风电场和抽水蓄能电站的小型测试系统和某省级实际电力系统为例,验证了所提模型与算法的可行性与有效性。 展开更多
关键词 风电场 抽水蓄能电站 随机动态经济调度 存储器模型 近似动态规划法
下载PDF
基于广义模糊双曲模型的自适应动态规划最优控制设计 被引量:11
10
作者 张吉烈 张化光 +1 位作者 罗艳红 梁洪晶 《自动化学报》 EI CSCD 北大核心 2013年第2期142-149,共8页
为连续非线性系统提出了一种有效的最优控制设计方法.广义模糊双曲模型(Generalized fuzzy hyperbolic model,GFHM)首次作为逼近器用来估计HJB(Hamilton-Jacobi-Bellman)方程的解(值函数,即它是状态与代价函数之间的映射),然后,利用该... 为连续非线性系统提出了一种有效的最优控制设计方法.广义模糊双曲模型(Generalized fuzzy hyperbolic model,GFHM)首次作为逼近器用来估计HJB(Hamilton-Jacobi-Bellman)方程的解(值函数,即它是状态与代价函数之间的映射),然后,利用该近似解获得最优控制.本文方法只需要一个GFHM估计值函数.首先,阐述了对于连线非线性系统最优控制的设计过程;然后,证明了逼近误差是一致最终有界的(Uniformly ultimately bounded,UUB);最后,一个数值例子验证了本文方法的有效性.另一个例子通过与神经网络自适应动态规划的方法作比较,演示了本文方法的优点. 展开更多
关键词 广义模糊双曲模型 最优控制 自适应动态规划 近似最优 自适应控制
下载PDF
汉江上游梯级水电站水库优化运行研究 被引量:3
11
作者 孙晓懿 黄强 +2 位作者 康田 高凡 郝鹏 《西安理工大学学报》 CAS 北大核心 2011年第3期311-316,共6页
根据汉江上游石泉、喜河、安康梯级水电站水库群的特点和任务,分别以梯级水电站发电量最大和发电效益最大为目标函数建立优化模型,将逐次逼近动态规划法(DPSA)与逐步优化算法(POA)相结合求解模型,获得梯级水电站长系列优化运行结果。结... 根据汉江上游石泉、喜河、安康梯级水电站水库群的特点和任务,分别以梯级水电站发电量最大和发电效益最大为目标函数建立优化模型,将逐次逼近动态规划法(DPSA)与逐步优化算法(POA)相结合求解模型,获得梯级水电站长系列优化运行结果。结果表明,梯级水电站水库群优化运行能够充分发挥水库的补偿作用,相比梯级水库群常规调度和单一水库优化运行获得更大的效益;与发电量最大模型相比,发电效益最大模型增加了梯级水电站的发电效益和枯水期出力,调整了水电站的负荷分配,减少了水电站弃水,提高了水资源利用率。研究成果为汉江上游梯级水电站的优化运行提供了理论依据和技术支持。 展开更多
关键词 汉江上游梯级水电站 梯级发电效益最大 梯级发电量最大 逐次逼近动态规划法 逐步优化算法
下载PDF
基于功能度量法的概率优化设计的收敛控制 被引量:3
12
作者 易平 杨迪雄 《力学学报》 EI CSCD 北大核心 2008年第1期128-134,共7页
概率结构优化设计(PSDO)中概率约束的评定可以采用最近提出的、被认为更高效、稳定的功能度量法(PMA).改进均值(AMV)迭代格式经常在PMA中使用,但它对一些非线性功能函数或非正态随机变量,搜索最小功能目标点时可能陷入周期振荡或混沌解... 概率结构优化设计(PSDO)中概率约束的评定可以采用最近提出的、被认为更高效、稳定的功能度量法(PMA).改进均值(AMV)迭代格式经常在PMA中使用,但它对一些非线性功能函数或非正态随机变量,搜索最小功能目标点时可能陷入周期振荡或混沌解,从而使PSDO的两层次算法或序列近似规划算法优化计算失败.利用混沌反馈控制的稳定转换法对功能度量法的AMV迭代格式实施了收敛控制,使嵌入周期和混沌轨道的不稳定不动点稳定化,获得稳定收敛解,从而使概率约束的评定能正常进行;再由两层次算法或序列近似规划算法进行结构优化设计.算例结果表明了稳定转换法实施收敛控制的有效性,以及序列近似规划算法相对高效的优点. 展开更多
关键词 概率结构优化设计 功能度量法 AMV迭代格式 序列近似规划 混沌动力学 稳定转换法
下载PDF
连续型动态规划的新算法研究 被引量:2
13
作者 张鹏 《运筹学学报》 CSCD 北大核心 2012年第1期97-105,共9页
提出了求解一维连续型动态规划问题的自创算法——离散近似迭代法,并结合双收敛方法求解多维连续型动态规划问题.该算法的基本思路为:在给定其它状态向量序列的基础上,每次对一个状态变量序列进行离散近似迭代,并找出该状态变量的最优序... 提出了求解一维连续型动态规划问题的自创算法——离散近似迭代法,并结合双收敛方法求解多维连续型动态规划问题.该算法的基本思路为:在给定其它状态向量序列的基础上,每次对一个状态变量序列进行离散近似迭代,并找出该状态变量的最优序列,直到所有状态向量序列都检查完.当模型为非凸非凹动态规划时,证明了该算法的收敛性.当模型为凸动态规划时,证明了该算法的线性收敛性.最后,以一个具体算例验证了该模型和算法的有效性. 展开更多
关键词 动态规划问题 多维 离散近似迭代方法 双收敛法
下载PDF
钻井布局优化算法设计 被引量:1
14
作者 何小飞 庹清 《吉首大学学报》 1999年第4期77-82,共6页
运用直接搜索和动态规划最优化原理 ,给出了钻井布局问题的优化算法 ,并对平移网格下满足给定误差ε的可利用旧井之点的坐标关系进行了定性分析 .
关键词 直接搜索法 动态规划 最优化算法 钻井布局
下载PDF
ADHDP方法在静止无功补偿器优化控制中的应用
15
作者 周晓华 宋春宁 +1 位作者 王荔芳 王保录 《化工自动化及仪表》 CAS 北大核心 2011年第5期525-528,共4页
介绍了静止无功补偿器SVC和自适应动态规范的执行方法ADHDP的基本原理,基于PI控制法的电压负反馈控制策略,应用ADHDP方法对输入PI调节器的电压偏差进行了优化,并在Matlab/Sim-ulink环境下对SVC控制系统进行了仿真实验。仿真结果表明,经... 介绍了静止无功补偿器SVC和自适应动态规范的执行方法ADHDP的基本原理,基于PI控制法的电压负反馈控制策略,应用ADHDP方法对输入PI调节器的电压偏差进行了优化,并在Matlab/Sim-ulink环境下对SVC控制系统进行了仿真实验。仿真结果表明,经优化后的控制系统响应速度明显提高,动态性能得到了较好的改善。 展开更多
关键词 静止无功补偿器 自适应动态规划 ADHDP方法 优化控制
下载PDF
基于非线性多输入多输出近似动态规划的发动机缸平衡智能调节算法
16
作者 黄志坚 熊雪梅 +3 位作者 张赞 李宇栋 陈文涛 张琴 《上海海事大学学报》 北大核心 2017年第4期88-92,共5页
为解决发动机缸平衡控制问题,将标准近似动态规划(approximate dynamic programming,ADP)扩展为多输入多输出形式,给出其控制算法,并证明其收敛性。仿真结果显示,该方法能在一定范围内智能地调节各缸喷油量,用于补偿由多种不确定因素导... 为解决发动机缸平衡控制问题,将标准近似动态规划(approximate dynamic programming,ADP)扩展为多输入多输出形式,给出其控制算法,并证明其收敛性。仿真结果显示,该方法能在一定范围内智能地调节各缸喷油量,用于补偿由多种不确定因素导致的各缸转速差异,从而自适应地提高缸平衡效果。该方法只需基于实时转速,不必检测和区分各缸间的转速差异,具有非线性系统的智能优化特点。该方法能直接处理各缸间的非线性多输入多输出耦合关系。 展开更多
关键词 近似动态规划 多输入多输出(MIM0) 非线性系统 自适应性 缸平衡 怠速
下载PDF
豫西黄土区夏玉米非充分灌溉制度研究
17
作者 王国重 李中原 +3 位作者 张继宇 杨丹 程焕玲 王小远 《中国农学通报》 2022年第18期8-11,共4页
豫西黄土区水资源紧缺,为充分利用当地的雨水资源,以非充分灌溉原理和节水农业理论为指导,采用Jensen模型,以夏玉米生长各阶段单位面积上实际产量与可能最大产量之比最大为目标函数,灌溉水量与实际腾发量为决策变量,可分配的水量和计划... 豫西黄土区水资源紧缺,为充分利用当地的雨水资源,以非充分灌溉原理和节水农业理论为指导,采用Jensen模型,以夏玉米生长各阶段单位面积上实际产量与可能最大产量之比最大为目标函数,灌溉水量与实际腾发量为决策变量,可分配的水量和计划湿润层内可供利用的水量为状态变量,用动态规划逐次逼近法求解该模型,推求夏玉米的非充分灌溉优化制度。结果表明:优化结果与试验数据相吻合,说明Jensen模型在该地区的适用性。 展开更多
关键词 非充分灌溉 夏玉米 JENSEN模型 动态规划 逐次逼近法
下载PDF
船舶航向自适应控制的改进ADHDP方法 被引量:2
18
作者 李宇栋 黄志坚 +3 位作者 王升堂 张成 郑欢 熊雪梅 《湖北民族学院学报(自然科学版)》 CAS 2018年第2期178-183,共6页
船舶航向的自动控制主要方式是PID控制,而今智能化的控制方式得到了广大的应用,使得人们可以更加精确的对船舶进行操控.本文将基于执行依赖启发式动态规划(ADHDP)的控制方式,针对船舶航向的控制特点,在执行网络上并联自适应控制环节,基... 船舶航向的自动控制主要方式是PID控制,而今智能化的控制方式得到了广大的应用,使得人们可以更加精确的对船舶进行操控.本文将基于执行依赖启发式动态规划(ADHDP)的控制方式,针对船舶航向的控制特点,在执行网络上并联自适应控制环节,基于Lyapunov稳定性分析,采用RBF神经网络逼近运算,可以减少在船舶操控多变工况下ADHDP控制器的超调问题,使之成为船舶航向控制的智能方法之一.仿真结果显示,基于这种近似动态规划(ADP)的自适应控制能更加精确和快速的对船舶航行进行操控,这也将为船舶的智能化发展奠定基础. 展开更多
关键词 执行依赖启发式动态规划 近似动态规划 船舶航向控制 自适应控制 智能控制 神经网络
下载PDF
梯级泵站叶片全调节日优化运行研究 被引量:1
19
作者 张宇虹 方国华 +1 位作者 闻昕 田雨 《水资源与水工程学报》 CSCD 2017年第6期123-128,共6页
梯级泵站群优化运行是具有非线性、多阶段、多维度特征的复杂科学问题,为解决梯级泵站运行效率较低、耗能较高等问题,开展梯级泵站叶片全调节日优化运行研究,运用动态规划逐次渐近法对单级泵站多机组叶片全调节进行优化计算,采用逆序查... 梯级泵站群优化运行是具有非线性、多阶段、多维度特征的复杂科学问题,为解决梯级泵站运行效率较低、耗能较高等问题,开展梯级泵站叶片全调节日优化运行研究,运用动态规划逐次渐近法对单级泵站多机组叶片全调节进行优化计算,采用逆序查表法对梯级泵站日优化运行问题进行求解,最后对南水北调来水调入密云水库梯级泵站工程优化展开实例研究,考虑峰谷电价的影响,梯级泵站日提水总量为176.36×10~4m^3,泵站效率为43.27%,优化后梯级泵站日运行费用减少23.77%,优化效果明显。 展开更多
关键词 梯级泵站 日优化运行 动态规划逐次渐近法 逆序查表法 叶片全调节
下载PDF
Discounted Iterative Adaptive Critic Designs With Novel Stability Analysis for Tracking Control 被引量:9
20
作者 Mingming Ha Ding Wang Derong Liu 《IEEE/CAA Journal of Automatica Sinica》 SCIE EI CSCD 2022年第7期1262-1272,共11页
The core task of tracking control is to make the controlled plant track a desired trajectory.The traditional performance index used in previous studies cannot eliminate completely the tracking error as the number of t... The core task of tracking control is to make the controlled plant track a desired trajectory.The traditional performance index used in previous studies cannot eliminate completely the tracking error as the number of time steps increases.In this paper,a new cost function is introduced to develop the value-iteration-based adaptive critic framework to solve the tracking control problem.Unlike the regulator problem,the iterative value function of tracking control problem cannot be regarded as a Lyapunov function.A novel stability analysis method is developed to guarantee that the tracking error converges to zero.The discounted iterative scheme under the new cost function for the special case of linear systems is elaborated.Finally,the tracking performance of the present scheme is demonstrated by numerical results and compared with those of the traditional approaches. 展开更多
关键词 Adaptive critic design adaptive dynamic programming(adp) approximate dynamic programming discrete-time nonlinear systems reinforcement learning stability analysis tracking control value iteration(VI)
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部