期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
一种状态集结因子化SARSA(λ)强化学习算法 被引量:1
1
作者 李春贵 刘永信 《内蒙古大学学报(自然科学版)》 CAS CSCD 北大核心 2001年第6期675-678,共4页
提出了一种自适应状态集结因子化 SARSA(λ)强化学习算法 ,在学习的过程中利用Bellman余留数进行状态集结 ,通过集结 ,大大减少了状态空间搜索与计算的复杂度 ,有利于求解大状态空间的 MDPs问题 ,而且 ,本算法不需要有关状态特征的先验... 提出了一种自适应状态集结因子化 SARSA(λ)强化学习算法 ,在学习的过程中利用Bellman余留数进行状态集结 ,通过集结 ,大大减少了状态空间搜索与计算的复杂度 ,有利于求解大状态空间的 MDPs问题 ,而且 ,本算法不需要有关状态特征的先验知识 。 展开更多
关键词 强化学习 状态集结 MDPs Q(λ)学习 SARSA(λ)学习 机器学习 因子化 Bellman余留数
下载PDF
基于状态集结的值函数逼近
2
作者 胡光华 刘英敏 吴沧浦 《北京理工大学学报》 EI CAS CSCD 2000年第3期304-308,共5页
用更为紧凑的方法表示和存贮值函数 ,以求解大规模平均模型 Markov决策规划(MDP)问题 .通过状态集结相对值迭代算法逼近值函数 ,用 Span半范数和压缩映射原理分析算法的收敛性 .给出了状态集结后的 Bellman最优方程 .在 Span压缩条件下... 用更为紧凑的方法表示和存贮值函数 ,以求解大规模平均模型 Markov决策规划(MDP)问题 .通过状态集结相对值迭代算法逼近值函数 ,用 Span半范数和压缩映射原理分析算法的收敛性 .给出了状态集结后的 Bellman最优方程 .在 Span压缩条件下证明了该算法的收敛性 。 展开更多
关键词 动态规划 状态集结 随机控制 值函数逼近
下载PDF
基于状态软集结的相对值迭代算法(英文)
3
作者 胡光华 吴沧浦 乔治.瑟彬珂 《控制理论与应用》 EI CAS CSCD 北大核心 2000年第3期415-418,共4页
在大规模随机控制问题中 ,值函数逼近是一种克服维数灾的方法 .考虑平均模型马氏决策规划 (MDP)的状态软集结相对值迭代算法 ,在Span压缩的条件下 ,证明了该算法的收敛性 ,同时还给出了其误差估计 .
关键词 随机控制 状态集结 相对值 迭代算法
下载PDF
Determination of the cluster spectroscopic factor of the 10.3 MeV state in ^(12)Be
4
作者 YANG ZaiHong YE YanLin +15 位作者 LI ZhiHuan LOU JianLin XU FuRong PEI JunCheng TIAN ZhengYang LI KuoAng SUN YeLei CHEN Jie LI Jing JIANG Wei YANG Biao CHEN SiDong LIU Qiang ZANG HongLiang FENG Jun YIN ZheWei 《Science China(Physics,Mechanics & Astronomy)》 SCIE EI CAS 2014年第9期1613-1617,共5页
From an inelastic excitation and breakup experiment with a12Be beam at 29 MeV/u,a large4He+8He cluster decay width of 1.1(2)MeV is determined for a state at an excitation energy of 10.3 MeV and with a spin parity of 0... From an inelastic excitation and breakup experiment with a12Be beam at 29 MeV/u,a large4He+8He cluster decay width of 1.1(2)MeV is determined for a state at an excitation energy of 10.3 MeV and with a spin parity of 0+.By using the R-matrix analysis,a cluster spectroscopic factor of 0.53(10)is extracted from the cluster partial width,providing a strong support for the clustering structure in12Be.A specially designed zero-degree telescope played an essential role in the present experiment and has been demonstrated to be a promising tool in future studies of the molecular-like resonances near the cluster separation threshold. 展开更多
关键词 CLUSTER decay width R-MATRIX
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部