期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
一种基于启发式奖赏函数的分层强化学习方法 被引量:11
1
作者 刘全 闫其粹 +2 位作者 伏玉琛 胡道京 龚声蓉 《计算机研究与发展》 EI CSCD 北大核心 2011年第12期2352-2358,共7页
针对强化学习在应用中经常出现的"维数灾"问题,即状态空间的大小随着特征数量的增加而发生指数级的增长,以及收敛速度过慢的问题,提出了一种基于启发式奖赏函数的分层强化学习方法.该方法不仅能够大幅度减少环境状态空间,还... 针对强化学习在应用中经常出现的"维数灾"问题,即状态空间的大小随着特征数量的增加而发生指数级的增长,以及收敛速度过慢的问题,提出了一种基于启发式奖赏函数的分层强化学习方法.该方法不仅能够大幅度减少环境状态空间,还能加快学习的收敛速度.将此算法应用到俄罗斯方块的仿真平台中,通过对实验中的参数进行设置及对算法性能进行分析,结果表明:采用启发式奖赏函数的分层强化学习方法能在一定程度上解决"维数灾"问题,并具有很好的收敛速度. 展开更多
关键词 分层强化学习 试错 启发式奖赏函 俄罗斯方块 “维数灾”
下载PDF
客观预报中多时刻因子的应用及其效果 被引量:5
2
作者 张建海 王国强 《气象》 CSCD 北大核心 2005年第5期62-65,共4页
分析了在客观预报中单时刻因子与预报量之间存在着时间尺度上的不匹配问题,提出使用多时刻因子的必要性和可能性。对比试验表明,多时刻因子可改善大多数预报方程的质量,有效率达90.0%;多时刻因子使预报误差明显减小,预报方程的残差平方... 分析了在客观预报中单时刻因子与预报量之间存在着时间尺度上的不匹配问题,提出使用多时刻因子的必要性和可能性。对比试验表明,多时刻因子可改善大多数预报方程的质量,有效率达90.0%;多时刻因子使预报误差明显减小,预报方程的残差平方和平均减少23.8%。残差平方和的减少在各种场合有所不同,但呈现出一定的规律性。同时又指出,在多时刻因子中并不是包含的时刻越多越好,以防出现“维数灾”现象。 展开更多
关键词 客观预报 单时刻因子 预报量 “维数灾”现象 气象预报
下载PDF
3D Simulation of Storm Surge Disaster Based on Scenario Analysis
3
作者 王晓玲 孙小沛 +3 位作者 张胜利 孙蕊蕊 李瑞金 朱泽彪 《Transactions of Tianjin University》 EI CAS 2016年第2期110-120,共11页
The occurrence of storm surge disaster is often accompanied with floodplain, overflow, dike breach and other complex phenomena, while current studies on storm surge flooding are more concentrated on the 1D/2D numerica... The occurrence of storm surge disaster is often accompanied with floodplain, overflow, dike breach and other complex phenomena, while current studies on storm surge flooding are more concentrated on the 1D/2D numerical simulation of single disaster scenario(floodplain, overflow or dike breach), ignoring the composite effects of various phenomena. Therefore, considering the uncertainty in the disaster process of storm surge, scenario analysis was firstly proposed to identify the composite disaster scenario including multiple phenomena by analyzing key driving forces, building scenario matrix and deducing situation logic. Secondly, by combining the advantages of k-ω and k-ε models in the wall treatment, a shear stress transmission k-ω model coupled with VOF was proposed to simulate the 3D flood routing for storm surge disaster. Thirdly, risk degree was introduced to make the risk analysis of storm surge disaster. Finally, based on the scenario analysis, four scenarios with different storm surge intensity(100-year and 200-year frequency) were identified in Tianjin Binhai New Area. Then, 3D numerical simulation and risk map were made for the case. 展开更多
关键词 SIMULATION storm surge disaster scenario analysis risk degree 3D SST k-ω turbulence model composite scenario
下载PDF
分层模糊控制器的解析表达式及自适应控制方法 被引量:11
4
作者 滕树杰 张乃尧 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2002年第9期1248-1252,共5页
为解决模糊多变量控制中的“维数灾”问题 ,提出了一种 4输入 1输出的分层模糊控制器 ,推导了它的解析表达式。依据分层模糊控制器的解析表达式 ,提出了其设计参数的模型参考自学习方法 ,其中参考模型选取典型二阶系统 ,用梯度法设计自... 为解决模糊多变量控制中的“维数灾”问题 ,提出了一种 4输入 1输出的分层模糊控制器 ,推导了它的解析表达式。依据分层模糊控制器的解析表达式 ,提出了其设计参数的模型参考自学习方法 ,其中参考模型选取典型二阶系统 ,用梯度法设计自学习律 ,在线学习分层模糊控制器的可调参数 ,以达到最优值。为检验所提出控制策略的有效性 ,将其应用到板球系统的轨迹跟踪问题 ,并进行了仿真实验。仿真实验结果表明 ,这种分层模糊控制器的可调参数少 ,学习算法收敛快 ,控制效果好 ,具有较强的实用性。 展开更多
关键词 解析表达式 模糊多变量控制 “维数灾” 分层模糊控制器 模型参考自适应控制 模型参考自学习方法
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部