期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于因子分解机用于安全探索的Q表初始化方法
1
作者 曾柏森 钟勇 牛宪华 《计算机应用》 CSCD 北大核心 2022年第1期209-214,共6页
针对强化学习的大多数探索/利用策略在探索过程中忽略智能体随机选择动作带来的风险的问题,提出一种基于因子分解机(FM)用于安全探索的Q表初始化方法。首先,引入Q表中已探索的Q值作为先验知识;然后,利用FM建立先验知识中状态和行动间潜... 针对强化学习的大多数探索/利用策略在探索过程中忽略智能体随机选择动作带来的风险的问题,提出一种基于因子分解机(FM)用于安全探索的Q表初始化方法。首先,引入Q表中已探索的Q值作为先验知识;然后,利用FM建立先验知识中状态和行动间潜在的交互作用的模型;最后,基于该模型预测Q表中的未知Q值,从而进一步引导智能体探索。在OpenAIGym的网格强化学习环境Cliffwalk中进行的A/B测试里,基于所提方法的Boltzmann和置信区间上界(UCB)探索/利用策略的不良探索幕数分别下降了68.12%和89.98%。实验结果表明,所提方法提高了传统策略的探索安全性,同时加快了收敛。 展开更多
关键词 强化学习 Q-LEARNING 因子分解机 Q初始化 安全探索
下载PDF
面向对象程序设计(C++)中类的定义 被引量:1
2
作者 王梅 《电脑知识与技术》 2006年第2期170-171,共2页
本文讲述了在VisualC++6.0环境下,类的定义的三种方法,并且讲述了在类的外部实现类的成员函数时要注意的问题:包括派生类的构造函数中的初始化表,带缺省参数的成员函数、虚拟成员函数等。
关键词 构造函数 缺省参数 初始化表 虚拟函数 预处理
下载PDF
NAND Flash在大容量存储技术中的应用 被引量:12
3
作者 陈国 高杨 《航空计算技术》 2009年第2期113-116,共4页
如今航空电子系统对信息数据的处理量要求越来越高。随着存储技术的发展,使得航电系统记录和处理更多的数据成为可能。NAND Flash的独特架构设计让他成为大容量存储器设计的首选。以Samsung公司的NAND Flash芯片K9WAG08U1A为例,结合模... 如今航空电子系统对信息数据的处理量要求越来越高。随着存储技术的发展,使得航电系统记录和处理更多的数据成为可能。NAND Flash的独特架构设计让他成为大容量存储器设计的首选。以Samsung公司的NAND Flash芯片K9WAG08U1A为例,结合模块设计要求,介绍了芯片的基本结构和特点,硬件结构的连接。阐述了NAND Flash的独特的访问操作流程以及访问失败处理方法。 展开更多
关键词 NAND FLASH 大容量存储 初始化坏块 块擦除 页编程
下载PDF
基于蚁群信息素辅助的Q学习路径规划算法 被引量:6
4
作者 田晓航 霍鑫 +1 位作者 周典乐 赵辉 《控制与决策》 EI CSCD 北大核心 2023年第12期3345-3353,共9页
当Q学习应用于路径规划问题时,由于动作选择的随机性,以及Q表更新幅度的有限性,智能体会反复探索次优状态和路径,导致算法收敛速度减缓.针对该问题,引入蚁群算法的信息素机制,提出一种寻优范围优化方法,减少智能体的无效探索次数.此外,... 当Q学习应用于路径规划问题时,由于动作选择的随机性,以及Q表更新幅度的有限性,智能体会反复探索次优状态和路径,导致算法收敛速度减缓.针对该问题,引入蚁群算法的信息素机制,提出一种寻优范围优化方法,减少智能体的无效探索次数.此外,为提升算法初期迭代的目的性,结合当前栅格与终点位置关系的特点以及智能体动作选择的特性,设计Q表的初始化方法;为使算法在运行的前中后期有合适的探索概率,结合信息素浓度,设计动态调整探索因子的方法.最后,在不同规格不同特点的多种环境中,通过仿真实验验证所提出算法的有效性和可行性. 展开更多
关键词 Q学习 路径规划 Q初始化 探索概率 蚁群算法 信息素
原文传递
Improved decadal climate prediction in the North Atlantic using EnOI-assimilated initial condition 被引量:6
5
作者 Min Wei Qingquan Li +4 位作者 Xiaoge Xin Wei Zhou Zhenyu Han Yong Luo Zongci Zhao 《Science Bulletin》 SCIE EI CAS CSCD 2017年第16期1142-1147,共6页
Decadal prediction experiments of Beijing Climate Center climate system model version 1.1 (BCC- CSM1.1) participated in Coupled Model Intercomparison Project Phase 5 (CMIPS) had poor skill in extratropics of the N... Decadal prediction experiments of Beijing Climate Center climate system model version 1.1 (BCC- CSM1.1) participated in Coupled Model Intercomparison Project Phase 5 (CMIPS) had poor skill in extratropics of the North Atlantic, the initialization of which was done by relaxing modeled ocean temperature to the Simple Ocean Data Assimilation (SODA) reanalysis data. This study aims to improve the prediction skill of this model by using the assimilation technique in the initialization. New ocean data are firstly generated by assimilating the sea surface temperature (SST) of the Hadley Centre Sea Ice and Sea Surface Temperature (HadlSST) dataset to the ocean model of BCC-CSM1.1 via Ensemble Optimum Interpolation (EnOI). Then a suite of decadal reforecasts launched annually over the period 1961- 2005 is carried out with simulated ocean temperature restored to the assimilated ocean data. Comparisons between the re-forecasts and previous CMIP5 forecasts show that the re-forecasts are more skillful in mid-to-high latitude SST of the North Atlantic. Improved prediction skill is also found for the Atlantic multi-decadal oscillation (AMO), which is consistent with the better skill of Atlantic meridional overturning circulation (AMOC) predicted by the re-forecasts. We conclude that the EnOl assimilation generates better ocean data than the SODA reanalysis for initializing decadal climate prediction of BCC-CSM1.1 model. 展开更多
关键词 Decadal prediction EnOl Initialization AMO BCC-CSM
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部