检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到2篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

基于优先级扫描Dyna结构的贝叶斯Q学习方法被引量：6: 1; 作者于俊刘全 +2 位作者傅启明孙洪坤陈桂兴《通信学报》 EI CSCD 北大核心 2013年第11期129-139,共11页; 贝叶斯Q学习方法使用概率分布来描述Q值的不确定性,并结合Q值分布来选择动作,以达到探索与利用的平衡。然而贝叶斯Q学习存在着收敛速度慢且收敛精度低的问题。针对上述问题,提出一种基于优先级扫描Dyna结构的贝叶斯Q学习方法—Dyna-PS-B... 展开更多; 关键词强化学习马尔科夫决策过程优先级扫描 Dyna结构贝叶斯q学习; 下载PDF 职称材料

基于贝叶斯Q学习的无人机集群抗干扰智能快跳频算法被引量：4: 2; 作者康雅洁林艳张一晋《航天控制》 CSCD 北大核心 2022年第2期73-78,共6页; 针对无人机集群抗干扰通信问题,提出了一种以同时实现信息传输速率最大化和跳频开销最小化为目标的智能快跳频算法。首先在传统Q学习基础上,利用近期信息价值增益选择跳频点,再依据对环境的观测信息,并运用矩更新方法修正基于高斯-伽马... 展开更多; 关键词无人机集群抗干扰通信快跳频贝叶斯q学习; 下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部