期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于强化学习的动态频谱分配研究 被引量:1
1
作者 杜江 刘毅 《数字通信》 2012年第4期34-38,共5页
首先介绍了认知无线电技术产生的背景,以及强化学习的发展和应用于认知领域的优势;接着对强化学习的基本原理及其2个常见的模型Q-Learning和POMDP作了介绍,并对其模型定义、思想、所要描述的问题和使用的场景都做了较详细的阐述;然后针... 首先介绍了认知无线电技术产生的背景,以及强化学习的发展和应用于认知领域的优势;接着对强化学习的基本原理及其2个常见的模型Q-Learning和POMDP作了介绍,并对其模型定义、思想、所要描述的问题和使用的场景都做了较详细的阐述;然后针对这个方向最近几年的顶级会议和期刊论文,分析了其主要内容;通过最近几年的学术、会议论文中所述的研究现状及成果,说明强化学习的主要特点是能够准确、快速学习到最优策略,能够模拟真实环境,自适应性强,提高频谱感知、分配效率,从而最大化系统吞吐量,这些优势充分证明了强化学习将是认知领域里一种很有前景的技术。 展开更多
关键词 认知无线电 动态频谱分配 强化学习 Q学习 部分感知 马尔科夫决策过程
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部