-
题名基于强化学习的动态频谱分配研究
被引量:1
- 1
-
-
作者
杜江
刘毅
-
机构
重庆邮电大学信息安全技术工程研究中心
-
出处
《数字通信》
2012年第4期34-38,共5页
-
文摘
首先介绍了认知无线电技术产生的背景,以及强化学习的发展和应用于认知领域的优势;接着对强化学习的基本原理及其2个常见的模型Q-Learning和POMDP作了介绍,并对其模型定义、思想、所要描述的问题和使用的场景都做了较详细的阐述;然后针对这个方向最近几年的顶级会议和期刊论文,分析了其主要内容;通过最近几年的学术、会议论文中所述的研究现状及成果,说明强化学习的主要特点是能够准确、快速学习到最优策略,能够模拟真实环境,自适应性强,提高频谱感知、分配效率,从而最大化系统吞吐量,这些优势充分证明了强化学习将是认知领域里一种很有前景的技术。
-
关键词
认知无线电
动态频谱分配
强化学习
Q学习
部分感知
马尔科夫决策过程
-
Keywords
cognitive radio
dynamic spectrum allocation
reinforcement Learning
Q-Learning
partial perception
POM- DP
-
分类号
TN925
[电子电信—通信与信息系统]
-