摘要
随着无线网络被广泛使用,频谱资源变得越来越稀缺,高效的频谱分配策略对无线通信至关重要。动态频谱接入是一个动态时变优化问题,基于固定编码的算法无法自适应复杂的网络环境。本文将深度强化学习算法引入到认知无线电系统中,使智能体在未知频谱环境下不断与环境进行交互,学习到最佳频谱选择策略,提高频谱资源利用效率。实验结果表明:该算法在复杂的网络环境下能有效学习到最佳策略,且当网络环境发生变化时,算法能自动调整,实现二次收敛。
作者
杨洁祎
金光
朱家骅
Yang Jieyi;Jin Guang;Zhu Jiahua
出处
《数据通信》
2020年第3期46-49,52,共5页
基金
浙江省公益技术研究项目(LGG18F020007)
浙江省高等教育教学改革研究项目(JG20180070)。