-
题名基于SAC强化学习的车联网频谱资源动态分配
被引量:8
- 1
-
-
作者
黄煜梵
彭诺蘅
林艳
范建存
张一晋
余妍秋
-
机构
南京理工大学电子工程与光电技术学院
西安交通大学信息与通信工程学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2021年第9期34-43,共10页
-
基金
国家自然科学基金(62001225,62071236)
中央高校基本科研业务费专项资金(30920021127,30919011227)
江苏省自然科学青年基金(BK20190454)。
-
文摘
针对车联网频谱资源稀缺问题,提出一种基于柔性致动-评价(SAC)强化学习算法的多智能体频谱资源动态分配方案。以最大化信道总容量与载荷成功交付率为目标,建立车辆-车辆(V2V)链路频谱资源分配模型。将每条V2V链路作为单个智能体,构建多智能体马尔科夫决策过程模型。利用SAC强化学习算法设计神经网络,通过最大化熵与累计奖励和以训练智能体,使得V2V链路经过不断学习优化频谱资源分配。仿真结果表明,与基于深度Q网络和深度确定性策略梯度的频谱资源分配方案相比,该方案可以更高效地完成车联网链路之间的频谱共享任务,且信道传输速率和载荷成功交付率更高。
-
关键词
车联网
资源分配
多智能体强化学习
柔性致动-评价算法
频谱分配
-
Keywords
Internet of Vehicles(IoV)
resource allocation
multi-agent reinforcement learning
Soft Actor-Critic(SAC)algorithm
spectrum allocation
-
分类号
TP393.1
[自动化与计算机技术—计算机应用技术]
-