设备到设备(Device to Device,D2D)通信可以提升频谱利用率和系统吞吐量,但由于D2D通信存在干扰问题,资源分配难度较大。近年来,深度强化学习(Deep Reinforcement Learning,DRL)被广泛应用于蜂窝通信的资源分配。因此,提出了一种基于优...设备到设备(Device to Device,D2D)通信可以提升频谱利用率和系统吞吐量,但由于D2D通信存在干扰问题,资源分配难度较大。近年来,深度强化学习(Deep Reinforcement Learning,DRL)被广泛应用于蜂窝通信的资源分配。因此,提出了一种基于优势演员-评论员(Advantage Actor-Critic,A2C)的资源分配算法,该算法可以根据环境状态选择最佳的D2D资源分配策略。通过仿真实验验证了该算法在网络性能上的优越性,并与其他算法进行了对比,结果表明,所提算法在提高系统吞吐率方面效果最好。因此,该算法为蜂窝网络中D2D通信资源分配问题提供了一种新的解决方案,具有广泛的应用前景。展开更多