为了解决移动通信网络中频谱资源短缺、链路间干扰严重以及能耗较高等问题,针对设备到设备(Device to Device,D2D)网络提出一种分布式框架的深度强化学习算法,采用双Q和竞争结构解决状态空间过大和Q值高估的问题,通过引入无线携能技术...为了解决移动通信网络中频谱资源短缺、链路间干扰严重以及能耗较高等问题,针对设备到设备(Device to Device,D2D)网络提出一种分布式框架的深度强化学习算法,采用双Q和竞争结构解决状态空间过大和Q值高估的问题,通过引入无线携能技术有效地补偿了系统能耗,在蜂窝用户最低和速率要求以及D2D用户功率分流比等非线性约束条件下,基于变化的位置和信道状态信息,同步分配资源块、D2D用户发射功率和功率分流比,实现能效最优化。仿真结果表明,在保证蜂窝用户和速率的前提下,所提方案在D2D总能效方面优于基线算法,在具有大规模移动用户的通信网络中鲁棒性更强。展开更多
文摘为了解决移动通信网络中频谱资源短缺、链路间干扰严重以及能耗较高等问题,针对设备到设备(Device to Device,D2D)网络提出一种分布式框架的深度强化学习算法,采用双Q和竞争结构解决状态空间过大和Q值高估的问题,通过引入无线携能技术有效地补偿了系统能耗,在蜂窝用户最低和速率要求以及D2D用户功率分流比等非线性约束条件下,基于变化的位置和信道状态信息,同步分配资源块、D2D用户发射功率和功率分流比,实现能效最优化。仿真结果表明,在保证蜂窝用户和速率的前提下,所提方案在D2D总能效方面优于基线算法,在具有大规模移动用户的通信网络中鲁棒性更强。