本文提出了一种在认知无线电网络中,基于演员-评论家(Actor-critic)的深度强化学习算法的动态功率分配方案。次用户在没有任何主用户功率策略的先验信息下,应用强化学习的算法,通过不断地与环境互动进行训练来学习到相应的功率控制策略...本文提出了一种在认知无线电网络中,基于演员-评论家(Actor-critic)的深度强化学习算法的动态功率分配方案。次用户在没有任何主用户功率策略的先验信息下,应用强化学习的算法,通过不断地与环境互动进行训练来学习到相应的功率控制策略,从而能够在不影响主用户正常通信的前提下,与主用户共享同一个信道来进行通信,以满足用户的服务质量(Quality of service,QoS)。我们的实验中也表明,次用户通过与环境的互动可以学习到有效的功率控制策略,从而达到主次用户都能满足自身的QoS的目标状态,并且相比于DQN算法,Actor-critic能够更快的收敛,并且达到很低的过渡步数。展开更多
在10 k V系统中广泛采用0.5 S级3×100 V 3×1.5(6)A三相三线智能电能表来计量315 k VA及以上专用变压器用户电能量。智能电能表在液晶显示屏上能够显示两相电流的极性,作为判别电能表电流极性正确与否的辅助依据。在电能表...在10 k V系统中广泛采用0.5 S级3×100 V 3×1.5(6)A三相三线智能电能表来计量315 k VA及以上专用变压器用户电能量。智能电能表在液晶显示屏上能够显示两相电流的极性,作为判别电能表电流极性正确与否的辅助依据。在电能表正确接线情况下,智能电能表的液晶屏显示应为“IuIw”。然而在实际工作中,当用户功率因数很低的情况下,即使接线正确,电能表也可能会显示“-Iu Iw”。展开更多
基金Project supported by the National Natural Science Foundation of China(Nos.61227801 and 61629101)Huawei Communications Technology Lab,Chinathe Open Research Foundation of Xi’an Jiaotong University,China(No.sklms2015015)
文摘本文提出了一种在认知无线电网络中,基于演员-评论家(Actor-critic)的深度强化学习算法的动态功率分配方案。次用户在没有任何主用户功率策略的先验信息下,应用强化学习的算法,通过不断地与环境互动进行训练来学习到相应的功率控制策略,从而能够在不影响主用户正常通信的前提下,与主用户共享同一个信道来进行通信,以满足用户的服务质量(Quality of service,QoS)。我们的实验中也表明,次用户通过与环境的互动可以学习到有效的功率控制策略,从而达到主次用户都能满足自身的QoS的目标状态,并且相比于DQN算法,Actor-critic能够更快的收敛,并且达到很低的过渡步数。
文摘在10 k V系统中广泛采用0.5 S级3×100 V 3×1.5(6)A三相三线智能电能表来计量315 k VA及以上专用变压器用户电能量。智能电能表在液晶显示屏上能够显示两相电流的极性,作为判别电能表电流极性正确与否的辅助依据。在电能表正确接线情况下,智能电能表的液晶屏显示应为“IuIw”。然而在实际工作中,当用户功率因数很低的情况下,即使接线正确,电能表也可能会显示“-Iu Iw”。