未来天基信息网络(space information network,SIN)领域将面临由结构复杂、环境动态、业务多样等发展趋势带来的挑战。数据驱动的深度强化学习(deep reinforcement learning,DRL)作为一种应对上述挑战的可行思路被引入SIN领域。首先简...未来天基信息网络(space information network,SIN)领域将面临由结构复杂、环境动态、业务多样等发展趋势带来的挑战。数据驱动的深度强化学习(deep reinforcement learning,DRL)作为一种应对上述挑战的可行思路被引入SIN领域。首先简要介绍了DRL的基本方法,并全面回顾了其在SIN领域的研究进展。随后,以星地网络场景的中继选择为例,针对大规模节点问题提出了基于平均场的DRL算法,并提出一种基于微调的模型迁移机制,用以解决仿真环境与真实环境之间的数据差异问题。仿真证明了其对网络性能优化的效果,且计算复杂度和时间效率均具有可行性。在此基础上归纳和总结了DRL方法在SIN领域的局限性与面临的挑战。最后,结合强化学习前沿进展,讨论了此领域未来的努力方向。展开更多
文摘未来天基信息网络(space information network,SIN)领域将面临由结构复杂、环境动态、业务多样等发展趋势带来的挑战。数据驱动的深度强化学习(deep reinforcement learning,DRL)作为一种应对上述挑战的可行思路被引入SIN领域。首先简要介绍了DRL的基本方法,并全面回顾了其在SIN领域的研究进展。随后,以星地网络场景的中继选择为例,针对大规模节点问题提出了基于平均场的DRL算法,并提出一种基于微调的模型迁移机制,用以解决仿真环境与真实环境之间的数据差异问题。仿真证明了其对网络性能优化的效果,且计算复杂度和时间效率均具有可行性。在此基础上归纳和总结了DRL方法在SIN领域的局限性与面临的挑战。最后,结合强化学习前沿进展,讨论了此领域未来的努力方向。