本文提出了一种在无线体域网(Wireless Body Area Networks,WBANs)中,基于强化学习的动态频谱分配方案。我们使用强化学习中基于Q值迭代的Q-Learning算法,在感知的信道池中以无监督学习的方式来训练多个智能体,使它们能够自主的建立一...本文提出了一种在无线体域网(Wireless Body Area Networks,WBANs)中,基于强化学习的动态频谱分配方案。我们使用强化学习中基于Q值迭代的Q-Learning算法,在感知的信道池中以无监督学习的方式来训练多个智能体,使它们能够自主的建立一套合作机制,从而获得最优的频谱分配策略,以防止发生同频干扰。文中,我们根据IEEE802.15.6标准来部署和搭建WBANs的环境。最后的仿真结果表明,在服务质量(Qos)的两个重要指标误码率(BER)和吞吐量(Throughout)上,我们的方法比静态信道分配(SCA)方法有明显的提升,而且,与RL-CAA算法相比,我们训练的收敛速度要快5倍以上。展开更多
文摘本文提出了一种在无线体域网(Wireless Body Area Networks,WBANs)中,基于强化学习的动态频谱分配方案。我们使用强化学习中基于Q值迭代的Q-Learning算法,在感知的信道池中以无监督学习的方式来训练多个智能体,使它们能够自主的建立一套合作机制,从而获得最优的频谱分配策略,以防止发生同频干扰。文中,我们根据IEEE802.15.6标准来部署和搭建WBANs的环境。最后的仿真结果表明,在服务质量(Qos)的两个重要指标误码率(BER)和吞吐量(Throughout)上,我们的方法比静态信道分配(SCA)方法有明显的提升,而且,与RL-CAA算法相比,我们训练的收敛速度要快5倍以上。