期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于深度强化学习的异构云无线接入网自适应无线资源分配算法 被引量:18
1
作者 陈前斌 管令进 +3 位作者 李子煜 王兆堃 杨恒 唐伦 《电子与信息学报》 EI CSCD 北大核心 2020年第6期1468-1477,共10页
为了满足无线数据流量大幅增长的需求,异构云无线接入网(H-CRAN)的资源优化仍然是亟待解决的重要问题。该文在H-CRAN下行链路场景下,提出一种基于深度强化学习(DRL)的无线资源分配算法。首先,该算法以队列稳定为约束,联合优化拥塞控制... 为了满足无线数据流量大幅增长的需求,异构云无线接入网(H-CRAN)的资源优化仍然是亟待解决的重要问题。该文在H-CRAN下行链路场景下,提出一种基于深度强化学习(DRL)的无线资源分配算法。首先,该算法以队列稳定为约束,联合优化拥塞控制、用户关联、子载波分配和功率分配,并建立网络总吞吐量最大化的随机优化模型。其次,考虑到调度问题的复杂性,DRL算法利用神经网络作为非线性近似函数,高效地解决维度灾问题。最后,针对无线网络环境的复杂性和动态多变性,引入迁移学习(TL)算法,利用TL的小样本学习特性,使得DRL算法在少量样本的情况下也能获得最优的资源分配策略。此外,TL通过迁移DRL模型的权重参数,进一步地加快了DRL算法的收敛速度。仿真结果表明,该文所提算法可以有效地增加网络吞吐量,提高网络的稳定性。 展开更多
关键词 异构云无线接入网络 资源分配 深度强化学习 迁移学习
下载PDF
异构云无线接入网下基于功率域NOMA的能效优化算法 被引量:5
2
作者 唐伦 李子煜 +1 位作者 管令进 陈前斌 《电子与信息学报》 EI CSCD 北大核心 2021年第6期1706-1714,共9页
针对异构云无线接入网络的频谱效率和能效问题,该文提出一种基于功率域-非正交多址接入(PDNOMA)的能效优化算法。首先,该算法以队列稳定和前传链路容量为约束,联合优化用户关联、功率分配和资源块分配,并建立网络能效和用户公平的联合... 针对异构云无线接入网络的频谱效率和能效问题,该文提出一种基于功率域-非正交多址接入(PDNOMA)的能效优化算法。首先,该算法以队列稳定和前传链路容量为约束,联合优化用户关联、功率分配和资源块分配,并建立网络能效和用户公平的联合优化模型;其次,由于系统的状态空间和动作空间都是高维且具有连续性,研究问题为连续域的NP-hard问题,进而引入置信域策略优化(TRPO)算法,高效地解决连续域问题;最后,针对TRPO算法的标准解法产生的计算量较为庞大,采用近端策略优化(PPO)算法进行优化求解,PPO算法既保证了TRPO算法的可靠性,又有效地降低TRPO的计算复杂度。仿真结果表明,该文所提算法在保证用户公平性约束下,进一步提高了网络能效性能。 展开更多
关键词 异构云无线接入网络 资源分配 网络能效 深度强化学习
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部