智能电网中基于多智能体强化学习的频谱分配算法被引量：1

Spectrum allocation algorithm based on multi-agent reinforcement learning in smart grid

下载PDF

导出

摘要针对智能电网中利用5G网络承载多样化电力终端的业务需求,提出了一种基于多智能体强化学习的频谱分配算法。首先,基于智能电网中部署的集成接入回程系统,考虑智能电网中轻量化和非轻量化终端业务的不同通信需求,将频谱分配问题建模为最大化系统总能效的非凸混合整数规划。其次,将前述问题构建为一个部分可观测的马尔可夫决策过程并转换为完全协作的多智能体问题,进而提出了一种集中训练分布执行框架下基于多智能体近端策略优化的频谱分配算法。最后,通过仿真验证了所提算法的性能。仿真结果表明,所提算法具有更快的收敛速度,通过有效减少层内与层间干扰、平衡接入与回程链路速率,可以将系统总速率提高25.2%。 In view of the fact that 5G networks are used to meet the service requirements of various power terminals in smart grid,a spectrum allocation algorithm based on multi-agent reinforcement learning was proposed.Firstly,for the integrated access backhaul system deployed in smart grid,considering the different communication requirements of services in lightweight and non-lightweight terminal,the spectrum allocation problem was formulated as a non-convex mixed-integer programming aiming to maximize the overall energy efficiency.Secondly,the above problem was modeled as a partially observable Markov decision process and transformed into a fully cooperative multi-agent problem,then a spectrum allocation algorithm was proposed which was based on multi-agent proximal policy optimization under the framework of centralized training and distributed execution.Finally,the performance of the proposed algorithm was verified by simulation.The results show that the proposed algorithm has a faster convergence speed and can increase the overall transmission rate by 25.2%through effectively reducing intra-layer and inter-layer interference and balancing the access and backhaul link rates.

作者燕锋林晓薇李正浩徐霞夏玮玮沈连丰 YAN Feng;LIN Xiaowei;LI Zhenghao;XU Xia;XIA Weiwei;SHEN Lianfeng(National Mobile Communications Research Laboratory,Southeast University,Nanjing 210096,China;School of Software,Southeast University,Nanjing 211100,China;State Grid Shandong Information and Telecommunication Company,Jinan 250001,China;State Grid Jinan Power Supply Company,Jinan 250012,China)

机构地区东南大学移动通信全国重点实验室东南大学软件学院国网山东省电力公司信息通信公司国网山东省电力公司济南供电公司

出处《通信学报》 EI CSCD 北大核心 2023年第9期12-24,共13页 Journal on Communications

基金国家电网有限公司科技基金资助项目(No.520601220022)。

关键词智能电网集成接入回程频谱分配多智能体强化学习 smart grid integrated access and backhaul spectrum allocation multi-agent reinforcement learning

分类号 TN92 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献3

1周凡,王鸿,宋荣方.密集异构蜂窝网络中基于深度强化学习的下行链路功率分配算法[J].南京邮电大学学报（自然科学版）,2021,41(2):12-19. 被引量：8
2徐思雅,邢逸斐,郭少勇,杨超,邱雪松,孟洛明.基于深度强化学习的能源互联网智能巡检任务分配机制[J].通信学报,2021,42(5):191-204. 被引量：10
3喻鹏,张俊也,李文璟,周凡钦,丰雷,付澍,邱雪松.移动边缘网络中基于双深度Q学习的高能效资源分配方法[J].通信学报,2020,41(12):148-161. 被引量：8

二级参考文献14

1张玲.OFDM系统中基于能量效率的低复杂度算法的研究与仿真[J].软件,2012,33(11):137-140. 被引量：1
2冯陈伟,袁江南.基于强化学习的异构无线网络资源管理算法[J].电信科学,2015,31(8):99-106. 被引量：5
3田辉,范绍帅,吕昕晨,赵鹏涛,贺硕.面向5G需求的移动边缘计算[J].北京邮电大学学报,2017,40(2):1-10. 被引量：81
4刘全,翟建伟,章宗长,钟珊,周倩,章鹏,徐进.深度强化学习综述[J].计算机学报,2018,41(1):1-27. 被引量：431
5廖晓闽,严少虎,石嘉,谭震宇,赵钟灵,李赞.基于深度强化学习的蜂窝网资源分配算法[J].通信学报,2019,40(2):11-18. 被引量：35
6陈亮,余少华.6G移动通信发展趋势初探(特邀)[J].光通信研究,2019,0(4):1-8. 被引量：35
7王立科.无人机技术在电力巡检信息化管理中的应用研究[J].机电信息,2019,0(27):88-89. 被引量：2
8严波,林世忠,张振威,洪骁.无人机电力巡检技术应用分析[J].自动化应用,2019,0(12):155-156. 被引量：8
9陈兰波.电力线路无人机巡检方案研究[J].科技与创新,2020(11):36-38. 被引量：8
10李君海,张苗苗,熊道洋.基于实时信息传输技术的无人机巡检管控平台[J].测绘与空间地理信息,2020,43(6):165-167. 被引量：6

共引文献23

1范艳芳,袁爽,蔡英,陈若愚.车载边缘计算中基于深度强化学习的协同计算卸载方案[J].计算机科学,2021,48(5):270-276. 被引量：12
2贺文晨,郭少勇,邱雪松,陈连栋,张素香.基于DRL的联邦学习节点选择方法[J].通信学报,2021,42(6):62-71. 被引量：7
3汤翔,杨源.海上风电场智能无人巡检方案研究[J].电工技术,2021(20):12-14. 被引量：6
4张瑞森,万兴鸿,高昕.一种改进的少样本农作物目标识别算法研究[J].软件工程,2022,25(1):10-13.
5曹峰,崔少华,荆治家,姚宝珍.面向巡检车与无人机协同电力巡检的车辆路径规划方法[J].交通运输工程与信息学报,2022,20(2):95-104. 被引量：5
6孙明,王淑梅,郭媛,曹伟,徐耀群.基于深度无监督学习的多小区蜂窝网资源分配方法[J].控制与决策,2022,37(9):2333-2342. 被引量：2
7刘亚辉,申兴旺,顾星海,彭涛,鲍劲松,张丹.面向柔性作业车间动态调度的双系统强化学习方法[J].上海交通大学学报,2022,56(9):1262-1275. 被引量：2
8陈智雄,杨家伟,肖楠,田新成.基于无线携能传输和多级边缘卸载的空地协作巡检算法[J].电网技术,2022,46(10):3961-3969. 被引量：4
9陈赓,齐书虎,沈斐,曾庆田.面向B5G多业务场景基于D3QN的双时间尺度网络切片算法[J].通信学报,2022,43(11):213-224. 被引量：2
10李长云,黎建波,徐曦,李亭立.具有能量收集设备的移动边缘计算资源分配研究[J].系统仿真学报,2022,34(11):2313-2322. 被引量：2

同被引文献6

1史清江,洪明毅,罗智泉.面向5G/B5G通信的智能无线资源管理技术[J].中国科学基金,2020,34(2):142-149. 被引量：11
2陈前斌,管令进,李子煜,王兆堃,杨恒,唐伦.基于深度强化学习的异构云无线接入网自适应无线资源分配算法[J].电子与信息学报,2020,42(6):1468-1477. 被引量：17
3孙茜,田霖,周一青,冯晨,王园园,周继华.面向B5G和6G的边缘计算与网络切片资源管理[J].电信科学,2021,37(6):55-65. 被引量：5
4李攀攀,谢正霞,乐光学,刘鑫.基于深度学习的无线通信接收方法研究进展与趋势[J].电信科学,2022,38(2):1-17. 被引量：6
5王朝炜,邓丹昊,王卫东,江帆.无蜂窝大规模MIMO中基于深度强化学习的无人机辅助通信与资源调度[J].电子与信息学报,2022,44(3):835-843. 被引量：4
6杨凡,杨成,黄杰,张仕龙,喻涛,左迅,杨川.6G密集网络中基于深度强化学习的资源分配策略[J].通信学报,2023,44(8):215-227. 被引量：1

引证文献1

1张伟.基于强化学习的5G无线资源管理方法研究[J].移动通信,2023,47(12):66-70.

1陈铭毓,沈建华.一种提高弹性光网络性能的PDT-TFDBT策略[J].光通信技术,2023,47(5):16-21.
2秦巧珍,刘华林,魏志伟.沿海炼厂原油调度优化问题中不同时间表征方式的对比分析[J].化工自动化及仪表,2023,50(5):680-688.
3郭鹏,郝东辉,郑鹏,王祺欣.考虑工人疲劳的双资源柔性作业车间调度优化[J].浙江大学学报（工学版）,2023,57(9):1804-1813.
4刘乔寿,周雄,刘爽,邓义锋.基于深度强化学习的OFDM自适应导频设计[J].通信学报,2023,44(9):104-114.
5王军栋.基于GPRS的智能高铁自动驾驶技术应用研究[J].铁路通信信号工程技术,2023,20(9):30-35.
6刘萱,贺飞.强b-距离空间中的Ekeland变分原理[J].应用数学,2023,36(4):877-883.
7董文静,赵月爱.基于卷积网络的Adam算法的改进[J].太原师范学院学报（自然科学版）,2023,22(3):5-12.
8王冉,张军武,余亮.组稀疏低秩矩阵估计的变转速滚动轴承故障特征提取[J].振动与冲击,2023,42(16):92-100.
9刘文涛,Manzoor Ahmed,林青.基于DRL的主动RIS安全无线通信优化方法[J].计算机应用研究,2023,40(9):2808-2814. 被引量：1
10胡益笛,夏银水.基于深度强化学习的存内计算部署优化算法[J].计算机应用研究,2023,40(9):2616-2620.

通信学报

2023年第9期

浏览历史

内容加载中请稍等...

智能电网中基于多智能体强化学习的频谱分配算法被引量：1

参考文献3

二级参考文献14

共引文献23

同被引文献6

引证文献1

相关作者

相关机构

相关主题

浏览历史

智能电网中基于多智能体强化学习的频谱分配算法 被引量：1

参考文献3

二级参考文献14

共引文献23

同被引文献6

引证文献1

相关作者

相关机构

相关主题

浏览历史

智能电网中基于多智能体强化学习的频谱分配算法被引量：1