无蜂窝大规模MIMO中基于深度强化学习的无人机辅助通信与资源调度被引量：5

UAV Assisted Communication and Resource Scheduling in Cell-free Massive MIMO Based on Deep Reinforcement Learning Approach

下载PDF

导出

摘要无蜂窝大规模多入多出(MIMO)网络中分布式接入点(AP)同时服务多个用户,可以实现较大区域内虚拟MIMO的大容量传输;而无人机辅助通信能够为该目标区域热点或边缘用户提供覆盖增强。为了降低反馈链路负载,并有效提升无人机辅助通信的频谱利用率,该文研究了基于AP功率分配、无人机服务区选择和接入用户选择的联合调度;首先将AP功率分配和无人机服务区选择问题联合建模为双动作马尔可夫决策过程(DAMDP),提出了基于Q-learning和卷积神经网络(CNN)的深度强化学习(DRL)算法;然后将用户调度构造为一个0-1优化问题,并分解成子问题来求解。仿真结果表明,该文提出的基于DRL的资源调度方案与现有方案相比,可以有效提升无蜂窝大规模MIMO网络中频谱利用率。 Distributed Access Points(AP)in the cell-free massive Multiple Input Multiple Output(MIMO)networks serve multiple users at the same time,which can achieve large-capacity transmission of virtual MIMO in a larger area.Unmanned Aerial Vehicle(UAV)assisted communication can provide coverage enhancement for hotspots or edge users in this area.In order to improve the spectrum efficiency and reduce the feedback overhead,a joint resource scheduling scheme that includes AP power allocation,UAV service zone selection and user scheduling is proposed in this paper.Firstly,the AP power allocation and the UAV service zone selection problems are jointly modeled as a Double-Action Markov Decision Process(DAMDP).Then,a Deep Reinforcement Learning(DRL)algorithm based on Q-learning and Convolutional Neural Networks(CNN)is proposed.Furthermore,the user scheduling problem is formulated as a 0-1 optimization problem and solved by dividing into sub-problems.Simulation results demonstrate that the proposed DRL-based resource scheduling scheme exhibits a higher spectrum efficiency than existing schemes.

作者王朝炜邓丹昊王卫东江帆 WANG Chaowei;DENG Danhao;WANG Weidong;JIANG Fan(School of Electronic Engineering,Beijing University of Posts and Telecommunications,Beijing 100876,China;Key Laboratory of Universal Wireless Communications,Ministry of Education,Beijing 100876,China;School of Communication and Information Engineering,Xi’an University of Posts and Telecommunications,Xi’an 710061,China)

机构地区北京邮电大学电子工程学院泛网无线通信教育部重点实验室西安邮电大学通信与信息工程学院

出处《电子与信息学报》 EI CSCD 北大核心 2022年第3期835-843,共9页 Journal of Electronics & Information Technology

基金国家重点研发计划(2020YFB1807204)。

关键词无蜂窝大规模MIMO 无人机辅助通信资源调度深度增强学习 Cell-free massive MIMO UAV assisted communication Resource scheduling Deep Reinforcement Learning(DRL)

分类号 TN915 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献2

1王秀宏,乔清理,王正欧.Chaotic Neural Network Technique for "0-1" Programming Problems[J].Journal of Systems Engineering and Electronics,2003,14(4):99-105. 被引量：1
2尤肖虎,尹浩,邬贺铨.6G与广域物联网[J].物联网学报,2020,4(1):3-11. 被引量：56

二级参考文献22

1Tank D W, Hopfield J J. Simple "Neural" Optimization Networks: An A/D Converter, Signal Decision Circuit,and a Linear Programming Circuit. IEEE Trans. on Circ.Sys., 1986,33(5):533～541.
2Tagliarini G A, Page E W. Solving Constraints Satisfaction Problem with Neural network. Proc. of IEEE 1st IJCNN,1987, Ⅲ :741～747.
3Wilson G V, Pawley G S. On the Stability of the Traveling Salesman Problem Algorithm of Hopfield and Tank. Biolog. Cybernet, 1988, 58:63～70.
4Nozawa H. Solution of the Optimization Problem Using the Neural Network Model as a Globally Coupled Map. Physical D, 1994, 75(1 - 3): 179～ 189.
5Hopfield J J, Tank D W. "Neural" Computation of Decisions in Optimization Problems. Biolog. Cybern., 1985,52(1): 141～152.
6Hopfietd J J. Neurons with Graded Response Have Collective Computational Properties tike Those of Two-state Neurons. Proc. of Nat. Academy Sci., USA, 1984, 81:3088～ 3092.
7Bamnister J A, Trivedi K S. Task Allocation in Fault-tolerant Distributed System. in Hard Real-Time Systems (Tutorial). IEEE Computer Society Press, 1988: 256 ～272.
8Aihara K, Takabe T, Toyoda M. Chaotic Neural Networks. Phys. Lett. A, 1990, 144(6,7): 333-340.
9Smith K, Palaniswami M. Static and Dynamic Channel Assignment Using Neural Networks. IEEE J. Selected Areas Commun., 1997, 15(2) :238～249.
10Kirkpatrick K, Gelatt C D, Vecchi P V. Optimizatiom by Simulated Annealing. Science, 1983, 220: 671 680.

共引文献55

1王坦,丁家昕,许颖.未来移动通信频谱兼容共存研究方法浅析[J].移动通信,2020,44(6):22-28. 被引量：2
2赵军辉,李一博,王海明,张英豪.6G定位的潜力与挑战[J].移动通信,2020,44(6):75-81. 被引量：8
3吴启宗.6G网络性能指标、关键技术及愿景分析初探[J].信息技术与信息化,2020(6):153-155. 被引量：1
4刘海鹏,周淑秋.移动通信技术发展对安全生产影响研究[J].中国安全生产科学技术,2020,16(8):161-166. 被引量：7
5戴翠琴,李时鹏.星地融合通信中的卫星回传技术[J].移动通信,2020,44(9):27-33. 被引量：2
6陈文彬,庞建民,郑利斌,李新军.基于Mesh的电力无线多跳高效传输技术研究[J].南京信息工程大学学报（自然科学版）,2020,12(5):640-646. 被引量：1
7尤肖虎.Shannon信息论与未来6G技术潜能[J].中国科学：信息科学,2020,50(9):1377-1394. 被引量：10
8吴巍.天地一体化信息网络发展综述[J].天地一体化信息网络,2020,1(1):1-16. 被引量：72
9王磊军,陈荣军,赵慧民.编码收发空间调制系统的接收端联合优化算法[J].西安电子科技大学学报,2020,47(6):106-112.
10无.腾讯 Techo Park 开发者大会[J].消费电子,2020(11):21-35.

同被引文献48

1刘建庸,刘克.MARKOV DECISION PROGRAMMING WITH CONSTRAINTS[J].Acta Mathematicae Applicatae Sinica,1994,10(1):1-11. 被引量：1
2李东华,江驹,姜长生.多智能体强化学习飞行路径规划算法[J].电光与控制,2009,16(10):10-14. 被引量：8
3徐小野,李爱军,张丛丛,姚宗信.基于Q学习的变体无人机控制系统设计[J].西北工业大学学报,2012,30(3):340-344. 被引量：2
4宗群,王丹丹,邵士凯,张博渊,韩宇.多无人机协同编队飞行控制研究现状及发展[J].哈尔滨工业大学学报,2017,49(3):1-14. 被引量：143
5黄汉桥,白俊强,周欢,程昊宇,常晓飞.智能空战体系下无人协同作战发展现状及关键技术[J].导航与控制,2019,18(1):10-18. 被引量：30
6邓可,彭宣淇,周德云.基于矩阵对策与遗传算法的无人机空战决策[J].火力与指挥控制,2019,44(12):61-66. 被引量：25
7史清江,洪明毅,罗智泉.面向5G/B5G通信的智能无线资源管理技术[J].中国科学基金,2020,34(2):142-149. 被引量：11
8陈前斌,管令进,李子煜,王兆堃,杨恒,唐伦.基于深度强化学习的异构云无线接入网自适应无线资源分配算法[J].电子与信息学报,2020,42(6):1468-1477. 被引量：18
9徐顺清,石晶林,张宗帅,龙隆,任俊威.5G通信中基于混合波束成型的多用户MIMO调度算法研究[J].高技术通讯,2020,30(6):545-552. 被引量：5
10何金,丁勇,高振龙.基于Double Deep Q Network的无人机隐蔽接敌策略[J].电光与控制,2020,27(7):52-57. 被引量：9

引证文献5

1李波,黄晶益,万开方,宋超.基于深度强化学习的无人机系统应用研究综述[J].战术导弹技术,2023(1):58-68. 被引量：1
2龚万炜.面向5G网络的多用户MIMO调度方法[J].数字通信世界,2023(6):26-28. 被引量：1
3蓝基银.基于改进粒子群算法的无人机通信链路资源分配技术研究[J].现代传输,2023(5):58-62.
4张伟.基于强化学习的5G无线资源管理方法研究[J].移动通信,2023,47(12):66-70.
5刘飞扬,万子芊,纪金伟,朱鹏博.面向无人机的无蜂窝系统资源优化算法研究[J].无线电工程,2024,54(8):1986-1993.

二级引证文献2

1徐天宇,徐江华.无人机自动机库造型设计研究综述[J].艺术科技,2023,36(18):177-179.
2陈瑜,辛正明,苟浩淞.基于超级小区的SuperMIMO功能的应用研究[J].通信与信息技术,2023(S02):81-83.

1杨柳,朱立,冯畅,邹君,郭哿,吴卓林,刘子怡.生态文明建设下湖南省城镇化的时空特点及其优化对策[J].亚热带资源与环境学报,2021,16(3):87-94. 被引量：1
2周天依,潘春雨,郑镛,李学华.联邦边缘学习的低功耗带宽分配与用户调度[J].北京信息科技大学学报（自然科学版）,2022,37(1):27-33.
3曾柏森,钟勇,牛宪华.基于因子分解机用于安全探索的Q表初始化方法[J].计算机应用,2022,42(1):209-214.
4谢伟.低精度量化下VMIMO-OFDMA中继传输技术的研究[J].信息技术,2022,46(2):69-75. 被引量：3
5冯振华,方瑜,施鹄.大容量、智能化光传输系统:机遇、挑战与应对策略[J].中兴通讯技术,2022,28(1):62-69. 被引量：3
6贺伊琳,宋若旸,马建.基于强化学习DDPG的智能车辆轨迹跟踪控制[J].中国公路学报,2021,34(11):335-348. 被引量：13
7顾琪,苏鑫,吴丹,王菡凝,崔景源,李亚,袁弋非,王启星.智能超表面性能仿真与测试[J].无线电通信技术,2022,48(2):297-304. 被引量：1
8李传煌,陈泱婷,唐晶晶,楼佳丽,谢仁华,方春涛,王伟明,陈超.QL-STCT:一种SDN链路故障智能路由收敛方法[J].通信学报,2022,43(2):131-142.
9金兴平.2021年长江流域水工程联合调度实践与成效[J].中国水利,2022(5):16-19. 被引量：10
10樊园杰,张磊,吴利刚,周倩,张梁.基于强化学习的写字楼动态电力价格策略[J].科学技术与工程,2022,22(8):3202-3208. 被引量：2

电子与信息学报

2022年第3期

浏览历史

内容加载中请稍等...

无蜂窝大规模MIMO中基于深度强化学习的无人机辅助通信与资源调度被引量：5

参考文献2

二级参考文献22

共引文献55

同被引文献48

引证文献5

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

无蜂窝大规模MIMO中基于深度强化学习的无人机辅助通信与资源调度 被引量：5

参考文献2

二级参考文献22

共引文献55

同被引文献48

引证文献5

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

无蜂窝大规模MIMO中基于深度强化学习的无人机辅助通信与资源调度被引量：5