基于深度强化学习的无线资源分配算法

Wireless Resource Allocation Algorithm Based on Deep Reinforcement Learning

下载PDF

导出

摘要为了在有限的无线资源条件下提供更高的信息传输速率,第五代移动通信(5G)引入多种高效的频谱复用技术,如终端直通技术(Device-to-Device,D2D)和非正交多址技术(Non-orthogonal Multiple Access Technology,NOMA)等。针对D2D网络,提出一种无监督的基于深度强化学习(Deep Reinforcement Learning,DRL)的信道和功率分配算法,解决了D2D用户信息传输速率最大化的问题。文章将该问题分解为信道分配和功率分配两个子问题,并分别用深度强化学习算法获得较优的信道和功率分配策略。实验仿真结果表明,基于DRL的资源分配算法相比传统的优化算法,具有较低的时间复杂度以及更好的实验性能,更加适用于动态无线网络中的资源管理。 In order to provide higher information transmission rates under limited wireless resource conditions,a variety of efficient spectrum reuse technologies are introduced in the 5th Generation Mobile Communication(5G),such as Device-to-Device(D2D)and Non-orthogonal Multiple Access Technology(NOMA),etc.An unsupervised channel and power distribution algorithm based on Deep Reinforcement Learning(DRL)is proposed for D2D networks,which can solve the problem of maximizing the information transmission rate of D2D users.In this paper,the problem is divided into two sub-problems,channel allocation and power,and the better channel allocation strategy and power allocation strategy are obtained by deep reinforcement learning algorithm.Experimental simulation results show that the resource allocation algorithm based on DRL has lower time complexity and better experimental performance than the traditional optimization algorithm,and is more suitable for resource management in dynamic wireless networks.

作者张珍凤李芳 ZHANG Zhenfeng;LI Fang(Shanxi Institute of Energy,Taiyuan 030600,China)

机构地区山西能源学院

出处《现代信息科技》 2023年第17期8-14,共7页 Modern Information Technology

基金山西省基础研究计划(自由探索类)项目(202303021211285) 晋中市科技重点研发计划(工业)项目(Y211019)。

关键词 D2D网络资源分配深度强化学习 D2D network resource allocation deep reinforcement learning

分类号 TN929.5 [电子电信—通信与信息系统] TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献1

1陈慧敏.融合深度学习和强化学习的5G无线资源管理[J].移动通信,2021,45(4):135-139. 被引量：4

二级参考文献3

1汪周飞,袁伟娜.基于深度学习的多载波系统信道估计与检测[J].浙江大学学报（工学版）,2020,54(4):732-738. 被引量：9
2陈慕涵,郭佳佳,李潇,金石.基于深度学习的大规模MIMO信道状态信息反馈[J].物联网学报,2020,4(1):33-44. 被引量：6
3陈嘉润,余宝贤,王剑莹,张涵.基于深度神经网络的高频谱效率频分复用系统的信道估计方法[J].华南师范大学学报（自然科学版）,2020,52(3):17-21. 被引量：4

共引文献3

1王娟,史冬阳,邵浚哲.基于时序差分的动态信道分配算法[J].移动通信,2023,47(2):77-81.
2张林丛,桂洁淼.通信领域的人工智能技术应用[J].信息记录材料,2024,25(5):166-168. 被引量：1
3郭灿波.基于深度学习和强化学习的智能物流配送系统优化研究[J].物流工程与管理,2024,46(8):26-30.

1陆威.5G通信场景与关键技术研究[J].通信电源技术,2022,39(21):121-123.
2晋荣,张岩,任鹏,李晨朝.基于多波束阵列的窄带卫星通信频谱复用技术[J].卫星与网络,2021(12):70-75.
3赵旭剑,李杭霖.基于混合机制的深度神经网络压缩算法[J].计算机应用,2023,43(9):2686-2691. 被引量：1
4黄利祥,张新燕,梁帅,施锐,廖世强,张光昊.平抑风光功率波动的混合储能功率分配策略[J].科学技术与工程,2023,23(25):10825-10834. 被引量：6
5潘超,郭心悦.基于OFDMA的多小区协作可见光通信系统二维功率分配算法[J].光通信技术,2023,47(5):6-11.
6杨茵,刘毅力,崔关奇.计及分布电源消纳的混合储能系统优化配置[J].国外电子测量技术,2023,42(7):188-196. 被引量：2
7王祯旺,汤璇,魏宪,郑建漳,李致锋,谢宇芳.NOMA-VLC系统中最大化总和速率功率分配方法[J].信息技术,2023,47(9):19-25.
8林峰,李华,罗铖文,朱智勤.车联网中面向依赖任务的联合计算卸载及资源分配算法[J].重庆邮电大学学报（自然科学版）,2023,35(5):826-837. 被引量：2
9顾涛,李雨林,樊苗苗,李念思,余本东.热催化和光热复合催化百叶型Trombe墙实验性能探究[J].新能源进展,2023,11(4):348-355.
10严宏,童建飞,曾飘,李文静,周雯.面向低轨卫星通信的异质终端协同资源调度方法[J].移动通信,2023,47(10):65-70.

现代信息科技

2023年第17期

浏览历史

内容加载中请稍等...

基于深度强化学习的无线资源分配算法

参考文献1

二级参考文献3

共引文献3

相关作者

相关机构

相关主题

浏览历史