基于SumTree采样结合Double DQN的非合作式多用户动态功率控制方法被引量：1

A Non-cooperative Multi-user Dynamic Power Control Method Based on SumTree Sampling and Double DQN

下载PDF

导出

摘要为了保证认知无线网络中次用户本身的通信服务质量,同时降低次用户因发射功率不合理而造成的功率损耗,提出了一种基于SumTree采样结合深度双Q网络(Double Deep Q Network,Double DQN)的非合作式多用户动态功率控制方法。通过这种方法,次用户可以不断与辅助基站进行交互,在动态变化的环境下经过不断的学习,选择以较低的发射功率完成功率控制任务。其次,该方法可以解耦目标Q值动作的选择和目标Q值的计算,能够有效减少过度估计和算法的损失。并且,在抽取经验样本时考虑到不同样本之间重要性的差异,采用了结合优先级和随机抽样的SumTree采样方法,既能保证优先级转移也能保证最低优先级的非零概率采样。仿真结果表明,该方法收敛后的算法平均损失值能稳定在0.04以内,算法的收敛速度也至少快了10个训练回合,还能提高次用户总的吞吐量上限和次用户功率控制的成功率,并且将次用户的平均功耗降低了0.5 mW以上。 To ensure the communication service quality of the secondary users in cognitive wireless networks and reduce the power loss caused by the unreasonable transmit power of the secondary users,the authors propose a non-cooperative multi-user dynamic power control method based on SumTree sampling and Double Deep Q Network(Double DQN).With this method,the secondary users can not only continuously interact with the auxiliary base station and continuously learn in a dynamically changing environment,but also choose a lower transmit power to complete the power control task.Moreover,this method can decouple the selection of the target Q-value action and the calculation of the target Q-value,which can effectively reduce overestimation and algorithm loss.In addition,it considers the importance of difference between samples when extracting empirical samples and adopts the SumTree sampling method combining priority and random sampling,which can ensure both priority transfer and non-zero probability sampling of the lowest priority.The simulation results show that the average loss value after the convergence of this method can be stabilized within 0.04.The convergence speed of the algorithm is at least 10 training rounds faster.It can also improve the total throughput upper limitation of the secondary users and the success rate of the power control in secondary users,and reduce the average power consumption for secondary users by at least 0.5 mW.

作者刘骏王永华王磊尹泽中 LIU Jun;WANG Yonghua;WANG Lei;YIN Zezhong(School of Automation,Guangdong University of Technology,Guangzhou 510006,China)

机构地区广东工业大学自动化学院

出处《电讯技术》北大核心 2023年第10期1603-1611,共9页 Telecommunication Engineering

基金国家自然科学基金资助项目(61971147) 广东省研究生教育创新计划项目(2020JGXM040)。

关键词认知无线网络(CRN) 功率控制 SumTree采样深度强化学习 cognitive radio network(CRN) power control SumTree sampling deep reinforcement learning

分类号 TN929.5 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献2

1盘小娜,陈哲,李金泽,覃团发.一种利用优先经验回放深度Q-Learning的频谱接入算法[J].电讯技术,2020,60(5):489-495. 被引量：6
2叶梓峰,王永华,万频,杨贺淞,黄沛濠.基于优先记忆库结合竞争深度Q网络的动态功率控制[J].电讯技术,2019,59(10):1132-1139. 被引量：4

二级参考文献6

1周一青,潘振岗,翟国伟,田霖.第五代移动通信系统5G标准化展望与关键技术研究[J].数据采集与处理,2015,30(4):714-724. 被引量：95
2郑诗庭,蒙云番,邢杰,万海斌,覃团发.基于网络编码的衰落信道频谱感知算法[J].电讯技术,2015,55(9):964-971. 被引量：3
3沈一豪,李莉,裴仁超,罗汉文.基于频谱空隙利用率的频谱感知时间优化[J].上海师范大学学报（自然科学版）,2017,46(1):28-32. 被引量：2
4Tianqi Wang,Chao-Kai Wen,Hanqing Wang,Feifei Gao,Tao Jiang,Shi Jin.Deep Learning for Wireless Physical Layer: Opportunities and Challenges[J].China Communications,2017,14(11):92-111. 被引量：52
5朱江,蒋涛涛.认知无线网络中基于Stackelberg博弈的功率控制新算法[J].电讯技术,2018,58(4):363-369. 被引量：5
6袁雷,程岳,牛文生,罗午阳.基于深度学习的跑道前视红外图像轮廓线提取[J].电讯技术,2019,59(2):179-184. 被引量：10

共引文献8

1乔柳源,邱钊洋.基于认知无线电技术的电磁频谱资源调度算法[J].计算机仿真,2020,37(10):407-411. 被引量：3
2高宇,李昀,曹蓉蓉,李宁峰,高铭泽.基于多代理Double DQN算法模拟发电侧竞价行为[J].电网技术,2020,44(11):4175-4182. 被引量：14
3赵知劲,朱家晟,叶学义,尚俊娜.基于多智能体模糊深度强化学习的跳频组网智能抗干扰决策算法[J].电子与信息学报,2022,44(8):2814-2823. 被引量：4
4魏楠,魏祥麟,范建华,薛羽,胡永扬.面向频谱接入深度强化学习模型的后门攻击方法[J].计算机科学,2023,50(1):351-361. 被引量：1
5陈浩然,朱巍,于胜.基于深度强化学习的应急通信网规划方法[J].指挥控制与仿真,2023,45(1):150-156.
6杨亚让,吴云虎.基于随机森林的无线传感器通信网络阻塞故障检测[J].吉林大学学报（工学版）,2023,53(5):1490-1495.
7梁燕,胡垚林,惠莹.基于竞争双深度Q网络的频谱感知和接入[J].电讯技术,2023,63(11):1661-1669.
8代丽娜,裴冬菊,郑冬花,叶丽珠.基于强化学习的图像不确定性目标域提取仿真[J].计算机仿真,2024,41(3):145-148.

同被引文献5

1陈娟.ARINC653分区操作系统在综合模块化航空电子系统中的应用[J].电讯技术,2009,49(5):89-92. 被引量：16
2ZHOU Tianran,XIONG Huagang.Design of Energy-efficient Hierarchical Scheduling for Integrated Modular Avionics Systems[J].Chinese Journal of Aeronautics,2012,25(1):109-114. 被引量：14
3郭莎莎,王巍,朱晓飞.IMA平台重构中的人素和安全性研究[J].航空电子技术,2014,45(2):8-13. 被引量：3
4王恒,贾蒙.航空电子系统的发展历程及发展建议[J].数码世界,2019,0(8):6-6. 被引量：1
5罗庆,张涛,单鹏,张文涛,刘子豪.基于改进Q学习的IMA系统重构蓝图生成方法[J].航空学报,2021,42(8):320-329. 被引量：8

引证文献1

1马驰,张国群,孙俊格,吕广喆,张涛.基于深度强化学习的综合电子系统重构方法[J].空天防御,2024,7(1):63-70.

1李汉强,赵翠阳.教师学习途径研究述评[J].科教导刊,2023(20):73-76.
2康宽,郭沛,裴璇.中国生态碳汇的时空格局及影响因素[J].统计与决策,2023,39(14):157-162.
3骆臣勇,吴喆,汪亿,闫蕊.一种集成式公交站台共享单车存取系统的设计[J].机械,2023,50(10):44-48.
4彭继达,马治国,张春桂,党皓飞.基于RSEI模型的平潭岛生态质量变化研究[J].海峡科学,2023(5):3-7.
5爆笑编辑部[J].特区教育（小学生）,2023(9):30-31.
6张蓉.“携手童馨”德育名师工作坊建设概览[J].教育研究与评论,2023(9):85-88.
7陈超.“传统+回合”教学法在高校网球教学中的应用策略[J].网球天地,2023(7):75-77. 被引量：1
8刘秉镰,秦文晋.中国经济高质量发展水平的空间格局与动态演进[J].复印报刊资料（区域与城市经济）,2022(6):17-29.
9刘希娅.变革学习方式构建学校高质量育人生态[J].人民教育,2023(19):51-53.
10史立梅,李金珂.从嵌入式走向合作式:未成年人司法社会支持体系建设的路径思考[J].中国青年社会科学,2023,42(5):114-125. 被引量：3

电讯技术

2023年第10期

浏览历史

内容加载中请稍等...

基于SumTree采样结合Double DQN的非合作式多用户动态功率控制方法被引量：1

参考文献2

二级参考文献6

共引文献8

同被引文献5

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于SumTree采样结合Double DQN的非合作式多用户动态功率控制方法 被引量：1

参考文献2

二级参考文献6

共引文献8

同被引文献5

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于SumTree采样结合Double DQN的非合作式多用户动态功率控制方法被引量：1