基于改进Dueling DQN的无人机网络多域资源分配策略

A Multidomain Resource Allocation Strategy for UAV Network Based on Improved Dueling DQN

下载PDF

导出

摘要针对无人机(Unmanned Aerial Vehicle,UAV)网络节点间干扰导致通信质量降低问题,文中从空域与功率域出发,构建以最大化UAV系统频谱效率和能量效率为目标的波束成形与发射功率联合优化模型。针对该多域资源分配模型,提出参数化动作空间的加权Dueling DQN(P-wDDQN)学习算法,该算法适用于包含连续功率分配和离散波束成形的混合动作空间,且解决了Dueling DQN的目标Q值过低估计问题。利用所提P-wDDQN算法设计了联合波束与功率资源分配策略。仿真结果表明,所提多域资源分配策略提升了无人机网络的频谱效率和能量效率,且具有快速收敛的优势。 To address the problem of communication quality degradation due to inter-link interference in unmanned aerial vehicle(UAV)network,this paper constructs a joint beamforming and transmit power optimization model with the objective of maximizing the spectral efficiency and energy efficiency of UAV systems from the space and power domains.A weighted Dueling DQN learning algorithm based on parameterized action space(P-wDDQN)is proposed for the multidomain resource allocation model.This algorithm is suitable for mixed action spaces containing continuous power allocation and discrete beamforming,and solves the problem of overestimating the target Q value of Dueling DQN.A beamforming and power resource allocation strategy was designed using the proposed P-wDDQN algorithm.Simulation results show that the proposed multidomain resource allocation strategy improves the spectral efficiency and energy efficiency of UAV network and has the advantage of rapid convergence.

作者黄嘉伟黎海涛吕鑫 HUANG Jia-wei;LI Hai-tao;LV Xin(Faculty of Information Technology,Beijing University of Technology,Beijing 100124,China)

机构地区北京工业大学信息学部

出处《中国电子科学研究院学报》北大核心 2023年第7期646-651,共6页 Journal of China Academy of Electronics and Information Technology

基金航空科学基金资助项目(2018ZC15003)。

关键词 UAV网络深度强化学习多域资源分配参数化动作空间 UAV network deep reinforcement learning multidomain resource allocation parameterized action space

分类号 TN92 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献3

1陈新颖,盛敏,李博,赵楠.面向6G的无人机通信综述[J].电子与信息学报,2022,44(3):781-789. 被引量：70
2姚昌华,高泽郃,韩贵真,安蕾.基于数据辅助的无人机集群协同空域抗干扰[J].电子测量技术,2022,45(16):164-170. 被引量：3
3王晶,顾维博,窦立亚.基于Leader-Follower的多无人机编队轨迹跟踪设计[J].航空学报,2020(S01):88-98. 被引量：32

二级参考文献23

1陈宗基,魏金钟,王英勋,周锐.无人机自主控制等级及其系统结构研究[J].航空学报,2011,32(6):1075-1083. 被引量：75
2彭青.认知无线电MIMO中基于博弈论的功率控制算法[J].电子测量技术,2012,35(11):129-133. 被引量：4
3郭志军.拉格朗日乘子法在有约束条件的最优化问题研究[J].邢台学院学报,2013,28(4):170-171. 被引量：4
4尤肖虎,潘志文,高西奇,曹淑敏,邬贺铨.5G移动通信发展趋势与若干关键技术[J].中国科学：信息科学,2014,44(5):551-563. 被引量：725
5李彦冬,郝宗波,雷航.卷积神经网络研究综述[J].计算机应用,2016,36(9):2508-2515. 被引量：560
6任晓航,单宝堂,吴昊.新型快速DOA估计算法[J].国外电子测量技术,2016,35(8):22-25. 被引量：9
7“十三五”国家战略性新兴产业发展规划[J].中国产经,2016(12):95-96. 被引量：15
8宗群,王丹丹,邵士凯,张博渊,韩宇.多无人机协同编队飞行控制研究现状及发展[J].哈尔滨工业大学学报,2017,49(3):1-14. 被引量：146
9刘全,翟建伟,章宗长,钟珊,周倩,章鹏,徐进.深度强化学习综述[J].计算机学报,2018,41(1):1-27. 被引量：487
10张民,夏卫政,黄坤,陈欣.基于Leader-Follower编队的无人机协同跟踪地面目标制导律设计[J].航空学报,2018,39(2):225-237. 被引量：22

共引文献102

1王君,李昂.多无人机编队递归非奇异终端滑模容错控制[J].信息与控制,2024,53(1):71-85. 被引量：1
2任晓旭,仇超,邓辉,戴子明,刘泽军,王晓飞.边缘智能融合区块链:研究现状、应用及挑战[J].信息与控制,2024,53(1):1-16. 被引量：2
3王振威,刘凯,郭健,刘晓鹏.一种基于领导-跟随策略的多无人机-多无人艇编队协同机制[J].航空学报,2023,44(S02):453-468. 被引量：2
4王润升,罗屹洁,马增起,胡宏达,王嘉琦,周浩.对抗条件下无人机和智能反射面协同传输技术研究[J].电声技术,2023,47(1):133-137.
5韩智旭.浅析体系作战中无人机系统频谱管理[J].数字通信世界,2020(4):73-73.
6徐博,张大龙.基于量子行为鸽群优化的无人机紧密编队控制[J].航空学报,2020,41(8):307-318. 被引量：13
7吴宇,梁天骄.基于改进一致性算法的无人机编队控制[J].航空学报,2020,41(9):167-185. 被引量：26
8刘德元,刘昊,Frank L LEWIS.尾座式无人飞行器鲁棒容错编队控制[J].航空学报,2021,42(2):297-305. 被引量：3
9庞磊,曹志强,喻俊志.基于A^(*)和TEB融合的行人感知无碰跟随方法[J].航空学报,2021,42(4):495-504. 被引量：9
10齐阖荣,张民,姚洪斌.小型无人机编队队形保持与重构算法设计[J].兵工自动化,2021,40(11):32-35. 被引量：2

1王浩磊.提升农业经济管理信息化水平的对策探讨[J].上海商业,2023(9):164-166. 被引量：4
2李猛,付兴建.事件触发的时滞二阶多UAV系统一致性控制[J].火力与指挥控制,2023,48(5):25-32.
3陈佳美,李世昂,李玉峰,王宇鹏,别玉霞.基于甲虫搜索的改进粒子群无人机辅助网络部署优化算法[J].电子与信息学报,2023,45(5):1697-1705. 被引量：2
4武鲁明,于海斌,王亚权.多孔碳基非贵金属氧还原电催化剂研究进展[J].无机盐工业,2023,55(10):13-23.
5王帆.高校文化产业教学中新媒体营销策略的应用与探讨[J].大众文艺（学术版）,2023(18):144-146.
6陈逸雯,贺惠娟,张媛,宋嘉莉.压力知觉和积极应对在护生生命意义感与职业认同感间的链式中介作用[J].护理学杂志,2023,38(17):85-89. 被引量：11
7陆德江,王星,陈游,胡星.联合多种资源协同干扰组网雷达系统的自适应调度方法[J].系统工程与电子技术,2023,45(9):2744-2754.
8她娜.从抓词理句讲段探究小学语文教学研究[J].中文科技期刊数据库（全文版）教育科学,2023(11):91-93.
9郭富平.企业财务会计与内部审计的协同监督作用[J].纳税,2023(23):58-60.
10李静.中职计算机网络技术专业物联网技术教学实训的探索与实践[J].信息系统工程,2023(10):154-157. 被引量：3

中国电子科学研究院学报

2023年第7期

浏览历史

内容加载中请稍等...

基于改进Dueling DQN的无人机网络多域资源分配策略

参考文献3

二级参考文献23

共引文献102

相关作者

相关机构

相关主题

浏览历史