多智能体强化学习驱动的无人机动态信道分配被引量：2

Dynamic Channel Allocation for UAV Formation Driven by Multi-agent Reinforcement Learning

下载PDF

导出

摘要针对无人机编队在进行远距离实时视频传输时频谱资源不足且利用效率低、吞吐量要求较高、传输任务难以完成等问题,提出了多智能体强化学习驱动的动态信道分配算法,使得无人机编队可以根据传输任务和信道环境动态地选择使用的信道,实现了频谱资源的高效利用。该算法使用了集中式训练分布式执行的架构,通过联合探索和联合学习的方式保证了无人机间的探索和合作能力,使得每架无人机均可以依据局部观测信息同时独立分配自身使用信道,提高了算法的灵活性和可行性,并减少了频谱分配用时。仿真结果表明,该算法训练过程性能更好,执行时相比于现有算法可以提高编队整体的平均任务传输成功率。 For the problems of insufficient spectrum resources,low utilization efficiency,high throughput requirements,and difficulty in completing transmission tasks when unmanned aerial vehicle(UAV)formation performs long-distance real-time video transmission,a dynamic channel allocation algorithm driven by multi-agent reinforcement learning is proposed.The UAV formation can dynamically select channel to transmit according to the transmission task and the channel environment,which realizes the efficient use of spectrum resources.The algorithm uses a centralized training and distributed execution architecture to ensure exploration and cooperation capabilities between UAVs through joint exploration and joint learning,so that each UAV can independently allocate its own channels according to local observation.The flexibility and feasibility of the algorithm are improved,and the time for spectrum allocation is reduced.The simulation results show that this algorithm has better performance in the training process,and can improve the overall average task transmission success rate of the formation compared with the existing algorithms in execution process.

作者翟云逸 ZHAI Yunyi(School of Information and Communication Engineering,Beijing University of Posts and Telecommunications,Beijing 100876,China)

机构地区北京邮电大学信息与通信工程学院

出处《电讯技术》北大核心 2023年第3期329-334,共6页 Telecommunication Engineering

基金国家自然科学基金资助项目(61941102)。

关键词无人机编队实时高清视频传输动态信道分配多智能体强化学习 UAV formation real-time HD video transmission dynamic channel allocation multi-agent reinforcement learning

分类号 TN929.5 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献3

1何建强,滕志军,刘皎.一种基于改进颜色敏感图论着色的频谱分配算法[J].计算机与数字工程,2019,47(8):1866-1868. 被引量：3
2刘鹏,张国翊,舒放,付博,曹凯,罗洋.基于图论的认知无线网络频谱动态分配[J].电讯技术,2020,60(6):625-631. 被引量：10
3于江,贺赛飞,张凤霞,肖创创,周化鹏,辛俊涛.模拟退火算法在战场频率资源分配中的应用[J].中国无线电,2018(1):34-38. 被引量：10

二级参考文献10

1许良凤.蜂窝移动通信中基于遗传退火的固定频率分配[J].安徽农业大学学报,2004,31(4):508-510. 被引量：5
2章春芳,陈崚,陈娟.求解频率分配问题的自适应的多种群蚁群算法.[J].小型微型计算机系统,2006,27(5):837-841. 被引量：11
3张艳刚,黄国策.基于模拟退火算法的固定频率分配问题[J].微计算机信息,2007,23(26):107-108. 被引量：1
4李一兵,杨蕊,高振国.基于着色理论的认知无线电频谱分配算法[J].系统工程与电子技术,2010,32(6):1109-1112. 被引量：17
5于江,沈刘平,张磊,范万水,贾瑞鹏.战场电磁频谱管理辅助决策系统构建研究[J].兵工自动化,2011,30(7):42-44. 被引量：11
6朱冰莲,裴光术,张磊,彭小秦.认知无线电网络中系统效益最大化的频谱分配[J].计算机工程,2012,38(3):107-109. 被引量：9
7郑志刚,薛菲,周井泉.网络效益最大化的认知无线电频谱分配算法[J].计算机技术与发展,2013,23(8):91-94. 被引量：4
8高洪元,曹金龙.认知无线电中的量子蛙跳频谱分配[J].应用科学学报,2014,32(1):19-26. 被引量：3
9吴慧欣,王秉,柴争义.一种采用并行免疫优化的频谱分配算法[J].西安电子科技大学学报,2014,41(4):111-115. 被引量：5
10朱江,巴少为,杜清敏.认知无线网络中一种非合作博弈功率控制算法[J].电讯技术,2016,56(12):1301-1309. 被引量：6

共引文献19

1刘龙海,冯云,宗容,李玲,刘丽萍,余江.一种GSM-R网内抗干扰频率配置方案[J].通信技术,2019,52(3):640-645. 被引量：1
2邢新华,王俊.基于BPSO的能量采集认知无线电频谱分配[J].信息通信,2020(11):31-34.
3吕培,赵杭生,张建照.一种基于信誉值拍卖的区块链下的感知收益分配机制[J].电讯技术,2021,61(1):1-7. 被引量：5
4张玮.网络LTE低频网UL动态频谱共享技术应用及吸纳效率提升[J].科技创新与应用,2021(11):167-169.
5牛侃,李冰,付强.基于混沌扰动机制粒子群算法的战场频率分配方法[J].系统仿真学报,2021,33(8):1905-1913. 被引量：5
6宋波,叶伟,孟祥辉.基于多智能体强化学习的动态频谱分配方法综述[J].系统工程与电子技术,2021,43(11):3338-3351. 被引量：3
7吴鑫辉,邹雨,郑锐.基于模糊综合决策的海军通信资源匹配方法研究[J].舰船电子工程,2021,41(11):61-63. 被引量：2
8李素桂,朱锦锋,龚让声.基于RFID的频谱动态信息实时采集技术研究[J].齐齐哈尔大学学报（自然科学版）,2022,38(2):38-43. 被引量：1
9滕志军,张华,张爱玲,韩忠廷,张恒嘉.融合Logistic映射的混沌二进制萤火虫频谱分配策略[J].哈尔滨理工大学学报,2022,27(4):16-22. 被引量：6
10刘倩,孙中森,刘方建,李贺,郑宇.基于优化烟花算法的认知无线电频谱分配方案研究[J].青岛大学学报（工程技术版）,2023,38(1):43-49. 被引量：1

同被引文献24

1王彤,李磊,蒋琪.“进攻性蜂群使能战术”项目推进无人蜂群能力发展分析[J].战术导弹技术,2020(1):33-38. 被引量：21
2徐博,陈立平,谭彧,徐旻.多架次作业植保无人机最小能耗航迹规划算法研究[J].农业机械学报,2015,46(11):36-42. 被引量：51
3苏抗,朱伟强,田达,杨绿溪.基于认知云的无人机群组信息对抗系统[J].航天电子对抗,2016,32(5):5-7. 被引量：2
4刘昌云,刘进忙,张晓刚.地面防空非对称信息对抗仿真研究[J].系统工程与电子技术,2002,24(8):27-30. 被引量：3
5叶孟宇.基于多臂赌博机的信道选择[J].软件,2018,39(4):196-200. 被引量：2
6李恒锐,王海元,樊明,贾理理.未来智慧城市联合作战[J].国防科技,2019,40(5):117-121. 被引量：3
7姜进晶,汪民乐,姜斌.无人机协同下远程火箭炮作战能力评估[J].火力与指挥控制,2020,45(7):120-125. 被引量：7
8吕震华,高亢.美国无人集群城市作战应用发展综述[J].中国电子科学研究院学报,2020,15(8):738-745. 被引量：27
9吴捷,胡盛华,乔莎莎,区昊辰.“忠诚僚机”式有人/无人机协同作战概念与任务管理技术研究[J].航空电子技术,2021,52(2):27-31. 被引量：10
10Geyi Sheng,Minghui Min,Liang Xiao,Sicong Liu.Reinforcement Learning-Based Control for Unmanned Aerial Vehicles[J].Journal of Communications and Information Networks,2018,3(3):39-48. 被引量：2

引证文献2

1吴义政,杜奕航,张余,钱鹏智.面向数据传输稳定性的无人机群频谱接入方法[J].电讯技术,2024,64(2):222-229.
2赵亮,费陈,贺拥亮.基于城市环境下无人机集群航迹规划发展研究[J].火炮发射与控制学报,2024,45(5):96-104.

1王娟,史冬阳,邵浚哲.基于时序差分的动态信道分配算法[J].移动通信,2023,47(2):77-81.
2费陈,郑晗,赵亮.基于强化学习的无人机智能任务分配方法[J].弹箭与制导学报,2022,42(6):61-67. 被引量：3
3贾丽慧.环境监测在环境工程管理中的作用[J].中文科技期刊数据库（全文版）工程技术,2021(8):86-87.
4陆升阳,赵怀林,刘华平.场景图谱驱动目标搜索的多智能体强化学习[J].智能系统学报,2023,18(1):207-215. 被引量：2
5陈博,孙鹏浩,兰巨龙,王雨薇,崔鹏帅,申涓.基于多智能体强化学习的域间多链路路由优化[J].信息工程大学学报,2022,23(6):641-647.
6张艳杰,马云珠.环境保护动态监测及应急管理的有效措施[J].中文科技期刊数据库（全文版）社会科学,2021(10):207-208.
7羊波,王琨,马祥祥,范彪,徐磊,闫浩.多智能体强化学习的机械臂运动控制决策研究[J].计算机工程与应用,2023,59(6):318-325. 被引量：6
8杨鹏,胡立夫.基于图像识别技术的地铁站智能闸机系统设计[J].电子产品世界,2023,30(3):34-38. 被引量：1
9杨磊,吴欣歆.教育测评变革的实践探索:指向问题解决过程的测试工具开发[J].中国教育学刊,2023(1):52-57. 被引量：13
10刘哲,贾生伟,张鸣,浦甲伦,韦常柱.再入轨迹多约束模型预测静态凸规划方法[J].宇航学报,2022,43(12):1638-1651. 被引量：3

电讯技术

2023年第3期

浏览历史

内容加载中请稍等...

多智能体强化学习驱动的无人机动态信道分配被引量：2

参考文献3

二级参考文献10

共引文献19

同被引文献24

引证文献2

相关作者

相关机构

相关主题

浏览历史

多智能体强化学习驱动的无人机动态信道分配 被引量：2

参考文献3

二级参考文献10

共引文献19

同被引文献24

引证文献2

相关作者

相关机构

相关主题

浏览历史

多智能体强化学习驱动的无人机动态信道分配被引量：2