具有精英策略的深度强化学习无人机集群通信网络拓扑设计被引量：7

Topology Design of Network Based on Deep Reinforcement Learning with Strategy of Elite

下载PDF

导出

摘要针对集群无人机背景下定向天线网络拓扑设计的NP-hard特点,基于网络高抗毁、低功耗、高稳定性等要求,以抗毁性(3-连通)、链路量、链路功耗和稳定性为奖励,提出了一种具有精英策略的深度强化学习通信网络拓扑生成算法,验证了精英经验池加速训练效果。与传统DQN相比,引入精英经验池能够有效加速模型收敛,训练时间减少3倍以上。与遗传算法相比,算法分离了训练与使用过程,当网络训练完成后,能够根据场景需要实时计算通信网络拓扑。实验阶段设计了随机给定空间位置的6节点、10节点、24节点和36节点的3-连通通信网络拓扑。实验结果表明:所提算法具有强的实时性和适用性,对于不大于36节点的网络,可在183 ms内实现网络拓扑的更新计算,达到了实际应用的实时性要求。 Aiming at the NP-hard characteristics of directional antenna network topology design under cluster UAV background,an elite strategy for deep reinforcement learning communication network topology generation algorithm is introduced with the requirements of high survivability,low power consumption and high stability of the network,which has the rewarding of invulnerability(3-connectivity),link quantity,link power consumption and stability.Compared with traditional DQN,elite experience pool verifies the acceleration training effect by effectively accelerating the convergence of the model and reducing the training time by more than three times.Rather than genetic algorithm,this algorithm separates the processes of use and training.When the network training is completed,the communication network topology can be calculated in real time with the needs of scene.In experimental stage,a 3-connected communication network topology with randomly given spatial location is designed which includes 6 nodes,10 nodes,24 nodes and 36 nodes.The experimental results has shown that this proposed algorithm has strong real-time and applicability,it can help network topology which has less than 36 nodes update in 183 ms so that meeting the real-time requirements of practical application.

作者董方昊冯有前尹忠海梁晓龙周诚李明杰 DONG Fanghao;FENG Youqian;YIN Zhonghai;LIANG Xiaolong;ZHOU Cheng;LI Mingjie(Department of Basic Science,Air Force Engineering University,Xi’an710051,China;Air Traffic Control and Navigation College,Air Force Engineering University,Xi’an710051,China)

机构地区空军工程大学基础部空军工程大学空管领航学院

出处《空军工程大学学报（自然科学版）》 CSCD 北大核心 2019年第4期52-58,共7页 Journal of Air Force Engineering University(Natural Science Edition)

基金国家自然科学基金(61472443)

关键词深度强化学习精英经验池通信网络连通度通信网络拓扑 deep reinforcement learning elite experience pool connectivity communication network topology

分类号 V279 [航空宇航科学与技术—飞行器设计] TN915.0 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献10

1袁培燕,李腊元.Ad Hoc网络连通度的研究[J].计算机工程与应用,2008,44(2):177-178. 被引量：3
2陈侠,鹿振宇.风场干扰下基于一致性卡尔曼滤波的UAV编队控制算法[J].兵工自动化,2013,32(10):28-32. 被引量：6
3张艳娥,刘国义,孙建平,龙吉江.二项分布及其应用[J].数理医药学杂志,2004,17(5):390-391. 被引量：2
4景晓年,梁晓龙,张佳强,朱磊.航空集群作战编队优化控制研究[J].计算机仿真,2017,34(4):90-94. 被引量：9
5王亚利,冯有前,刘志国,尹忠海,孙强.基于遗传算法的定向天线网络拓扑控制[J].空军工程大学学报（自然科学版）,2018,19(2):51-55. 被引量：2
6王班,马润年,王刚.基于自然连通度的复杂网络抗毁性研究[J].计算机仿真,2015,32(8):315-318. 被引量：12
7牛轶峰,肖湘江,柯冠岩.无人机集群作战概念及关键技术分析[J].国防科技,2013,34(5):37-43. 被引量：120
8陈瑶,梁加红,邹顺,曹娟.无人机Ad Hoc网络拓扑控制算法研究[J].计算机仿真,2010,27(7):33-37. 被引量：10
9陈希亮,曹雷,李晨溪,徐志雄,何明.基于重抽样优选缓存经验回放机制的深度强化学习方法[J].控制与决策,2018,33(4):600-606. 被引量：24
10吴俊,谭跃进.复杂网络抗毁性测度研究[J].系统工程学报,2005,20(2):128-131. 被引量：120

二级参考文献91

1郭铭,阎昊,韦有平.移动自组网络在无人机通信中的应用研究[J].舰船电子工程,2008,28(6):59-62. 被引量：9
2车宏安,顾基发.无标度网络及其系统科学意义[J].系统工程理论与实践,2004,24(4):11-16. 被引量：97
3邹仕洪,程时端.一种多速率移动自组网中的拓扑控制算法[J].软件学报,2004,15(12):1869-1876. 被引量：8
4赵林亮,姜月秋,初春,王光兴.移动Ad hoc网络中基于MIB的分簇拓扑控制算法的研究[J].小型微型计算机系统,2005,26(11):1881-1885. 被引量：2
5朱恩明,常义林,季静.战场环境下Ad Hoc容错性拓扑控制算法研究[J].电子科技,2006,19(7):9-11. 被引量：1
6沈中,常义林,崔灿,张新.一种建立可自维护且具有最小能量特性的无线网络的分布式拓扑控制算法[J].计算机学报,2007,30(4):569-578. 被引量：11
7张学,陆桑璐,陈贵海,陈道蓄,谢立.无线传感器网络的拓扑控制[J].软件学报,2007,18(4):943-954. 被引量：100
8杨树勤.卫生统计学[M].北京:人民卫生出版社,1997.150-150.
9盛骤等.概率论与数理统计[M].高等教育出版社,1997,1..
10Shen Chien-Chung,Chavalit Srisathapornphat.CLTC:A Cluster-Based Topology Control Framework for Ad Hoc Networks[C].IEEE Transactions on mobile computing,2004,3(1):18-32.

共引文献296

1彭正忠,欧青华.无人机蜂群作战及其关键技术研究[J].舰船电子工程,2023,43(1):1-4.
2刘建香.复杂网络及其在国内研究进展的综述[J].系统科学学报,2009,17(4):31-37. 被引量：72
3王林,张书延.Internet AS层网络的演化分析[J].系统工程学报,2010,25(1):1-5. 被引量：3
4李平,吴佳英.基于超立方体弱连通性质的多态网络研究[J].系统工程学报,2010,25(3):298-303. 被引量：1
5王治莹,李春发.超网络视角下生态工业共生网络稳定性研究[J].大连理工大学学报（社会科学版）,2013,34(1):14-18. 被引量：9
6侯雨桥,屈宇,刘林峰,郑庆华,刘烃,郑超,杨子江.基于调用结构的软件可生存性评估方法[J].中南大学学报（自然科学版）,2013,44(S1):443-448. 被引量：1
7范锐,黄俊卿,谭亚新.网络抗毁性仿真研究的关键问题分析[J].系统仿真学报,2013,25(S1):404-407.
8孙雪莲,吕品.熵在复杂网络连通性研究中的应用[J].通化师范学院学报,2005,26(6):37-38.
9齐灿,刘旭明.复杂网络安全抗毁性研究[J].福建电脑,2007,23(4):38-39. 被引量：1
10王新华,徐连诚,刘方爱.一种基于选路拓扑的抗毁性评估模型[J].小型微型计算机系统,2007,28(5):819-822. 被引量：3

同被引文献34

1谭建豪,马小萍,李希.无人机3D航迹规划及动态避障算法研究[J].仪器仪表学报,2019,40(12):224-233. 被引量：18
2陈瑶,梁加红,邹顺,曹娟.无人机Ad Hoc网络拓扑控制算法研究[J].计算机仿真,2010,27(7):33-37. 被引量：10
3王子厚,韩言妮,林涛,徐月梅,唐晖.可重构网络中基于中心度与拓扑势排序的资源分配算法[J].通信学报,2012,33(8):10-20. 被引量：17
4韦磊,陆忞,于佳.LTE无线集群通信技术在电力系统中的应用研究[J].电力信息与通信技术,2016,14(5):93-97. 被引量：16
5隋宇,程小蓉,陈辉煌.基于TD-LTE的宽带集群通信系统研究[J].重庆邮电大学学报（自然科学版）,2016,28(6):777-782. 被引量：10
6刘明亮,崔宇佳,张一迪,林海静,陆起涌.基于多传感器数据融合的姿态控制与应用[J].微电子学与计算机,2017,34(7):65-69. 被引量：9
7罗桂兰,苏鹏,张梅.基于节点度估计的三维WSN拓扑控制算法[J].计算机工程,2017,43(9):56-61. 被引量：4
8梅武军.基于ROS的多旋翼飞行器飞行控制系统的开发与设计[J].电子科技,2017,30(10):23-25. 被引量：6
9崔朝阳,孙甲琦,徐松艳,蒋鑫.适用于集群无人机自组网的路由协议研究及仿真[J].遥测遥控,2018,39(3):29-34. 被引量：5
10刘想德.基于视觉引导的Baxter机器人运动控制研究[J].重庆邮电大学学报（自然科学版）,2018,30(4):552-557. 被引量：10

引证文献7

1尹梦梦,王磊,姚昌华,童玮.一种基于遗传算法的通信网拓扑优化方法[J].通信技术,2021,54(6):1392-1399. 被引量：4
2索亮.集群通信告警监控系统设计与实现[J].数字通信世界,2021(7):79-80.
3钟剑峰,王红军.适用于无人机集群应急通信系统分簇路由协议[J].火力与指挥控制,2022,47(2):56-66. 被引量：6
4吴玄,姬伟峰,翁江,李映岐,申秀雨,孙岩.基于安全感知的网络切片部署策略[J].空军工程大学学报,2022,23(4):96-102. 被引量：1
5唐珉,史海涛,王剑.基于多源动态图像识别技术的风电故障检测研究[J].电子设计工程,2022,30(24):99-103. 被引量：2
6白成超,王会霞,郭继峰,路坤锋.高速飞行器集群通信拓扑自适应控制方法[J].宇航学报,2023,44(7):1008-1019. 被引量：2
7Yuanzhi He,Biao Sheng,Hao Yin,Yun Liu,Yingchao Zhang.Distributed Satellite Cluster Laser Networking Algorithm with Double-Layer Markov DRL Architecture[J].Space(Science & Technology),2023,3(1):80-97. 被引量：1

二级引证文献16

1连亮,卢欣欣,纪鹏飞.基于滑模控制的多旋翼无人机飞行控制系统设计[J].信息记录材料,2022,23(5):213-217. 被引量：1
2陈宝民.嵌入式控制管道网络通信技术的优化与分割[J].通信电源技术,2022,39(8):78-81.
3方东南,刘阔.无人机在消防应急通信保障中的应用[J].电子技术（上海）,2022,51(7):216-217. 被引量：6
4毛建兵,邓伟华.一种分布式无线网络自适应拓扑抗毁性优化机制[J].通信技术,2022,55(12):1583-1588. 被引量：1
5王淼,赵锟,孙磊,臧韦菲,郭松辉,刘海东.基于改进BN模型的网络切片安全部署方法[J].计算机应用研究,2023,40(5):1480-1485. 被引量：2
6王磊,赵国欣.基于簇结构的集群无人机自组网路由协议[J].长江信息通信,2023,36(6):73-75.
7李舸.四轴飞行器在山区风电场全寿命周期应用[J].云南水力发电,2023,39(11):41-45.
8刘文程,吕圣军.遗传算法在通信中的应用策略研究[J].通信电源技术,2023,40(21):185-187.
9李曹妍,郭振川,郑冬冬,魏延岭.基于分布式模型预测控制的多机器人协同编队[J].兵工学报,2023,44(S02):178-190. 被引量：1
10巫利荣.“三断”环境下应急指挥通信系统设计与实现[J].长江信息通信,2024,37(4):121-123.

1张小霞,余鲲.独立点数为2的图的Z_(3)-连通性[J].信阳师范学院学报（自然科学版）,2019,32(4):531-533. 被引量：1
2吕武超.集群通信网络电源设备管理[J].通讯世界,2019,26(9):28-29.
3冷冰,马晓旭,刘坚.基于服务群的DNS安全抗毁技术研究[J].通信技术,2019,52(7):1744-1750.
4覃远超,赵泽才.面向定向天线无线网络的快速广播算法[J].通信技术,2019,52(9):2156-2162. 被引量：2
5曹坤,段芸.浅析交互式虚拟现实室内空间设计[J].视界观,2019,0(14):0043-0043.
6项英倬,魏强,游凌.基于通联行为的信息传播模式挖掘方法[J].北京邮电大学学报,2019,42(3):83-90. 被引量：1
7张岳,孟子舒,李勉.国际低年级学生阅读能力监测项目的实践与结果应用[J].外国教育研究,2019,46(8):45-56. 被引量：1
8鹿文砚.炼化工程EPC总承包项目三级计划编制原则及案例分析[J].石化技术,2019,26(8):301-302.
9刘敬雯.基于核心素养的阅读教学问题链设计[J].大连教育学院学报,2019,35(3):26-28. 被引量：4
10张龙翔.福建非物质文化遗产中木结构营造技术与新科技融合途径——以福建闽南民居营造技术为例[J].黑河学院学报,2019,10(8):175-177. 被引量：1

空军工程大学学报（自然科学版）

2019年第4期

浏览历史

内容加载中请稍等...

具有精英策略的深度强化学习无人机集群通信网络拓扑设计被引量：7

参考文献10

二级参考文献91

共引文献296

同被引文献34

引证文献7

二级引证文献16

相关作者

相关机构

相关主题

浏览历史

具有精英策略的深度强化学习无人机集群通信网络拓扑设计 被引量：7

参考文献10

二级参考文献91

共引文献296

同被引文献34

引证文献7

二级引证文献16

相关作者

相关机构

相关主题

浏览历史

具有精英策略的深度强化学习无人机集群通信网络拓扑设计被引量：7