多智能体强化学习在直升机机场调度中的应用被引量：3

Multi-Agent Reinforcement Learning in Helicopter Airport Dispatching

下载PDF

导出

摘要快速高效的直升机机场调度是现代直升机机场调度系统面临的主要挑战。设计了一个直升机机场调度试验平台,使用二维网格环境,供多种算法进行快速试验。机场调度试验平台根据机场实际地形进行地图编辑,提供了传统的集中式规划算法和基于多智能体强化学习算法来进行快速高效的模拟调度实验。实验表明,基于多智能体强化学习方法的可扩展性和实时规划效果较好。试验平台为进一步研究机场调度提供了良好的起点,对未来多智能体路径规划问题应用于实际场景将会产生有益影响。 Fast and efficient helicopter airport dispatching is the main challenge faced by modern helicopter airport dispatching system.Helicopter airport dispatching can be regarded as a classical multi-agent path finding problem.A helicopter airport dispatching test platform is designed,which uses a two-dimensional grid environment for rapid test of various algorithms.The airport dispatching test platform edits the map according to the actual terrain of the airport,and provides the traditional centralized planning algorithm and the algorithm based on multi-agent reinforcement learning to carry out fast and efficient simulation dispatching experiments.In order to explore the potential of multi-agent reinforcement learning in airport scheduling,a large number of experiments are carried out,and the applicability and characteristics of different types of algorithms are compared and analyzed.The experimental results show that the reinforcement learning method based on multi-agent has good scalability and real-time planning effect.The test platform provides a good starting point for further research on airport scheduling,and will have a beneficial impact on the application of multi-agent path finding in practical scenarios in the future.

作者刘志飞董强赖俊陈希亮 LIU Zhifei;DONG Qiang;LAI Jun;CHEN Xiliang(College of Command and Control Engineering,Army Engineering University,Nanjing 210007,China)

机构地区陆军工程大学指挥控制工程学院

出处《计算机工程与应用》 CSCD 北大核心 2023年第16期285-294,共10页 Computer Engineering and Applications

基金国家自然科学基金(61806221)。

关键词机场调度试验平台多智能体路径规划强化学习 airport dispatching test platform multi-agent path finding reinforcement learning

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献3

1郑延斌,李波,安德宇,李娜.基于分层强化学习及人工势场的多Agent路径规划方法[J].计算机应用,2015,35(12):3491-3496. 被引量：14
2王毅然,经小川,田涛,孙运乾,从帅军.基于强化学习的多Agent路径规划方法研究[J].计算机应用与软件,2019,36(8):165-171. 被引量：25
3刘志飞,曹雷,赖俊,陈希亮,陈英.多智能体路径规划综述[J].计算机工程与应用,2022,58(20):43-62. 被引量：11

二级参考文献29

1戴博,肖晓明,蔡自兴.移动机器人路径规划技术的研究现状与展望[J].控制工程,2005,12(3):198-202. 被引量：75
2PARKER L E. Multiple mobile robot systems [ M]//Springer Hand- book of Robotics. Berlin: Springer, 2005:921-941.
3CHARKROBORTY J, MUKHOPADHYAY S. A robust cooperative multi-robot path-planning in noisy environment [ C]// Proceedings of the 2010 IEEE International Conference on Industrial and Infor- mation Systems. Piscataway: IEEE, 2010:626-631.
4JARADAT M, GARIBEH M H, FEILAT E A. Dynamic motion plan- ning for autonomous mobile robot using fuzzy potential field [ C]// Proceedings of the 6tb International Symposium on Meehatronies and Its Applications. Piseataway: IEEE, 2009:24-26.
5GHATEE M, MOHADES A. Motion planning in order to optimize the length and clearance applying a Hopfield neural network [ J]. Expert Systems with Applications, 2009, 36(3): 4688 -4695.
6BARTO A G, MAHADEVEN S. Recent advance in hierarchical reinforcement learning [ J]. Discrete Event Dynamic Systems, 2003, 13(4): 341 -379.
7SABATFIN L, SECCHI C, FANTUZZI C. Arbitrarily shaped for- mations of mobile robots: artificial potential fields and coordinate transformation [ J]. Autonomous Robots, 2011, 30 (4) : 385 - 397.
8KHATIB O. Real-time obstacle avoidance for manipulators and mo- bile robots [ C]//Proceedings of the 1985 IEEE International Con- ference on Robotics and Automation. Piseataway: IEEE, 1985, 2: 500 - 505.
9LIANG T. A speedup convergent method for multi-Agent reinforce- ment learning [ C]// Proceedings of the 2009 International Confer- ence on Information Engineering and Computer Science. Piscat- away: IEEE, 2009:1-4.
10SUTTON R S, PRECUP D, SINGH S P. Between MDPs and semi- MDPs: a fi'amework for temporal abstraction in reinforcement learn- ing [ J]. Artificial Intelligence, 1999, 112(1/2) : 181 - 211.

共引文献45

1陈述,田亚,袁越.风力作用下的大坝浇筑空间冲突频率研究[J].水力发电学报,2020(5):27-35. 被引量：9
2闫伟,史洪玮.网络数据多信道传输路径规划方法研究[J].计算机仿真,2016,33(8):284-287. 被引量：6
3许建国,张佳.物联网数据并行传输路径预测仿真[J].计算机仿真,2018,35(1):172-175. 被引量：5
4赵广复,方加娟.基于蚁群优化和离策略学习的机器人路径规划[J].长春师范大学学报,2019,38(4):19-23. 被引量：1
5王毅然,经小川,田涛,孙运乾,从帅军.基于强化学习的多Agent路径规划方法研究[J].计算机应用与软件,2019,36(8):165-171. 被引量：25
6孙艺彬,杨慧珍.基于定向约束的脉冲耦合神经网络路径规划[J].计算机科学,2019,46(S11):28-32. 被引量：4
7刘辉,肖克,王京擘.基于多智能体强化学习的多AGV路径规划方法[J].自动化与仪表,2020,35(2):84-89. 被引量：9
8刘庆周,吴锋.多智能体路径规划研究进展[J].计算机工程,2020,46(4):1-10. 被引量：21
9陈双,李龙,罗海南.基于神经网络的强化学习在服务机器人导航中的研究[J].现代计算机,2020,26(12):62-67.
10王振庭,陈永府,刘田.智能仓储中的多机器人调度方法[J].计算机与现代化,2020,0(7):65-70. 被引量：10

同被引文献25

1张青松,金宜家,秦帅星.直升机协同救援调度优化研究[J].中国安全科学学报,2019,29(10):180-186. 被引量：6
2程玉虎,冯涣婷,王雪松.基于状态-动作图测地高斯基的策略迭代强化学习[J].自动化学报,2011,37(1):44-51. 被引量：6
3张青松,罗丹,高广泽,廖云龙.基于EWM-CBR的森林航空消防直升机需求研究[J].消防科学与技术,2019,38(1):138-141. 被引量：10
4胡鸿翔,梁锦,温广辉,虞文武.多智能体系统的群集行为研究综述[J].南京信息工程大学学报（自然科学版）,2018,10(4):415-421. 被引量：10
5李帅龙,张会文,周维佳.模仿学习方法综述及其在机器人领域的应用[J].计算机工程与应用,2019,55(4):17-30. 被引量：10
6王天骄,李松蔚,李红军,李洁琼,马浩然.基于启发式算法的直升机优化调度方法[J].信息与电脑,2019,0(15):41-42. 被引量：2
7赵婷婷,孔乐,韩雅杰,任德华,陈亚瑞.模型化强化学习研究综述[J].计算机科学与探索,2020,14(6):918-927. 被引量：14
8殷昌盛,杨若鹏,朱巍,邹小飞,李峰.多智能体分层强化学习综述[J].智能系统学报,2020,15(4):646-655. 被引量：24
9轩书哲,柯良军.基于多智能体强化学习的无人机集群攻防对抗策略研究[J].无线电工程,2021,51(5):360-366. 被引量：12
10杨思明,单征,丁煜,李刚伟.深度强化学习研究综述[J].计算机工程,2021,47(12):19-29. 被引量：52

引证文献3

1徐浩,瞿菁菁,王明惠,朱新平.森林火灾救援直升机吊桶灭火任务调度优化研究[J].消防科学与技术,2024,43(4):535-540.
2李明阳,许可儿,宋志强,夏庆锋,周鹏.多智能体强化学习算法研究综述[J].计算机科学与探索,2024,18(8):1979-1997. 被引量：1
3郭传友,刘志飞,田景志,刘先忠.基于模仿学习和强化学习的启发式多智能体路径规划[J].网络安全与数据治理,2024,43(9):33-40.

二级引证文献1

1郑佳明,沈颖,刘晓强,涂文奇,李柏岩.基于机器阅读理解的行车故障诊断知识抽取[J].智能计算机与应用,2024,14(9):56-62.

1谢莎莎,曾崇辉.基于大数据视角的财务分析研究[J].商场现代化,2023(16):183-185. 被引量：1
2钟楚珩,施佳楠,周金枝.硫酸盐侵蚀-干湿循环下不锈钢纤维再生混凝土耐久性分析[J].水利水电技术（中英文）,2023,54(4):187-196. 被引量：5
3汪秀平,王祉歆,周伟,徐翠强,李景涛,姜琛,王雅昭.阿联酋铁路沿线环境风特性仿真研究[J].五邑大学学报（自然科学版）,2023,37(3):32-41. 被引量：1
4曹瑞,李帅,邢龙,朱文丽,龚文婷,申赵勇.极端枯水条件下梯级水库蓄水调度策略--以金沙江下游-三峡梯级为例[J].水力发电学报,2023,42(6):1-12. 被引量：10
5高春元,赵俊承,夏志伟,周泽山,邱旭,张华忠,毛菁鑫.山区管线滑坡风险评价中斜坡单元划分方法改进[J].矿山工程,2023,11(3):344-350.
6李颖,王斌,徐孙钰,朱非林,本梦雪,钱心缘,钟平安.串联水库群弱耦合条件下实时防洪调度方法研究[J].中国农村水利水电,2023(8):63-69. 被引量：3

计算机工程与应用

2023年第16期

浏览历史

内容加载中请稍等...

多智能体强化学习在直升机机场调度中的应用被引量：3

参考文献3

二级参考文献29

共引文献45

同被引文献25

引证文献3

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

多智能体强化学习在直升机机场调度中的应用 被引量：3

参考文献3

二级参考文献29

共引文献45

同被引文献25

引证文献3

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

多智能体强化学习在直升机机场调度中的应用被引量：3