基于逆向强化学习的舰载机甲板调度优化方案生成方法被引量：19

Inverse reinforcement learning based optimal schedule generation approach for carrier aircraft on flight deck

下载PDF

导出

摘要针对计算机辅助指挥调度舰载机甲板作业的决策过程无法脱离人参与这一特点,引入基于逆向学习的强化学习方法,将指挥员或专家的演示作为学习对象,通过分析舰载机的甲板活动,建立舰载机甲板调度的马尔可夫决策模型(MDP)框架;经线性近似,采用逆向学习方法计算得到回报函数,从而能够通过强化学习方法得到智能优化策略,生成舰载机甲板调度方案。经仿真实验验证,本文所提方法能够较好地学习专家演示,结果符合调度方案优化需求,为形成辅助决策提供了基础。 Traditional aircraft scheduling on carrier flight deck relies heavily on human commander decisions. To improve the computer aided decision making, an inverse reinforcement learning method was proposed. Learning from the commander or expert＇s demonstration, a Markov decision process （MDP） based aircraft scheduling model by analyzing the aircraft operations on deck was proposed. Then, the optimal policy and schedule were generated by using the linear approximating and inverse reinforcement learning method. Simulation results show that our method can learn experts demonstration well. satisfy the reauirement of scheduling optimization, and facilitate the computer aided decision making.

作者李耀宇朱一凡杨峰贾全

机构地区国防科技大学信息系统与管理学院

出处《国防科技大学学报》 EI CAS CSCD 北大核心 2013年第4期171-175,共5页 Journal of National University of Defense Technology

基金国家自然科学基金资助项目(71031007)

关键词逆向强化学习强化学习舰载机甲板调度优化方案生成 inverse reinforcement learning reinforcement learning aircraft scheduling on flight deck optimal schedule generation

分类号 TP391.9 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献15

1孙诗南.现代航空母舰[M].上海科学普及出版社,1998.
2司维超,韩维,史玮韦.基于PSO算法的舰载机舰面布放调度方法研究[J].航空学报,2012,33(11):2048-2056. 被引量：28
3魏昌全,陈春良,王保乳.基于出动方式的舰载机航空保障调度模型[J].海军航空工程学院学报,2012,27(1):111-114. 被引量：22
4马登武,郭小威,吕晓峰.基于改进遗传算法的舰载机弹药调度[J].计算机工程与应用,2012,48(8):246-248. 被引量：6
5冯强,曾声奎,康锐.基于MAS的舰载机动态调度模型[J].航空学报,2009,30(11):2119-2125. 被引量：24
6Giardina T J. An interactive graphics approach to the flight deck handling problem[ R]. Master' s thesis. Monterey: Naval Postgraduate School, 1974.
7Johnson A K, Kriston P. A simulation of a computer graphics- aided aircraft handling system [ D ]. Monterey: Naval Postgraduate School, 1975.
8Timothy. Requirements for digitized aircraft spotting (Ouija) board for use on U. S. Navy Aircraft Carriers [ D ]. Monterey : Naval Postgraduate School, 2002.
9Johnston J S. A feasibility study of a persistent monitoring system for the flight deck of U. S. Navy aircraft carriers [ D ]. Ohio: Depa.mnent of the Air Force Air University, 2009.
10Ryana. Designing an interactive local and global decision support system for aircraft carrier deck scheduling[ C]. AIAA Infotech@ Aerospace St. Louis, 2011.

二级参考文献40

1朱会,武文军,李赞.美航母战斗群舰载机空袭作战五步曲[J].当代海军,2007(1):42-47. 被引量：5
2王小平,曹立明.遗传算法理论应用与软件实现[M].西安:西安交通大学出版社,2006.
3中国航空工业发展研究中心海军装备部飞机办公室.国外舰载机技术发展:气动、起降、材料、反潜、直升机预警[M].北京:航空工业出版社,2008.
4Waldemar K. Dynamic scheduling state of the art report[R]. SCIS Technical Report T2002:28, 2002.
5Moser I, Hendtlass T. Solving dynamic single-runway aircraft landing problems with extremal optimisation[C]// Proceedings of the 2007 IEEE Symposium on Computa tional Intelligence in Scheduling. 2007:206- 211.
6Malaek S M B, Naderi E. A new scheduling strategy for aircraft landings under dynamic position shifting[C]// Aerospace Conference. 2008 : 1- 8.
7Kouiss K, Pierreval H, Mebarki N. Using multi-agent architecture in FMS for dynamic scheduling[J]. Journal of Intelligent Manufacturing, 1997, 8(1): 41-47.
8Scott J M, Kasin O. Scheduling complex job shops using disjunctive graphs: a cycle elimination procedure[J]. International Journal of Production Research, 2003, 41(5) :981 -994.
9Zhang X D, Wang Q, Li X P. Multi-agent based framework for dynamic scheduling system[C]//Proceedings of the Sixth International Conference on Machine Learning and Cybernetics. 2007:3838 -3843.
10Saad A, Kawamura K, Biswas G. Performance evaluation of contract net based heterarchical scheduling for flexible manufacturing systems[J]. Intelligent Autonomous and Soft Computing, 1997, 3(3): 229- 248.

共引文献59

1林嘉昊,李陟凌,王衍洋.舰载机舰面布列管理[J].船舶工程,2021,43(S02):27-32. 被引量：1
2徐永林.关于公司制企业法人治理结构的探讨[J].常州工业技术学院学报,2000,13(1):14-17.
3代亚楠,冯华玉,孙国立.求解巡警调度问题的遗传退火算法[J].计算机工程与应用,2012,48(28):225-228. 被引量：6
4刘钦辉,邱长华,王能建.考虑空间约束的舰载机作业调度模型研究[J].哈尔滨工程大学学报,2012,33(11):1435-1439. 被引量：24
5李耀宇,朱一凡,齐鸣,李群.舰载机甲板布列调运优化方法研究[J].指挥控制与仿真,2013,35(2):125-131. 被引量：12
6WU Yu,QU XiangJu.Path planning for taxi of carrier aircraft launching[J].Science China(Technological Sciences),2013,56(6):1561-1570. 被引量：21
7岳奎志,孙聪,罗明强,赵红超.舰载机动态调运系统的运行模型[J].北京航空航天大学学报,2013,39(8):1062-1068. 被引量：5
8李耀宇,朱一凡,贾全,李群.基于排队网络的舰载机甲板调运优化调度策略生成方法[J].海军工程大学学报,2013,25(5):26-30. 被引量：11
9朱齐丹,吕开东,李新飞.舰载机航空保障资源优化配置的循环网络模型[J].计算机应用,2013,33(11):3276-3279. 被引量：6
10吴勇,潘星,康锐,马麟.基于图示评审技术的舰载机航空保障时间分析[J].兵工学报,2013,34(12):1611-1615. 被引量：4

同被引文献185

1SIA发布美国半导体制造业竞争力研究报告[J].国防制造技术,2020(3):28-29. 被引量：1
2梁云,梁基华.关于积Domain上的Scott拓扑和连续函数Way-below关系的一点讨论[J].四川大学学报（自然科学版）,2004,41(6):1120-1123. 被引量：6
3黄树采,李为民.目标分配问题的蚁群算法研究[J].系统工程与电子技术,2005,27(1):79-80. 被引量：41
4杜天军,陈光,刘占辰.多目标攻击空战决策WBG模型及其蚁群算法[J].系统工程与电子技术,2005,27(5):861-865. 被引量：15
5栾孝丰,谢君.基于仿真优化的多机机务准备流程研究[J].计算机与数字工程,2010,38(12):50-53. 被引量：6
6黄炳强,曹广益,王占全.强化学习原理、算法及应用[J].河北工业大学学报,2006,35(6):34-38. 被引量：19
7何桢,周延虎,高雪峰.管理中面向变异的看板(Kanban)系统研究[J].北京科技大学学报（社会科学版）,2007,23(1):22-26. 被引量：11
8王来军,史忠科,雷秀娟.Dynamic Tabu Search Algorithm for Solving Departure Scheduling Problem[J].Journal of Southwest Jiaotong University(English Edition),2007,15(2):132-137. 被引量：1
9穆富岭,罗鹏程,周经伦.基于解析模型的空军战役作战模拟系统研究[J].系统仿真学报,2007,19(8):1723-1726. 被引量：8
10王平,张立,侯玉.基于Agent的航母舰载机出航准备指挥决策系统建模[J].兵工自动化,2007,26(5):33-34. 被引量：4

引证文献19

1王云翔,毕玉泉,杨茂胜,王虹昙.基于空间约束的舰载机出库调度[J].指挥控制与仿真,2015,37(1):107-111. 被引量：7
2卞大鹏,黄祥钊,代丽红,童剑.甲板舰载机动态调度研究方法综述[J].电子科技,2016,29(1):169-172. 被引量：2
3薛涛,刘龙.云计算中虚拟机资源自动配置技术的研究[J].计算机应用研究,2016,33(3):759-764. 被引量：12
4刘翱,刘克.舰载机保障作业调度问题研究进展[J].系统工程理论与实践,2017,37(1):49-60. 被引量：32
5李天宇.基于强化学习的云计算资源调度策略研究[J].上海电力学院学报,2019,35(4):399-403. 被引量：9
6范加利,朱兴动,高伟,王正.基于并行遗传算法的舰载机再次出动作业调度[J].兵器装备工程学报,2019,40(11):139-143. 被引量：8
7朱兴动,范加利,王正,赵宏强.一种航母甲板作业快速调度算法[J].舰船科学技术,2019,41(19):180-184. 被引量：1
8林嘉豪,章宗长,姜冲,郝建业.基于生成对抗网络的模仿学习综述[J].计算机学报,2020,43(2):326-351. 被引量：16
9殷昌盛,杨若鹏,朱巍,邹小飞,李峰.多智能体分层强化学习综述[J].智能系统学报,2020,15(4):646-655. 被引量：19
10朱兴动,孟杨凯,黄葵,范加利.基于工作日志表的舰载机甲板作业优化调度算法[J].舰船电子工程,2020,40(12):25-29. 被引量：1

二级引证文献112

1杜文风,王英奇,王辉,赵艳男,高博青,董石麟.基于边界平衡生成对抗网络的十字板式节点新构形智能生成方法[J].建筑结构学报,2022,43(S01):315-324. 被引量：1
2李林.人工智能生成内容的艺术性研究[J].大众文艺（学术版）,2020(1):98-99. 被引量：1
3杨凌,茅云生,宋利飞.基于模式切换粒子群算法的舰面保障站布置优化[J].船舶工程,2022,44(S01):575-580.
4白天,罗永亮,刘敬,常智超,王泽.基于变作业窗深度强化学习的舰面保障动态调度方法[J].船舶工程,2021,43(S02):117-123. 被引量：3
5林嘉昊,李陟凌,王衍洋.舰载机舰面布列管理[J].船舶工程,2021,43(S02):27-32. 被引量：1
6徐永林.关于公司制企业法人治理结构的探讨[J].常州工业技术学院学报,2000,13(1):14-17.
7李龙芸,高延,祖娜,黄晓明.847例肺癌延误诊断分析[J].中华内科杂志,2000,39(4):270-271. 被引量：13
8刘翱,冯骁毅,邓旭东,任亮,刘波.求解零空闲置换流水车间调度问题的离散烟花算法[J].系统工程理论与实践,2018,38(11):2874-2884. 被引量：12
9任亮,黄敏,王兴伟.考虑客户时间偏好的第四方物流路径优化问题[J].系统工程理论与实践,2018,38(12):3187-3196. 被引量：7
10苏析超,韩维,张勇,宋璟毓,赵振宇.考虑人机匹配模式的舰载机甲板机务勤务保障调度算法[J].航空学报,2018,39(12):214-232. 被引量：19

1刘清.基于逆向学习的距离和位置的传感器模型[J].南京师范大学学报（工程技术版）,2002,2(1):1-4.
2张国泽,冯毅萍,荣冈.不确定条件下基于仿真的流程工业调度方案优化[J].计算机与应用化学,2011,28(7):933-938. 被引量：3
3李彬,李贻斌,荣学文.ELM-RBF神经网络的智能优化策略[J].山东大学学报（理学版）,2010,45(5):48-51. 被引量：3
4刘清.基于逆向学习的距离和位置精密测量系统[J].仪表技术与传感器,2003(3):30-32. 被引量：3
5王子强,武继刚.基于RDC-Q学习算法的移动机器人路径规划[J].计算机工程,2014,40(6):211-214. 被引量：6
6倪志伟,梁婷,伍章俊,肖宏旺.面向数据中心虚拟机部署的智能优化策略[J].模式识别与人工智能,2015,28(4):306-315. 被引量：2
7薛涛,刘龙.云计算中虚拟机资源自动配置技术的研究[J].计算机应用研究,2016,33(3):759-764. 被引量：12
8崔明义,叶克江,上官艳丽.智能优化策略的比较[J].计算机应用与软件,2004,21(7):10-11. 被引量：2
9侯艳丽.基于支持向量机和Q学习的移动机器人导航[J].计算机工程与应用,2011,47(23):242-244. 被引量：2
10赵增荣,韩提文.基于Q-Learning的智能体训练[J].石家庄铁道学院学报,2007,20(2):37-39. 被引量：1

国防科技大学学报

2013年第4期

浏览历史

内容加载中请稍等...

基于逆向强化学习的舰载机甲板调度优化方案生成方法被引量：19

参考文献15

二级参考文献40

共引文献59

同被引文献185

引证文献19

二级引证文献112

相关作者

相关机构

相关主题

浏览历史

基于逆向强化学习的舰载机甲板调度优化方案生成方法 被引量：19

参考文献15

二级参考文献40

共引文献59

同被引文献185

引证文献19

二级引证文献112

相关作者

相关机构

相关主题

浏览历史

基于逆向强化学习的舰载机甲板调度优化方案生成方法被引量：19