基于作战过程的岛礁兵力配置强化学习算法

Reinforcement Learning Algorithm for Forces Allocation on Islands and Reefs Based on Combat Process

下载PDF

导出

摘要针对岛礁守备作战过程中涉及的对海、对陆、对空3类武器,根据岛礁守备作战过程建立模型,提出一种动态动作空间方法。设置敌方武器装备、预设阵地、防守要地3类影响因素,利用不同的基于值函数的强化学习算法进行测试,通过测试能得到各武器装备最佳位置并判断预设阵地是否合理,通过比较可看出算法间各有优劣,适合的环境各不相同。结果表明:该方法能够运用于不同的环境,减少时空开销,提高岛礁守备决策的效率,有助于策略改进。 Aiming at 3 kinds of weapons involved in island and reef garrison combat process, namely sea weapons, land weapons and air weapons, a model is established according to the island and reef garrison combat process, and a method of dynamic action space is proposed. 3 kinds of influencing factors are set, including enemy weapons and equipment, preset positions, and defensive points, and different reinforcement learning algorithms based on value function are used for testing.Through the test, the best position of each weapon and equipment can be obtained and whether the preset position is reasonable or not can be judged, and the comparison shows that the algorithms have their own advantages and disadvantages, and the suitable environments are different. The results show that the method can be applied to different environments, reduce the time and space overhead, improve the efficiency of island and reef garrison decision-making, and help to improve the strategy.

作者肖凡乔勇军 Xiao Fan;Qiao Yongjun(School of Coast Guard,Naval Aviation University,Yantai 264001,China)

机构地区海军航空大学岸防兵学院

出处《兵工自动化》 2022年第5期39-47,共9页 Ordnance Industry Automation

关键词强化学习值函数岛礁守备动态动作空间 reinforcement learning value function island and reef defense dynamic action space

分类号 TJ01 [兵器科学与技术—兵器发射理论与技术]

引文网络
相关文献

参考文献8

1赵国艳,邹伟,金山.体系作战条件下岛礁作战中辅助决策问题研究[J].航天电子对抗,2019,35(4):40-42. 被引量：2
2张智敏,石飞飞,万月亮,徐阳,张帆,宁焕生.人工智能在军事对抗中的应用进展[J].工程科学学报,2020,42(9):1106-1118. 被引量：9
3陆志沣,洪泽华,张励,董晨,钱晓超,宫琳.武器装备体系对抗仿真技术研究[J].上海航天,2019,36(4):42-50. 被引量：8
4秦智慧,李宁,刘晓彤,刘秀磊,佟强,刘旭红.无模型强化学习研究综述[J].计算机科学,2021,48(3):180-187. 被引量：25
5马骋乾,谢伟,孙伟杰.强化学习研究综述[J].指挥控制与仿真,2018,40(6):68-72. 被引量：41
6金则灵,武晓春.基于Q学习算法的城轨列车智能控制策略[J].铁道标准设计,2022,66(1):166-172. 被引量：4
7徐帷,卢山.基于Sarsa(λ)强化学习的空间机械臂路径规划研究[J].宇航学报,2019,40(4):435-443. 被引量：21
8赵星宇,丁世飞.深度强化学习研究综述[J].计算机科学,2018,45(7):1-6. 被引量：60

二级参考文献55

1徐雪松,曾智,邵红燕,杨胜杰,李想.基于个体-协同触发强化学习的多机器人行为决策方法[J].仪器仪表学报,2020(5):66-75. 被引量：10
2崔世文,冯晓云.列车优化操纵与自动驾驶模式的研究与仿真[J].铁道机车车辆,2005,25(5):9-12. 被引量：17
3邵军,吴华,陈蕾.基于数据处理相关技术的军事信息中心构建[J].微计算机信息,2006(01X):89-91. 被引量：3
4任伟,蒋兴浩,孙锬锋.基于RBF神经网络的网络安全态势预测方法[J].计算机工程与应用,2006,42(31):136-138. 被引量：71
5张翔,胡昌振,刘胜航,唐成华.基于支持向量机的网络攻击态势预测技术研究[J].计算机工程,2007,33(11):10-12. 被引量：37
6李伯虎,柴旭东,侯宝存,李潭,张雅彬,余海燕,韩军,邸彦强,黄继杰,宋长峰,唐震,王鹏,施国强,王晓华.一种基于云计算理念的网络化建模与仿真平台——“云仿真平台”[J].系统仿真学报,2009,21(17):5292-5299. 被引量：125
7袁俊.系统仿真及其在防空导弹武器系统研制中的应用[J].上海航天,1998,15(6):53-59. 被引量：2
8杜志强,沈玉龙,马建峰,周利华.基于信息覆盖的无线传感器网络访问控制机制[J].通信学报,2010,31(2):113-119. 被引量：5
9杜戈,韩增奇,李宁霞,于俊杰.基于神经网络和遗传算法的信息传输安全风险度评估模型[J].情报杂志,2010,29(B06):207-209. 被引量：6
10胡晓峰.战争复杂性与复杂体系仿真问题[J].军事运筹与系统工程,2010,24(3):27-34. 被引量：41

共引文献155

1李茹杨,彭慧民,李仁刚,赵坤.强化学习算法与应用综述[J].计算机系统应用,2020,29(12):13-25. 被引量：39
2王可,程馨乐,薛明志.地方高校开展军工科技人才培养的机遇、挑战与对策——以信息学科为例[J].商丘师范学院学报,2023,39(9):72-74.
3唐小林,陈佳信,刘腾,李佳承,胡晓松.基于深度强化学习的混合动力汽车智能跟车控制与能量管理策略研究[J].机械工程学报,2021,57(22):237-246. 被引量：17
4王昊,林远山,李然,于红,王芳.面向养殖网箱巡检任务的强化学习训练系统[J].计算机与数字工程,2023,51(1):103-111.
5蒋方庆,陈自力,高喜俊,王春峰,贺道坤.基于改进TD3算法的无人机决策研究[J].信息化研究,2023,49(3):36-42.
6崔立,宋玉,张进.基于自适应DDPG方法的复杂场景下AUV动动对接[J].船舶工程,2023,45(8):8-14.
7闫冬,陈盛,彭国政,谈元鹏,张玉天,吴凯.基于层次深度强化学习的带电作业机械臂控制技术[J].高电压技术,2020,46(2):459-471. 被引量：17
8赵元,张合新.基于目标状态距离简化Q-learning算法的迷宫路径规划[J].火箭军工程大学学报,2019(4):79-84.
9王磊.图书订货会迈入成熟期[J].中国出版,2000(2):25-26.
10杨义豪.话语粘连在科技文体中的运用[J].山东外语教学,2000,21(2):31-34.

1邬江兴,朱涵.构建多模态网络环境支持“双循环”加速形成[J].瞭望,2021(33):24-26.
2辛涛,吴钪,肖惟斌.多功能工程车推铲清障装置设计与稳定性分析[J].工程机械,2021,52(7):46-53. 被引量：1
3陈耿莉.浅析当前我国汽车网络营销问题及改进策略[J].时代汽车,2022(8):177-178.
4郭慧姗.准Z源逆变器SVPWM直通调制策略改进[J].电工技术,2022(5):67-70.
5毕文静.精细化财务管理视角下业财融合实施策略研究[J].商场现代化,2022(5):114-116. 被引量：5
6陈利斐,宗思光,杨剑波.激光制导武器打击跨江海大桥的方式研究[J].现代防御技术,2021,49(6):49-55.
7李宝帅,叶春明.混合鲸鱼优化算法求解柔性作业车间调度问题[J].计算机系统应用,2022,31(4):244-252. 被引量：9
8陈兴兴.小学教师使用精神奖励的困境、成因及策略改进[J].教师,2022(9):114-116.
9陈紫若,刘林青.企业跳跃距离、出口多样性对出口二元边际的影响研究[J].国际贸易问题,2022(2):140-157. 被引量：3
10楚旋,刘娜.应用型高校制度体系建设问题与改进策略[J].高教学刊,2022,8(10):135-138. 被引量：3

兵工自动化

2022年第5期

浏览历史

内容加载中请稍等...

基于作战过程的岛礁兵力配置强化学习算法

参考文献8

二级参考文献55

共引文献155

相关作者

相关机构

相关主题

浏览历史