题名 海空跨域协同兵棋AI架构设计及关键技术分析
被引量:1
1
作者
苏炯铭
罗俊仁
陈少飞
项凤涛
机构
国防科技大学智能科学学院
出处
《指挥控制与仿真》
2024年第2期35-43,共9页
基金
国家自然科学基金(61806212、62376280)。
文摘
以深度强化学习为核心的智能博弈技术在游戏领域内的突破和进展为海空兵棋AI的研究提供了借鉴。智能体架构设计是需要解决的关键问题,良好的架构能够降低算法训练的复杂度和难度,加快策略收敛。提出基于随机博弈的海空跨域协同决策博弈模型,分析了相关的均衡解概念;在分析典型智能体框架基础上,针对海空兵棋推演决策博弈过程,提出基于多智能体分层强化学习的智能体双层架构,能够有效解决智能体间协作和维度灾难问题;从兵力协同、智能体网络设计、对手建模和训练机制共4个方面分析了关键技术。期望为海空兵棋AI设计实现提供架构指导。
关键词
海空兵棋
跨域协同
兵棋 推演
多智能体
智能博弈
模型架构
分层强化学习
Keywords
sea-air wargame
cross-domain cooperation
wargaming
multi-agent
intelligent gaming
model architecture
hierarchical reinforcement learning
分类号
E91
[军事]
题名 作战方案驱动的可学习兵棋推演智能体研究
2
作者
孙怡峰
李智
吴疆
王玉宾
机构
战略支援部队信息工程大学
中国人民解放军
出处
《系统仿真学报》
CAS
CSCD
北大核心
2024年第7期1525-1535,共11页
文摘
为了使智能体能够应对兵棋推演中的复杂作战场景和作战目的,提出作战方案驱动的可学习兵棋推演智能体架构。剖析智能体对兵棋系统的“依附特性”和“松耦合特性”,得到智能体的可学习要求;在智能体框架设计中,使用作战方案压减智能体学习范围。通过有限状态机对应作战方案中的作战阶段知识,依据作战方案框架确定智能体决策空间,设计可学习的深层神经网络实施关键决策空间探索,神经网络采用先验知识模仿学习模式和深度强化学习模式。该架构能迭代探索人类难以充分梳理清楚的多棋子最优部署和协作问题。
关键词
兵棋 推演
智能体
作战方案
深层神经网络
强化学习
模仿学习
Keywords
wargame
agent
battle scheme
deep neural network
reinforcement learning
imitation learning
分类号
TP391.9
[自动化与计算机技术—计算机应用技术]
题名 对抗环境下的智能兵棋系统设计及其关键技术
被引量:1
3
作者
孙宇祥
李原百
周胜
赵俊杰
周献中
机构
南京大学控制科学与智能工程系
南京大学智能装备新技术研究中心
出处
《火力与指挥控制》
CSCD
北大核心
2024年第2期33-41,共9页
基金
国家自然科学青年基金(62306135)
教育部青年基金(23YJC630156)
江苏省青年基金资助项目(BK20230783)。
文摘
智能博弈对抗领域已成为当前研究的热门领域之一。侧重在兵棋推演系统的体系构建和模块设计,分析了兵棋推演系统的建模要素,包括兵棋要素、兵棋规则及智能接口设计,构建了智能兵棋推演系统的整体架构。通过A3C强化学习智能算法对系统设计进行可行性验证。其中,改进了强化学习训练过程的奖励设置,明确智能兵棋环境的状态输入、算法驱动过程及动作输出过程,通过自主实现的智能兵棋推演系统,验证了所提的系统理论与工作。该工作为基于强化学习的智能博弈系统的设计与实现提供了可行路径,并为以后基于强化学习的智能博弈对抗研究提供了基础平台。
关键词
智能博弈
智能兵棋
强化学习
系统设计
Keywords
Intelligent game
intelligent wargame
reinforcement learning
system design
分类号
TJ01
[兵器科学与技术—兵器发射理论与技术]
题名 任务级兵棋智能决策技术框架设计与关键问题分析
被引量:1
4
作者
张驭龙
范长俊
冯旸赫
张龙飞
刘忠
机构
国防科技大学系统工程学院
解放军
出处
《指挥与控制学报》
CSCD
北大核心
2024年第1期19-25,共7页
基金
国家自然科学基金(71701205,62073333,62206303)资助。
文摘
在梳理总结当前兵棋智能决策方法研究现状的基础上,明确指出了开展任务级兵棋智能决策研究的8项难点,从博弈活动中智能体定位、信息流转与知识流转等问题出发,设计给出了任务级兵棋智能博弈框架、智能策略生成优化框架以及多智能体策略协同演进框架,进而分析了高维度下长时序的态势信息数据综合、异步策略分布式学习优化、基于语义模板的任务指令生成、多智能体训练营博弈调度等4项关键问题,并给出了基本解决方案,点明了开展任务级兵棋智能决策研究的技术要点与基本路线,为后续任务级兵棋智能体设计提供了有益参考。
关键词
兵棋
博弈
决策
智能
强化学习
Keywords
wargame
gaming
decision-making
intelligent
reinforcement learning
分类号
E91
[军事]
题名 面向兵棋推演复盘分析的机器学习数据集构建
5
作者
张大永
杨镜宇
马骏
宋晨烨
机构
国防大学研究生院
国防大学联合作战学院
出处
《系统仿真学报》
CAS
CSCD
北大核心
2024年第3期608-624,共17页
文摘
运用机器学习进行兵棋推演复盘分析,首先要解决的是数据集构建问题。由于机器学习对数据结构的规范化要求,以及算力和存储限制,通过兵棋推演数据构建机器学习数据集,在如何描述兵棋推演状态,如何描述推演过程,如何处理高维数据,如何数据保真等方面,还面临不少问题。针对此类问题,构建了兵棋推演过程数据向机器学习数据集映射模型,在总体框架上对数据集构建的映射流程、态势描述数据范围和数据统计计算规则进行规范,并从时间关联数据、地理空间关联数据和高维数据降维3个视角设计针对性处理方法,以保证构建数据集的数据结构统一、高维数据降维需求和数据集保真要求。通过数据集构建实验进行了验证,结果表明:在时间分辨率和地理空间分辨率适中情况下,所构建数据集映射模型,既能较好对兵棋推演高维数据进行降维,又能较好防止构建的数据集失真。
关键词
兵棋 推演
复盘分析
机器学习
数据集
构建方法
Keywords
wargaming
replay analysis
machine learning
data set
construction method
分类号
TP391.9
[自动化与计算机技术—计算机应用技术]
题名 基于兵棋推演的智能分析评估研究
6
作者
兰旭
刘洋
伍文峰
机构
国防大学联合作战学院
出处
《军事运筹与评估》
2024年第3期20-26,共7页
文摘
兵棋推演作为研究战争的一种重要手段,与人工智能技术融合已成为未来发展趋势。分析智能分析评估的发展现状与样本数量、样本标注、算法模型、结果解释等方面存在的瓶颈,针对性提出一种基于兵棋推演的动态智能分析评估流程,并结合智能问答分析、重要事件回溯、作战行动讲评等典型应用场景,提出了相应的解决方案。选取智能问答分析场景,验证了相关方案与算法的有效性。
关键词
兵棋 推演
人工智能
分析评估
作战模拟
机器学习
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
TP15
[自动化与计算机技术—控制理论与控制工程]
题名 融合三支多属性决策与SAC的兵棋推演智能决策技术
7
作者
彭莉莎
孙宇祥
薛宇凡
周献中
机构
南京大学工程管理学院
浙江财经大学信息技术与人工智能学院
南京大学智能装备新技术研究中心
出处
《系统工程与电子技术》
EI
CSCD
北大核心
2024年第7期2310-2322,共13页
基金
国家自然科学青年基金(62306135)
教育部青年基金(23YJC630156)
+1 种基金
江苏省青年基金(BK20230783)
南京大学技术创新基金(SC-2023-039)资助课题。
文摘
近年来,将深度强化学习技术用于兵棋推演的智能对抗策略生成受到广泛关注。针对强化学习决策模型采样率低、训练收敛慢以及智能体博弈胜率低的问题,提出一种融合三支多属性决策(three-way multiple attribute decision making,TWMADM)与强化学习的智能决策技术。基于经典软表演者-批评家(soft actor-critic,SAC)算法开发兵棋智能体,利用TWMADM方法评估对方算子的威胁情况,并将该威胁评估结果以先验知识的形式引入到SAC算法中规划战术决策。在典型兵棋推演系统中开展博弈对抗实验,结果显示所提算法可有效加快训练收敛速度,提升智能体的对抗策略生成效率和博弈胜率。
关键词
兵棋 推演
三支多属性决策
软表演者-批评家
强化学习
智能决策
Keywords
wargame
three-way multiple attribute decision making(TWMADM)
soft actor-critic(SAC)
reinforcement learning(RL)
intelligent decision
分类号
TN95
[电子电信—信号与信息处理]
TP181
[自动化与计算机技术—控制理论与控制工程]
E91
[军事]
题名 考虑弹药保障能力的作战效能兵棋推演评估
8
作者
周书行
曹红松
张镇川
翟超凡
杜宇
韩文斌
机构
中北大学机电工程学院
中国人民解放军
出处
《兵器装备工程学报》
CAS
CSCD
北大核心
2024年第S01期123-128,共6页
基金
通用弹药导弹保障技术重点实验室基金项目。
文摘
目前在兵棋推演过程中很少涉及到弹药保障环节,比如弹药存储和运输对作战效果的影响。本文基于兵棋推演想定设计、仿真以及评估的规则,提出了诸如保障兵力、保障装备、储运规则等的弹药保障相关推演要素,改进了兵棋推演流程,在常规推演评估指标体系中增加了弹药保障效率、成本等评估指标体系,演示了综合弹药保障能力作战效能的评估方法。
关键词
弹药保障能力
兵棋 推演
效能评估
评价指标
Keywords
ammunition logistics capability
wargaming
effectiveness evaluation
evaluation metrics
分类号
TJ410.89
[兵器科学与技术—火炮、自动武器与弹药工程]
题名 基于影响力地图的计算机兵棋推演路径规划
9
作者
吕倩茹
杨翔瑞
蔡志平
机构
国防科技大学计算机学院
出处
《计算机工程与科学》
CSCD
北大核心
2024年第6期1041-1049,共9页
文摘
兵棋推演是一种描述战争行动的作战模拟工具,兵力机动是作战行动的基础,而路径规划则是作战行动的核心内容。路径规划简化为图论中的最短路径求解。然而,战术路径不等价于最短路径。考虑到战场推演的复杂性、信息多样性和动态性等特点,战术路径采用战场态势与路径规划分离的决策方法导致作战行动失败。提出了一种能将战场态势与地图信息有效融合的战术路径规划算法,该算法在传统A^(*)算法的基础上,结合影响力地图对战场态势因子进行数值化,并采用数值化态势因子结合地形因子作为改进A^(*)算法目标函数,从而在相同算法复杂度条件下使A^(*)算法向战术最优路径收敛。通过仿真实验表明,相较于传统A^(*)算法,该算法能够支持更复杂多样的战术路径规划,战场态势信息指导路径规划能够有效降低机动时一方所受战损并提高我方进攻能力,塑造整体有利态势。
关键词
兵棋 推演
影响力地图
A^(*)算法
路径规划
Keywords
computer wargame
influence map
A^(*)algorithm
path planning
分类号
TP391.9
[自动化与计算机技术—计算机应用技术]
题名 兵棋推演在光电专业本科综合实践教学中的应用探析
10
作者
刘磊
华卫红
奚加超
于浩洋
机构
国防科技大学前沿交叉学科学院
国防科技大学南湖之光实验室
出处
《教育教学论坛》
2024年第31期13-16,共4页
基金
2022年度国防科技大学教改课题“基于XX课程的兵棋推演教学研究与实践探索”(2022-09)。
文摘
综合实践教学是军队院校强化实战化教学的重要环节。通过分析现有光电信息科学与工程专业本科综合实践教学中存在的局限性,提出将兵棋推演引入该专业综合实践教学,并设计了兵棋推演应用的教学模式,具体讨论了教学设计与准备、组织与实施、总结与评价等方面的问题,最后强调了该推演教学中需要重点把握的问题。通过兵棋推演在综合实践教学中的应用,有助于进一步完善满足信息化条件下装备保障人才培养需求的专业实践教学体系,对于提高该专业综合实践教学质量水平,具有非常重要的意义。
关键词
兵棋 推演
光电信息科学与工程
综合实践教学
Keywords
war gaming
optoelectronic information science and engineering
comprehensive practical teaching
分类号
G642.0
[文化科学—高等教育学]
题名 基于前分类本体的信息通信兵棋算子建模研究
11
作者
龚郑文
朱巍
曾金述
于胜
机构
国防科技大学信息通信学院
出处
《指挥控制与仿真》
2024年第4期142-149,共8页
文摘
信息通信兵棋作为提升指挥员信息通信保障指挥与筹划水平的研究平台,发挥着重要作用。选取信息通信兵棋算子展开建模研究。首先设计了信息通信兵棋算子建模框架,明确了实体解构、属性提取、数据描述的建模步骤及对应产品,然后提出了基于前分类本体的信息通信兵棋算子建模方法,定义了实体单元的基础分类、不同实体的本体模型和算子的计算机语言描述,最后以岛屿进攻战役信息通信保障为例,借助本体建模软件Protégé对基于前分类本体的信息通信兵棋算子建模方法进行了实验分析,验证了该方法的可行性与科学性。
关键词
信息通信保障
兵棋
算子建模
前分类本体
Keywords
infocommunication support
wargame
counters modeling
pre-categorization ontology
分类号
TP391.9
[自动化与计算机技术—计算机应用技术]
题名 一种用于辅助兵棋推演的快速决策框架研究
12
作者
陈健
赵建印
纪红
机构
海军航空大学
出处
《网络安全与数据治理》
2024年第3期21-26,共6页
文摘
基于一般的决策和规划流程,提出了一个面向兵棋推演的快速决策框架(Rapid Military Decision Framework, RMDF),该框架针对异构实体模型,通过分层的网格环境对复杂推演环境简化建模,将推演实体的作用效果,简化为地面、海上和空中三个网格环境层次上的作用效果,并以热图的形式在网格环境中显示,通过推演实体的核心参数来确定其性能模型和行为模型,并基于一致性包算法实现任务分配,生成备选行动策略,通过快速仿真实现推演策略的迭代优化,能够在推演之前或推演期间提供行动方案的快速评估,可以有效地辅助兵棋推演指挥人员进行复杂态势下的兵棋推演。
关键词
兵棋 推演
一致性包算法
辅助决策
Keywords
wargame
consensus-based bundle algorithm(CBBA)
assistant decision-making
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 高校国防教育实践中的兵棋推演教学创新路径
13
作者
解一帆
刘彩云
机构
武警工程大学乌鲁木齐校区
出处
《中国科技期刊数据库 科研》
2024年第9期0171-0174,共4页
文摘
高校国防教育不仅是培养大学生爱国意识的有效手段,同时也是增强国家防御能力的重要途径。兵棋作为一种现代化战争模拟工具,涵盖了经济、外交、政治等一系列内容,对于大学生而言,是有效的国防教育手段。针对高校国防教育现状,分析兵棋推演的应用价值,并从教学系统、教学流程和教学队伍三方面给出了创新路径,以期为高校国防教育提供有力支持。
关键词
高校国防
国防教育
教育实践
兵棋 推演
分类号
G64
[文化科学—高等教育学]
题名 战略战役兵棋多级多分辨率网格模型建模方法
14
作者
李海燕
吴大愚
柳强
机构
海军指挥学院作战实验室
国防大学军事管理学院
出处
《计算机与现代化》
2023年第6期27-32,共6页
基金
全军军事类研究生资助课题(JY2018A031)。
文摘
网格模型是战略战役兵棋环境模型的核心组成部分,对兵棋行为模型产生直接作用和影响。构建多级多分辨率的网格模型,是扩展战略战役兵棋、支持细粒度环境模型和关键战术行动的基础。由此,结合军事需求与技术需求,提出一种面向战略战役兵棋的基于球面剖分的多级多分辨率网格模型。首先,利用等经纬度四角格进行网格剖分;然后,定义多层级等经纬度网格坐标系簇及相关要素;最后,给出该网格模型的应用实例,对比分析其与单一分辨率六角格模型在网格数量和描述粒度方面的特性,体现多级多分辨率网格模型在提升环境模型粒度上具有明显的优点。该方法能够支持开展宏观和微观不同粒度兵棋仿真推演的需求,并满足兵棋系统对运行效率和环境仿真多分辨率的要求。
关键词
战略战役兵棋
多级多分辨率网格
兵棋 地图
等经纬度剖分
Keywords
strategy campaign wargame
multi-level and multi-resolution grid
wargame map
equal longitude and latitude division
分类号
TP391.9
[自动化与计算机技术—计算机应用技术]
题名 太空兵棋推演需求分析与系统初步研制
15
作者
张进
罗亚中
李海阳
朱阅訸
周剑勇
机构
国防科技大学空天科学学院
出处
《国防科技》
2023年第5期111-115,共5页
基金
国家社会科学基金军事学项目(2023-××××-×-103)
湖南省自然科学基金杰出青年科学基金项目(2022JJ10061)。
文摘
随着航天技术的发展,太空正在成为直接对抗的战场,在信息化战争中的重要地位凸显。以太空领域为核心的兵棋推演具有重要意义,但面临一系列挑战。分析太空对抗全球性、高敏感、高技术、高成本等特性,梳理演习训练、学生培养等推演需求,并阐述太空兵棋推演在棋盘表征、推演规则、行动规划、想定设计等方面的挑战。介绍推演系统软件棋盘、棋子、裁决机制、指挥辅助、推演计算等方面的技术研究情况,以及其集成与初步应用进展。
关键词
兵棋 推演
态势表征
任务筹划
裁决评估
软件系统
Keywords
wargaming
situation representation
mission planning
judgment and evaluation
software system
分类号
E914
[军事]
题名 兵棋地图的演进与评述
被引量:2
16
作者
张欣
张寅宝
机构
信息工程大学地理空间信息学院
出处
《测绘与空间地理信息》
2013年第12期22-24,27,共4页
文摘
兵棋是对作战过程进行逻辑推演研究和评估的军事科学工具,是作战模拟的一种重要方法和手段。兵棋地图作为兵棋的三大组成要素之一,其表达内容、表达方式及表达精度对兵棋推演的结果有着重要的影响。回顾兵棋地图的演进,有助于把握兵棋发展的历史脉络,加深对战场环境模拟的认识。以兵棋地图出现的时间为依据,将兵棋地图的演进过程分为三个阶段:原始兵棋地图阶段、经典兵棋地图阶段和现代兵棋地图阶段,并从表达内容、表达方式和表达精度三个方面对每个阶段的兵棋地图进行了分析。
关键词
兵棋 地图
沙盘兵棋 地图
纸质兵棋 地图
电子兵棋 地图
Keywords
wargame map
sandtable wargame map
paper wargame map
digital wargame map
分类号
P285
[天文地球—地图制图学与地理信息工程]
题名 兵棋系统非玩家角色人机协同开发策略思考
17
作者
赵鑫业
梁川
苑博
刘鹏
机构
海军大连舰艇学院作战软件与仿真研究所
海军大连舰艇学院学员五大队
出处
《现代电子技术》
2023年第16期160-164,共5页
文摘
当前兵棋推演的研究集中在如何更真实地模拟对抗以及如何实现态势分析与推理,进而辅助人类指挥决策。因此,兵棋系统亟需突破模拟“人”行为的智能问题,即非玩家角色(NPC)的智能化水平,以提高博弈对抗的水平和推演的逼真度。在分析知识推理型与数据学习型兵棋系统非玩家角色优缺点的基础上,文中提出一种涉及人机协同兵棋非玩家角色开发策略,使非玩家角色能够针对敌方战术实现更有建设性的智能学习,从而促进兵棋系统与实战演练、训练的深度融合,同时为作战决策、实战训练和军事教育提供有力支撑。
关键词
兵棋 系统
人机协作
非玩家角色
人工智能
深度强化学习
AI伦理学
Keywords
wargame system
human-machine collaboration
NPC
artificial intelligence
deep reinforcement learning
AI ethics
分类号
TN911-34
[电子电信—通信与信息系统]
TP391.9
[自动化与计算机技术—计算机应用技术]
题名 基于兵棋推演的联合侦察预警能力评估
18
作者
李志强
刘经德
殷来祥
曹毅
付琼莹
机构
国防大学联合作战学院
出处
《指挥控制与仿真》
2023年第3期71-77,共7页
文摘
联合侦察预警体系的能力指标是联合作战指挥员在作战筹划与指挥控制阶段关注的重要基础信息之一。根据联合作战指挥员对联合侦察预警能力分析评估需求,基于兵棋推演基础想定和实时推演数据,采用体系能力边界静态评估与实时作战效能评估相结合的方法,从宏观整体与局部细节不同层次系统全面地评估联合侦察预警体系作战能力,设计构建了联合侦察预警体系基本作战能力与实时作战效能评估两大类十五个具体评估指标,并对每一个评估指标的内涵、外延和计算方法进行了详细阐述;最后,基于兵棋推演基础想定和推演模型输出结果,设计并实现了联合侦察预警体系能力评估软件工具,为兵棋推演中面向指挥员的联合侦察预警能力评估提供了新思路和新方法。
关键词
侦察预警
体系能力
指标体系
兵棋 推演
Keywords
reconnaissance and warning
system of system capability
index system
wargame
分类号
E917
[军事]
题名 兵棋推演的智能决策技术与挑战
被引量:8
19
作者
尹奇跃
赵美静
倪晚成
张俊格
黄凯奇
机构
中国科学院自动化研究所
中国科学院大学
出处
《自动化学报》
EI
CAS
CSCD
北大核心
2023年第5期913-928,共16页
基金
国家自然科学青年基金(61906197)资助。
文摘
近年来,以人机对抗为途径的智能决策技术取得了飞速发展,人工智能(Artificial intelligence, AI)技术AlphaGo、AlphaStar等分别在围棋、星际争霸等游戏环境中战胜了顶尖人类选手.兵棋推演作为一种人机对抗策略验证环境,由于其非对称环境决策、更接近真实环境的随机性与高风险决策等特点,受到智能决策技术研究者的广泛关注.通过梳理兵棋推演与目前主流人机对抗环境(如围棋、德州扑克、星际争霸等)的区别,阐述了兵棋推演智能决策技术的发展现状,分析了当前主流技术的局限与瓶颈,对兵棋推演中的智能决策技术研究进行了思考,期望能对兵棋推演相关问题中的智能决策技术研究带来启发.
关键词
兵棋 推演
人机对抗
智能决策技术
博弈学习
Keywords
Wargame
human-machine confrontation
intelligent decision making technology
game learning
分类号
O225
[理学—运筹学与控制论]
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 兵棋推演空中任务智能预测方法研究
被引量:2
20
作者
张大永
杨镜宇
吴曦
机构
国防大学研究生院
国防大学联合作战学院
出处
《系统仿真学报》
CAS
CSCD
北大核心
2023年第1期212-220,共9页
文摘
对战场敌空中目标作战任务进行高效、准确地自动判断,是态势认知的基础和辅助作战资源分配的关键。结合前馈深度神经网络和长短时记忆网络模型计算特点,设计了2个针对性基指标学习器,然后根据基指标交叉熵进行加权组合,用于进一步学习器训练评价指标,既能有效防止模型过拟合,又能提高模型训练效率。测试结果表明,所提模型能较好防止模型过拟合,并能以较高的准确率判断战场敌目标作战任务。
关键词
空中任务
深度学习
态势认知
兵棋 推演
资源分配
Keywords
air mission
deep learning
situation awareness
wargaming
allocation of resources
分类号
TP391.9
[自动化与计算机技术—计算机应用技术]