面向智能博弈的决策Transformer方法综述被引量：1

On Decision-making Transformer Methods for Intelligent Gaming

下载PDF

导出

摘要智能博弈是认知决策智能领域的挑战性问题,是辅助联合作战筹划与智能任务规划的关键支撑.从协作式团队博弈、竞争式零和博弈和混合式一般和博弈共3个角度梳理了智能博弈模型,从认知角度出发定义了运筹型博弈(完全/有限理性)、不确定型博弈(经验/知识)、涌现探索型博弈(直觉+灵感)、群体交互型博弈(协同演化)共4类智能博弈认知模型,从问题可信任解、策略训练平台、问题求解范式共3个视角给出智能博弈求解方案.基于Transformer架构重点梳理了架构增强(表示学习、网络组合、模型扩展)与序列建模(离线预训练、在线适变、模型扩展)共2大类6小类决策Transformer方法,相关研究为开展“离线预训练+在线适变”范式下满足多主体、多任务、多模态及虚实迁移等应用场景的决策预训练模型构建提供了初始参考.为智能博弈领域的决策基石模型相关研究提供可行借鉴. Intelligent gaming is a challenging problem in the field of cognitive decision-making intelligence,and it is the key support for assisting joint combat planning and intelligent mission planning.The intelligent gaming model is sorted out from three perspectives:collaborative team game,competitive zero-sum game and mixed general-sum game,four kinds of cognitive models of intelligent gaming are defined from the perspective of cognition:operational game(complete or bounded rationality),uncertain game(experience/knowledge),emerging exploratory game(intuition and inspiration),and population interactive game(co-evolution).Solutions of intelligent gaming are given from three perspectives:trustworthy solution of problems,benchmark learning method,and strategy training platform.Secondly,based on Transformer framework,the decision-making Transformer methods are analyzed from architecture enhancement(presentation learning,network combination,model extension)and sequence modeling(offline pre-training,online adaptation,model extension).Relevant research provides an initial reference for the construction of decision-making pre-trained model in multi-agent,multi-task,multi-mode and sim-to-real transfer application scenarios under the paradigm of"offline pre-training+online adaptation".It is expected to provide feasible reference for the research on the decision-making foundation model in the field of intelligent gaming.

作者罗俊仁张万鹏苏炯铭王尧陈璟 LUO Junren;ZHANG Wanpeng;SU Jiongming;WANG Yao;CHEN Jing(College of Intelligence Science and Technology,National University of Defense Technology,Changsha Hunan 410073,China)

机构地区国防科技大学智能科学学院

出处《指挥与控制学报》 CSCD 2023年第1期9-22,共14页 Journal of Command and Control

基金国家自然科学基金(61806212) 湖南省研究生创新项目(CX20210011)资助。

关键词智能博弈智能规划与决策认知建模离线预训练在线适变决策基石模型 intelligent gaming intelligent planning and decision-making cognitive modeling offline pre-training online adaptation decision-making foundation model

分类号 E91 [军事]

引文网络
相关文献

参考文献1

1黄凯奇,兴军亮,张俊格,倪晚成,徐博.人机对抗智能技术[J].中国科学：信息科学,2020,50(4):540-550. 被引量：27

二级参考文献5

1曾鹏,吴玲达,魏迎梅.战术计划识别模型的分析、描述与设计[J].计算机与数字工程,2006,34(9):1-4. 被引量：5
2黄凯奇,任伟强,谭铁牛.图像物体分类与检测算法综述[J].计算机学报,2014,37(6):1225-1240. 被引量：191
3黄凯奇,陈晓棠,康运锋,谭铁牛.智能视频监控技术综述[J].计算机学报,2015,38(6):1093-1118. 被引量：393
4胡晓峰,贺筱媛,陶九阳.AlphaGo的突破与兵棋推演的挑战[J].科技导报,2017,35(21):49-60. 被引量：37
5朱丰,胡晓峰,吴琳,贺筱媛,吕学志,廖鹰.从态势认知走向态势智能认知[J].系统仿真学报,2018,30(3):761-771. 被引量：48

共引文献26

1聂凯,孟庆海.面向仿真推演的认知不确定性仿真建模范式[J].舰船电子工程,2020,40(12):70-73. 被引量：1
2拓世英,孙浩,林子涵,陈进.多模态图像智能目标识别对抗攻击[J].国防科技,2021,42(2):8-13. 被引量：5
3黄凯奇,赵鑫,李乔哲,胡世宇.视觉图灵:从人机对抗看计算机视觉下一步发展[J].图学学报,2021,42(3):339-348. 被引量：4
4聂凯,曾科军,孟庆海,魏超.人机对抗智能技术最新进展及军事应用[J].兵器装备工程学报,2021,42(6):6-11. 被引量：5
5庄春华,刘少杰,王协盼.人工智能赋能军事训练[J].国防科技,2021,42(4):129-132. 被引量：1
6马贤明,张海林,王全东,齐智敏.无人机集群作战智能培育平台构建研究[J].军事运筹与系统工程,2021,35(2):68-74.
7程恺,陈刚,余晓晗,刘满,邵天浩.知识牵引与数据驱动的兵棋AI设计及关键技术[J].系统工程与电子技术,2021,43(10):2911-2917. 被引量：13
8白江波,杨阳,张文生.星际争霸图像序列的群体行为识别研究[J].应用科技,2022,49(2):63-69.
9孙宇祥,彭益辉,李斌,周佳炜,张鑫磊,周献中.智能博弈综述:游戏AI对作战推演的启示[J].智能科学与技术学报,2022,4(2):157-173. 被引量：8
10袁唯淋,罗俊仁,陆丽娜,陈佳星,张万鹏,陈璟.智能博弈对抗方法:博弈论与强化学习综合视角对比分析[J].计算机科学,2022,49(8):191-204. 被引量：9

同被引文献38

1周姚,夏旻,莫李龙.兰德联合一体化应急模型应用及启示[J].东南大学学报（哲学社会科学版）,2021,23(S01):166-167. 被引量：4
2季明.美国“翌日”模拟法辅助战略问题决策[J].外国军事学术,2004,0(9):34-35. 被引量：1
3赵晓哲,郭锐.军事系统研究的综合集成方法[J].系统工程理论与实践,2004,24(10):127-130. 被引量：17
4娄伟.情景分析方法研究[J].未来与发展,2012,33(9):17-26. 被引量：32
5易本胜,李万顺.美军战略净评估方法分析[J].军事运筹与系统工程,2012,26(3):14-18. 被引量：9
6刘海洋,唐宇波,胡晓峰,刘戎翔,崔文华.面向联合作战评估的兵棋推演实验研究[J].指挥与控制学报,2018,4(4):272-280. 被引量：7
7李健,毛翔.兰德战略评估系统及其影响[J].军事运筹与系统工程,2015,29(1):5-12. 被引量：13
8陈敏,黄谦,李坎.军事战略博弈研讨系统分析与设计[J].指挥控制与仿真,2019,41(1):84-89. 被引量：3
9易本胜.净评估：军事理论生成和转化的有效模式与方法[J].军事文摘,2020,0(2):6-11. 被引量：2
10黄凯奇,兴军亮,张俊格,倪晚成,徐博.人机对抗智能技术[J].中国科学：信息科学,2020,50(4):540-550. 被引量：27

引证文献1

1罗俊仁,张万鹏,项凤涛,蒋超远,陈璟.智能推演综述:博弈论视角下的战术战役兵棋与战略博弈[J].系统仿真学报,2023,35(9):1871-1894.

1牛锦华.在家庭实施幼儿探索型体育活动的策略[J].河南教育（基教版）（上）,2023(3):74-75.
2冯社辉,任令钦.联合作战空战场管控筹划模型研究[J].军事运筹与评估,2023,38(1):55-60.
3张明智,邹立岩,罗凯.基于认知决策的智能无人机集群作战建模方法研究[J].军事运筹与评估,2022,37(4):61-67. 被引量：1
4张蒙,王瑞芬,管雯斌,孙也淇,李凌轩,李俊磊,王立峰.EBV相关性胃癌21例临床病理学分析[J].临床与实验病理学杂志,2022,38(12):1486-1491.
5周丽萍.新时代民营经济高质量发展的实现路径研究[J].佳木斯大学社会科学学报,2023,41(1):30-33.
6李作学,马婧婧,张蒙.员工反馈寻求行为的影响因素组态与路径分析——基于fsQCA方法的研究[J].沈阳航空航天大学学报,2022,39(5):84-96.
7冯军星,刘彬.基于AHP和模糊综合评价的作战筹划能力评估[J].兵工自动化,2023,42(3):68-70. 被引量：2
8宋炜,雷雨萌,周勇,董明放.政府补贴、研发偏好与工业创新绩效[J].统计与决策,2023(6):178-182.
9李盼盼,张秀秀,向玉婷,唐大春,黄婵,常华,慕容红梅.贵州黔西南地区孕妇地中海贫血的基因突变类型[J].贵州医科大学学报,2023,48(1):55-62. 被引量：3
10周超.不等式中求参数范围问题破解策略探究[J].高中数理化,2023(5):36-37.

指挥与控制学报

2023年第1期

浏览历史

内容加载中请稍等...

面向智能博弈的决策Transformer方法综述被引量：1

参考文献1

二级参考文献5

共引文献26

同被引文献38

引证文献1

相关作者

相关机构

相关主题

浏览历史

面向智能博弈的决策Transformer方法综述 被引量：1

参考文献1

二级参考文献5

共引文献26

同被引文献38

引证文献1

相关作者

相关机构

相关主题

浏览历史

面向智能博弈的决策Transformer方法综述被引量：1