智能博弈对抗中的对手建模方法及其应用综述被引量：6

Survey of Opponent Modeling Methods and Applications in Intelligent Game Confrontation

下载PDF

导出

摘要智能博弈对抗一直是人工智能研究的热点。在博弈对抗环境中,通过对对手进行建模,可以推测敌对智能体动作、目标、策略等相关属性,为博弈策略制定提供关键信息。对手建模方法在竞技类游戏和作战仿真推演等领域的应用前景广阔,博弈策略的制定必须以博弈各方的行动策略为前提,因此建立一个准确的对手行为模型对于预测其意图尤其重要。从内涵、方法、应用三个方面,阐述了对手建模的必要性,对现有建模方式进行了分类;对基于强化学习的预测方法、基于心智理论的推理方法和基于贝叶斯的优化方法进行了梳理与总结;以序贯博弈(德州扑克)、即时策略博弈(星际争霸)和元博弈为典型应用场景,分析了智能博弈对抗过程中的对手建模的作用;从有限理性、策略欺骗性和可解释性三个方面进行了对手建模技术发展的展望。 Intelligent game confrontation has always been the focus of artificial intelligence research.In the game confrontation environment,the actions,goals,strategies,and other related attributes of agent can be inferred by opponent modeling,which provides key information for game strategy formulation.The application of opponent modeling method in competitive games and combat simulation is promising,and the formulation of game strategy must be premised on the action strategy of all parties in the game,so it is especially important to establish an accurate model of opponent behavior to predict its intention.From three dimensions of connotation,method,and application,the necessity of opponent modeling is expounded and the existing modeling methods are classified.The prediction method based on reinforcement learning,reasoning method based on theory of mind,and optimization method based on Bayesian are summarized.Taking the sequential game(Texas Hold’em),real-time strategy game(StarCraft),and meta-game as typical application scenarios,the role of opponent modeling in intelligent game confrontation is analyzed.Finally,the development of adversary modeling technology prospects from three aspects of bounded rationality,deception strategy and interpretability.

作者魏婷婷袁唯淋罗俊仁张万鹏 WEI Tingting;YUAN Weilin;LUO Junren;ZHANG Wanpeng(College of Intelligence Science and Technology,National University of Defense Technology,Changsha 410073,China)

机构地区国防科技大学智能科学学院

出处《计算机工程与应用》 CSCD 北大核心 2022年第9期19-29,共11页 Computer Engineering and Applications

基金国家自然科学基金(61702528,61806212) 湖南省研究生科研创新项目(CX20210011)。

关键词对手建模不完美信息行为预测深度强化学习递归推理元博弈 opponent modeling imperfect information behavior prediction deep reinforcement learning recursive reasoning meta-game

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1高巍,罗俊仁,袁唯淋,张万鹏.面向对手建模的意图识别方法综述[J].网络与信息安全学报,2021,7(4):86-100. 被引量：6
2张宏达,李德才,何玉庆.人工智能与“星际争霸”:多智能体博弈研究新进展[J].无人系统技术,2019,2(1):5-16. 被引量：17
3袁唯淋,廖志勇,高巍,魏婷婷,罗俊仁,张万鹏,陈璟.计算机扑克智能博弈研究综述[J].网络与信息安全学报,2021,7(5):57-76. 被引量：3

二级参考文献4

1陈学松,杨宜民.强化学习研究综述[J].计算机应用研究,2010,27(8):2834-2838. 被引量：61
2朱建明,高博.社交金融的信息安全风险分析与防范[J].网络与信息安全学报,2016,2(3):46-51. 被引量：8
3杨峻楠,张红旗,张传富.基于不完全信息随机博弈的防御决策方法.[J].网络与信息安全学报,2018,4(8):12-20. 被引量：5
4高巍,罗俊仁,袁唯淋,张万鹏.面向对手建模的意图识别方法综述[J].网络与信息安全学报,2021,7(4):86-100. 被引量：6

共引文献23

1季海波.思政背景下运筹学课程改革初探[J].科教导刊,2022(16):98-100. 被引量：3
2曹坤泽.人工智能及其在游戏领域中的应用[J].科技传播,2020,12(8):143-144. 被引量：1
3马满好,刘进.运筹学类课程教学中的课程思政研究[J].高教学刊,2020(35):176-179. 被引量：26
4刘进,马满好.面向智能的博弈论课程建设研究[J].教育教学论坛,2020(49):258-261.
5沈宇,韩金朋,李灵犀,王飞跃.游戏智能中的AI——从多角色博弈到平行博弈[J].智能科学与技术学报,2020,2(3):205-213. 被引量：13
6李军予,闫国瑞,李志刚,白照广.智能遥感星群技术发展研究[J].航天返回与遥感,2020,41(6):34-44. 被引量：12
7刘冰雁,叶雄兵,岳智宏,董献洲,张其扬.基于多组并行深度Q网络的连续空间追逃博弈算法[J].兵工学报,2021,42(3):663-672. 被引量：3
8聂凯,曾科军,孟庆海,魏超.人机对抗智能技术最新进展及军事应用[J].兵器装备工程学报,2021,42(6):6-11. 被引量：5
9马贤明,张海林,王全东,齐智敏.无人机集群作战智能培育平台构建研究[J].军事运筹与系统工程,2021,35(2):68-74.
10袁唯淋,廖志勇,高巍,魏婷婷,罗俊仁,张万鹏,陈璟.计算机扑克智能博弈研究综述[J].网络与信息安全学报,2021,7(5):57-76. 被引量：3

同被引文献130

1李宪港,李强.典型智能博弈系统技术分析及指控系统智能化发展展望[J].智能科学与技术学报,2020,2(1):36-42. 被引量：21
2黄南天,包佳瑞琦,蔡国伟,赵树野,刘德宝,王俊生,王盼盼.多主体联合投资微电网源–储多策略有限理性决策演化博弈容量规划[J].中国电机工程学报,2020,40(4):1212-1225. 被引量：36
3张克,刘永才,关世义.多智能体系统在导弹攻防对抗仿真中应用的可行性研究[J].战术导弹技术,2001(6):59-65. 被引量：8
4马向玲,高波,李国林.导弹集群协同作战任务规划系统[J].飞行力学,2009,27(1):1-5. 被引量：25
5黎湘,范梅梅.认知雷达及其关键技术研究进展[J].电子学报,2012,40(9):1863-1870. 被引量：77
6王芳,涂震飚,魏佳宁.战术导弹协同突防关键技术研究[J].战术导弹技术,2013(3):13-17. 被引量：15
7王沙飞,鲍雁飞,李岩.认知电子战体系结构与技术[J].中国科学：信息科学,2018,48(12):1603-1613. 被引量：61
8张伟,平殿发,张韫.云模型在雷达干扰资源多目标优化配置中的应用[J].指挥控制与仿真,2014,36(5):39-44. 被引量：5
9王元卓,于建业,邱雯,沈华伟,程学旗,林闯.网络群体行为的演化博弈模型与分析方法[J].计算机学报,2015,38(2):282-300. 被引量：62
10张春磊,杨小牛.认知电子战与认知电子战系统研究[J].中国电子科学研究院学报,2014,9(6):551-555. 被引量：48

引证文献6

1王健,杨渡佳,黄科举,李小帅,杨俊安.认知电子战发展趋势:从单体智能到群体智能[J].信息对抗技术,2023,2(4):151-170. 被引量：4
2张敏慧,李晓露,柳劲松,林顺富.计及有限理性的多微电网电能交易策略[J].浙江电力,2024,43(1):45-56.
3聂文川,樊志强.基于EPF-MADDPG算法的多导弹机动策略研究[J].计算机测量与控制,2024,32(2):156-161.
4张小川,严明珠,涂飞,陈俊宇,魏乐天.一种大众麻将计算机博弈的快速出牌方法[J].重庆理工大学学报（自然科学）,2024,38(5):102-107.
5白成超,张琦,谢旭东,颜鹏,郭继峰.面向复杂决策的OODA环:智能赋能与认知增强[J].指挥与控制学报,2024,10(3):284-297.
6余超,刘宗凯,胡超豪,黄凯奇,张俊格.非完美信息博弈综述:对抗求解方法与对比分析[J].计算机学报,2024,47(9):2211-2246.

二级引证文献4

1闫宽,赵江鸿.基于群体智能算法的羽毛球战术分析与优化研究[J].文体用品与科技,2023(22):187-189.
2崔玉伟,孙雪.作动器故障下的无人机容错控制方法[J].海军航空大学学报,2023,38(6):449-456.
3刘文斌,吉磊,范平志,丁建锋.美军认知电子战关键技术发展方向分析[J].通信技术,2024,57(3):299-308. 被引量：1
4杨洋,王烨,康大勇,陈嘉玉,李姜,赵华栋.基于强化学习的多智能体协同电子对抗方法[J].兵器装备工程学报,2024,45(7):1-10.

1王颖洁,朱久祺,汪祖民,白凤波,弓箭.自然语言处理在文本情感分析领域应用综述[J].计算机应用,2022,42(4):1011-1020. 被引量：50
2王自力,朝镛,谭诗羽,何小钢.忠诚折扣、转售价格维持组合与非对称零售服务投资[J].经济研究,2021,56(9):175-190. 被引量：2
3程姿,沈伯雄,吕宏虹,王旭东,杨伟.稳定剂在提高纳米材料及其复合材料环境修复性能中的应用综述[J].环境工程,2022,40(2):225-234. 被引量：2
4李凯,李艳.考虑靠港延误补偿策略的集装箱舱位定价研究[J].武汉理工大学学报,2021,43(5):41-47.
5李德龙,刘德海.基于白名单的地铁涉恐防爆安检序贯博弈模型[J].系统工程理论与实践,2021,41(11):2975-2991. 被引量：7
6何静.社会心智:描述性预测与规范性预期[J].中国社会科学文摘,2022(2):42-43.
7白江波,杨阳,张文生.星际争霸图像序列的群体行为识别研究[J].应用科技,2022,49(2):63-69.
8邱国侠,曾成敏.网络游戏直播著作权问题研究——以游戏整体画面性质与权利归属为对象[J].河南工业大学学报（社会科学版）,2022,38(1):63-69. 被引量：7
9郭杰,朱玉明,李夏晶,刘红义.基于数字孪生的城市地下综合管廊应用研究[J].计算机仿真,2022,39(4):119-123. 被引量：5
10王长君,闫君,董勇,宋占龙.相变储能技术在热泵系统中的应用综述[J].综合智慧能源,2022,44(4):51-64. 被引量：7

计算机工程与应用

2022年第9期

浏览历史

内容加载中请稍等...

智能博弈对抗中的对手建模方法及其应用综述被引量：6

参考文献3

二级参考文献4

共引文献23

同被引文献130

引证文献6

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

智能博弈对抗中的对手建模方法及其应用综述 被引量：6

参考文献3

二级参考文献4

共引文献23

同被引文献130

引证文献6

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

智能博弈对抗中的对手建模方法及其应用综述被引量：6