期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
布洛托上校博弈模型及求解方法研究进展
1
作者 罗俊仁 邹明我 +2 位作者 陈少飞 张万鹏 陈璟 《计算机科学》 CSCD 北大核心 2024年第1期84-98,共15页
信息的传播扩散可以建模为在潜在传播网络上发生的随机过程。由于在实际应用场景中,潜在的传播网络拓扑结构和清晰的传播过程往往是不可见的,因此根据观测到的传播结果,如节点感染时间、状态等信息,推断传播网络拓扑结构,对于分析与理... 信息的传播扩散可以建模为在潜在传播网络上发生的随机过程。由于在实际应用场景中,潜在的传播网络拓扑结构和清晰的传播过程往往是不可见的,因此根据观测到的传播结果,如节点感染时间、状态等信息,推断传播网络拓扑结构,对于分析与理解传播过程、跟踪传播路径以及预测未来传播事件起着重要作用。近年来,传播网络推断问题吸引了众多研究者的目光。文中对近年来的信息传播网络推断工作进行系统性的介绍和总结,为传播网络推断提供一个新视角。 展开更多
关键词 资源分配 布洛托上校博弈 近似纳什均衡 在线凸优化 期望遗憾 高概率遗憾
下载PDF
多智能体博弈学习研究进展
2
作者 罗俊仁 张万鹏 +2 位作者 苏炯铭 袁唯淋 陈璟 《系统工程与电子技术》 EI CSCD 北大核心 2024年第5期1628-1655,共28页
随着深度学习和强化学习而来的人工智能新浪潮,为智能体从感知输入到行动决策输出提供了“端到端”解决方案。多智能体学习是研究智能博弈对抗的前沿课题,面临着对抗性环境、非平稳对手、不完全信息和不确定行动等诸多难题与挑战。本文... 随着深度学习和强化学习而来的人工智能新浪潮,为智能体从感知输入到行动决策输出提供了“端到端”解决方案。多智能体学习是研究智能博弈对抗的前沿课题,面临着对抗性环境、非平稳对手、不完全信息和不确定行动等诸多难题与挑战。本文从博弈论视角入手,首先给出了多智能体学习系统组成,进行了多智能体学习概述,简要介绍了各类多智能体学习研究方法。其次,围绕多智能体博弈学习框架,介绍了多智能体博弈基础模型及元博弈模型,均衡解概念和博弈动力学,学习目标多样、环境(对手)非平稳、均衡难解且易变等挑战。再次,全面梳理了多智能体博弈策略学习方法,离线博弈策略学习方法,在线博弈策略学习方法。最后,从智能体认知行为建模与协同、通用博弈策略学习方法和分布式博弈策略学习框架共3个方面探讨了多智能体学习的前沿研究方向。 展开更多
关键词 博弈学习 多智能体学习 元博弈 在线无悔学习
下载PDF
面向策略探索的强化学习与进化计算方法综述
3
作者 王尧 罗俊仁 +2 位作者 周棪忠 谷学强 张万鹏 《计算机科学》 CSCD 北大核心 2024年第3期183-197,共15页
强化学习与进化计算作为两类自然启发的学习范式,是当前求解策略探索问题的主流方法,两类方法的融合为策略探索问题的求解提供了通用解决方案。通过对比强化学习与进化计算,从强化学习与进化计算的基本方法、策略探索的基础方法分析、... 强化学习与进化计算作为两类自然启发的学习范式,是当前求解策略探索问题的主流方法,两类方法的融合为策略探索问题的求解提供了通用解决方案。通过对比强化学习与进化计算,从强化学习与进化计算的基本方法、策略探索的基础方法分析、策略探索的融合式方法分析以及前沿挑战4个方面全面分析了策略探索问题的方法,以期能够为该领域的交叉融合研究带来启发。 展开更多
关键词 马尔可夫决策过程 强化学习 进化计算 策略搜索 元学习
下载PDF
海空跨域协同兵棋AI架构设计及关键技术分析
4
作者 苏炯铭 罗俊仁 +1 位作者 陈少飞 项凤涛 《指挥控制与仿真》 2024年第2期35-43,共9页
以深度强化学习为核心的智能博弈技术在游戏领域内的突破和进展为海空兵棋AI的研究提供了借鉴。智能体架构设计是需要解决的关键问题,良好的架构能够降低算法训练的复杂度和难度,加快策略收敛。提出基于随机博弈的海空跨域协同决策博弈... 以深度强化学习为核心的智能博弈技术在游戏领域内的突破和进展为海空兵棋AI的研究提供了借鉴。智能体架构设计是需要解决的关键问题,良好的架构能够降低算法训练的复杂度和难度,加快策略收敛。提出基于随机博弈的海空跨域协同决策博弈模型,分析了相关的均衡解概念;在分析典型智能体框架基础上,针对海空兵棋推演决策博弈过程,提出基于多智能体分层强化学习的智能体双层架构,能够有效解决智能体间协作和维度灾难问题;从兵力协同、智能体网络设计、对手建模和训练机制共4个方面分析了关键技术。期望为海空兵棋AI设计实现提供架构指导。 展开更多
关键词 海空兵棋 跨域协同 兵棋推演 多智能体 智能博弈 模型架构 分层强化学习
下载PDF
面向智能博弈的决策Transformer方法综述 被引量:1
5
作者 罗俊仁 张万鹏 +2 位作者 苏炯铭 王尧 陈璟 《指挥与控制学报》 CSCD 2023年第1期9-22,共14页
智能博弈是认知决策智能领域的挑战性问题,是辅助联合作战筹划与智能任务规划的关键支撑.从协作式团队博弈、竞争式零和博弈和混合式一般和博弈共3个角度梳理了智能博弈模型,从认知角度出发定义了运筹型博弈(完全/有限理性)、不确定型博... 智能博弈是认知决策智能领域的挑战性问题,是辅助联合作战筹划与智能任务规划的关键支撑.从协作式团队博弈、竞争式零和博弈和混合式一般和博弈共3个角度梳理了智能博弈模型,从认知角度出发定义了运筹型博弈(完全/有限理性)、不确定型博弈(经验/知识)、涌现探索型博弈(直觉+灵感)、群体交互型博弈(协同演化)共4类智能博弈认知模型,从问题可信任解、策略训练平台、问题求解范式共3个视角给出智能博弈求解方案.基于Transformer架构重点梳理了架构增强(表示学习、网络组合、模型扩展)与序列建模(离线预训练、在线适变、模型扩展)共2大类6小类决策Transformer方法,相关研究为开展“离线预训练+在线适变”范式下满足多主体、多任务、多模态及虚实迁移等应用场景的决策预训练模型构建提供了初始参考.为智能博弈领域的决策基石模型相关研究提供可行借鉴. 展开更多
关键词 智能博弈 智能规划与决策 认知建模 离线预训练 在线适变 决策基石模型
下载PDF
智能推演综述:博弈论视角下的战术战役兵棋与战略博弈
6
作者 罗俊仁 张万鹏 +2 位作者 项凤涛 蒋超远 陈璟 《系统仿真学报》 CAS CSCD 北大核心 2023年第9期1871-1894,共24页
推演是一项研究国家安全与竞争、军事冲突与战争、危机管控等重大战略问题的预实践活动。智能推演系统需要人工智能技术的赋能。简要概述了智能博弈的研究进展,推演的演进脉络,智能化兵棋推演及战略博弈推演方法;从博弈论的视角切入,分... 推演是一项研究国家安全与竞争、军事冲突与战争、危机管控等重大战略问题的预实践活动。智能推演系统需要人工智能技术的赋能。简要概述了智能博弈的研究进展,推演的演进脉络,智能化兵棋推演及战略博弈推演方法;从博弈论的视角切入,分析了面向智能推演的博弈问题模型,梳理了智能兵棋推演的应用模式、战略博弈推演的组织方式;提出了基于云原生的智能推演服务化架构,面向云边端分布式对抗探索了未来决策云预训练方法,面向危机事件认知构建了战略博弈推演元博弈分析框架。期望为智能博弈推演方面的理论与工具等研究提供科学有效的参考,为新一代智能化云边协同指控提供理论与技术支撑。 展开更多
关键词 兵棋推演 战略博弈 元博弈 冲突分析 对抗分析 云原生 预训练
下载PDF
群视角下的多智能体强化学习方法综述
7
作者 项凤涛 罗俊仁 +2 位作者 谷学强 苏炯铭 张万鹏 《智能科学与技术学报》 CSCD 2023年第3期313-329,共17页
多智能体系统是分布式人工智能领域的前沿研究概念,传统的多智能体强化学习方法主要聚焦群体行为涌现、多智能体合作与协调、智能体间交流与通信、对手建模与预测等主题,但依然面临环境部分可观、对手策略非平稳、决策空间维度高、信用... 多智能体系统是分布式人工智能领域的前沿研究概念,传统的多智能体强化学习方法主要聚焦群体行为涌现、多智能体合作与协调、智能体间交流与通信、对手建模与预测等主题,但依然面临环境部分可观、对手策略非平稳、决策空间维度高、信用分配难理解等难题,如何设计满足智能体数量规模比较大、适应多类不同应用场景的多智能体强化学习方法是该领域的前沿课题。首先简述了多智能体强化学习的相关研究进展;其次着重从规模可扩展与种群自适应两个视角对多种类、多范式的多智能体学习方法进行了综合概述归纳,系统梳理了集合置换不变性、注意力机制、图与网络理论、平均场理论共四大类规模可扩展学习方法,迁移学习、课程学习、元学习、元博弈共四大类种群自适应强化学习方法,给出典型应用场景;最后从基准平台开发、双层优化架构、对抗策略学习、人机协同价值对齐和自适应博弈决策环共5个方面进行了前沿研究方向展望,该研究可为多模态环境下多智能强化学习的相关前沿重点问题研究提供参考。 展开更多
关键词 分布式智能 平均场理论 图神经网络 元学习 元博弈
下载PDF
面向对抗条件下资源分配的在线多阶段布洛托博弈求解方法
8
作者 陈少飞 邹明我 +2 位作者 苏小龙 罗俊仁 冯俊侨 《智能科学与技术学报》 CSCD 2023年第4期464-476,共13页
未来战场上的作战资源分配是一个存在总资源预算约束的多阶段对抗问题,具有环境高复杂性、动态不确定性、博弈强对抗性。基于布洛托博弈模型,首先把多阶段对抗场景下的资源分配问题建模为双层在线布洛托博弈,然后将原资源分配问题转化... 未来战场上的作战资源分配是一个存在总资源预算约束的多阶段对抗问题,具有环境高复杂性、动态不确定性、博弈强对抗性。基于布洛托博弈模型,首先把多阶段对抗场景下的资源分配问题建模为双层在线布洛托博弈,然后将原资源分配问题转化为有向无环图上的在线最短路径问题,并借鉴拉格朗日博弈对资源分配问题进行分析求解。此外,提出LagrangeBwK-Exp3-G算法以实现多阶段对抗条件下资源分配问题的高概率遗憾最小化,进一步通过数学推导获得关于时间范围T的高概率遗憾界。最后,设计一个多阶段对抗条件下的卫星通信多信道功率分配实验,从而验证LagrangeBwK-Exp3-G算法具有良好性能。 展开更多
关键词 多阶段对抗 布洛托博弈 资源分配 高概率遗憾
下载PDF
面向多智能体博弈对抗的对手建模框架 被引量:4
9
作者 罗俊仁 张万鹏 +3 位作者 袁唯淋 胡振震 陈少飞 陈璟 《系统仿真学报》 CAS CSCD 北大核心 2022年第9期1941-1955,共15页
对手建模作为多智能体博弈对抗的关键技术,是一种典型的智能体认知行为建模方法。介绍了多智能体博弈对抗几类典型模型、非平稳问题和元博弈相关理论;梳理总结对手建模方法,归纳了对手建模前沿理论,并对其应用前景及面对的挑战进行分析... 对手建模作为多智能体博弈对抗的关键技术,是一种典型的智能体认知行为建模方法。介绍了多智能体博弈对抗几类典型模型、非平稳问题和元博弈相关理论;梳理总结对手建模方法,归纳了对手建模前沿理论,并对其应用前景及面对的挑战进行分析。基于元博弈理论,构建了一个包括对手策略识别与生成、对手策略空间重构和对手利用共三个模块的通用对手建模框架。期望为多智能体博弈对抗对手建模方面的理论与方法研究提供有价值的参考。 展开更多
关键词 多智能体 对手建模 认知行为建模 元博弈
下载PDF
文化景观的保护研究--以布莱纳文工业遗产景观为例 被引量:1
10
作者 罗俊仁 《城市建筑》 2015年第30期254-255,共2页
文化景观是随着人们对于历史遗产的认识不断深入而提出的,这样的概念填补了过去历史遗产保护的遗漏或模糊区域。我国近年来不断加强和推动文化景观的相关制度与法律建设。2008年7月,国务院颁布的《历史文化名城名镇名村保护条例》给... 文化景观是随着人们对于历史遗产的认识不断深入而提出的,这样的概念填补了过去历史遗产保护的遗漏或模糊区域。我国近年来不断加强和推动文化景观的相关制度与法律建设。2008年7月,国务院颁布的《历史文化名城名镇名村保护条例》给我国文化景观的保护带来了新的机遇。本研究以英国的世界遗产也是文化景观之一的布莱纳文工业遗产景观为例,通过案例研究,说明了这一区域文化景观的保护与再利用特点,讨论了其对于我国文化景观可供借鉴的意义。 展开更多
关键词 文化景观 再利用 文化资源保护 工业遗产景观
下载PDF
即时策略博弈在线对抗规划方法综述
11
作者 罗俊仁 张万鹏 +1 位作者 陆丽娜 陈璟 《计算机科学》 CSCD 北大核心 2022年第6期287-296,共10页
即时策略博弈在线规划是多智能体学习领域的挑战性问题,在博弈对抗过程中,面对不确定性威胁环境和非平稳性对手,智能体需要在有限时间内根据博弈对抗态势推理对方的行动,在巨大的状态空间和动作空间中快速做出己方行动规划,组织对抗规... 即时策略博弈在线规划是多智能体学习领域的挑战性问题,在博弈对抗过程中,面对不确定性威胁环境和非平稳性对手,智能体需要在有限时间内根据博弈对抗态势推理对方的行动,在巨大的状态空间和动作空间中快速做出己方行动规划,组织对抗规划。即时策略博弈平台是研究在线对抗规划问题的理想测试床。文中首先借助一个典型的即时策略博弈模型引出即时策略博弈对抗问题,并将其分类成3个层次和2种操作控制方法,从5个子方向梳理了即时策略博弈面临的5个挑战;其次从战术对抗、策略对抗和混合对抗3个角度对当前在线对抗规划方法进行了全面的综述分析;最后从对手及玩家建模、人机协同在线临机规划、基于学习的规划方法3个方面点明了未来需要研究的重点问题。 展开更多
关键词 即时策略博弈 在线对抗规划 蒙特卡洛树搜索 层次任务网络 对手建模 人机协同
下载PDF
智能博弈对抗方法:博弈论与强化学习综合视角对比分析 被引量:8
12
作者 袁唯淋 罗俊仁 +3 位作者 陆丽娜 陈佳星 张万鹏 陈璟 《计算机科学》 CSCD 北大核心 2022年第8期191-204,共14页
智能博弈对抗是人工智能认知决策领域亟待解决的前沿热点问题。以反事实后悔最小化算法为代表的博弈论方法和以虚拟自博弈算法为代表的强化学习方法,依托大规模算力支撑,在求解智能博弈策略中脱颖而出,但对两种范式之间的关联缺乏深入... 智能博弈对抗是人工智能认知决策领域亟待解决的前沿热点问题。以反事实后悔最小化算法为代表的博弈论方法和以虚拟自博弈算法为代表的强化学习方法,依托大规模算力支撑,在求解智能博弈策略中脱颖而出,但对两种范式之间的关联缺乏深入发掘。文中针对智能博弈对抗问题,定义智能博弈对抗的内涵与外延,梳理智能博弈对抗的发展历程,总结其中的关键挑战。从博弈论和强化学习两种视角出发,介绍智能博弈对抗模型、算法。多角度对比分析博弈理论和强化学习的优势与局限,归纳总结博弈理论与强化学习统一视角下的智能博弈对抗方法和策略求解框架,旨在为两种范式的结合提供方向,推动智能博弈技术前向发展,为迈向通用人工智能蓄力。 展开更多
关键词 智能博弈对抗 反事实后悔值最小化 虚拟自博弈 纳什均衡 强化学习
下载PDF
智能博弈对抗中的对手建模方法及其应用综述 被引量:3
13
作者 魏婷婷 袁唯淋 +1 位作者 罗俊仁 张万鹏 《计算机工程与应用》 CSCD 北大核心 2022年第9期19-29,共11页
智能博弈对抗一直是人工智能研究的热点。在博弈对抗环境中,通过对对手进行建模,可以推测敌对智能体动作、目标、策略等相关属性,为博弈策略制定提供关键信息。对手建模方法在竞技类游戏和作战仿真推演等领域的应用前景广阔,博弈策略的... 智能博弈对抗一直是人工智能研究的热点。在博弈对抗环境中,通过对对手进行建模,可以推测敌对智能体动作、目标、策略等相关属性,为博弈策略制定提供关键信息。对手建模方法在竞技类游戏和作战仿真推演等领域的应用前景广阔,博弈策略的制定必须以博弈各方的行动策略为前提,因此建立一个准确的对手行为模型对于预测其意图尤其重要。从内涵、方法、应用三个方面,阐述了对手建模的必要性,对现有建模方式进行了分类;对基于强化学习的预测方法、基于心智理论的推理方法和基于贝叶斯的优化方法进行了梳理与总结;以序贯博弈(德州扑克)、即时策略博弈(星际争霸)和元博弈为典型应用场景,分析了智能博弈对抗过程中的对手建模的作用;从有限理性、策略欺骗性和可解释性三个方面进行了对手建模技术发展的展望。 展开更多
关键词 对手建模 不完美信息 行为预测 深度强化学习 递归推理 元博弈
下载PDF
面向多最优解组合优化问题的决策求解算法 被引量:3
14
作者 胡振震 袁唯淋 +2 位作者 罗俊仁 邹明我 陈璟 《国防科技大学学报》 EI CAS CSCD 北大核心 2022年第3期31-40,共10页
针对具有固定物品总和、多最优解特征的组合优化问题,以固定总和实数子集问题和购买鸡翅问题为例,给出了这类多最优解组合优化问题的形式化表示。在分析枚举等经典算法基础上,提出了基于整数状态表示和实数状态表示的0-1决策递归搜索多... 针对具有固定物品总和、多最优解特征的组合优化问题,以固定总和实数子集问题和购买鸡翅问题为例,给出了这类多最优解组合优化问题的形式化表示。在分析枚举等经典算法基础上,提出了基于整数状态表示和实数状态表示的0-1决策递归搜索多最优解动态规划算法。针对该算法在最优解数量较大时,时间复杂度趋向O(m^(n))的问题,提出了基于相同决策路径合并和基于0-x决策的两种改进算法。实验中两种改进算法的计算时间基本符合与O(nb+nm)的正比关系,表明对于这类多最优解组合优化问题具有良好的求解性能。 展开更多
关键词 组合优化 多最优解 动态规划 固定总和实数子集问题
下载PDF
计算机扑克智能博弈研究综述 被引量:3
15
作者 袁唯淋 廖志勇 +4 位作者 高巍 魏婷婷 罗俊仁 张万鹏 陈璟 《网络与信息安全学报》 2021年第5期57-76,共20页
计算机博弈是人工智能领域的“果蝇”,备受人工智能领域研究者的关注,已然成为研究认知智能的有利平台。扑克类博弈对抗问题可建模成边界确定、规则固定的不完美信息动态博弈,计算机扑克AI需要具备不完全信息动态决策、对手误导欺诈行... 计算机博弈是人工智能领域的“果蝇”,备受人工智能领域研究者的关注,已然成为研究认知智能的有利平台。扑克类博弈对抗问题可建模成边界确定、规则固定的不完美信息动态博弈,计算机扑克AI需要具备不完全信息动态决策、对手误导欺诈行为识别以及多回合筹码和风险管理等能力。首先梳理了以德州扑克为代表的计算机扑克智能博弈的发展历程,其次针对计算机扑克智能博弈典型模型算法、关键技术以及存在的主要问题进行了综述分析,最后探讨了计算机扑克智能博弈的未来发展趋势和应用前景。 展开更多
关键词 计算机扑克 认知智能 不完美信息博弈 德州扑克 虚拟遗憾最小化
下载PDF
面向对手建模的意图识别方法综述 被引量:4
16
作者 高巍 罗俊仁 +1 位作者 袁唯淋 张万鹏 《网络与信息安全学报》 2021年第4期86-100,共15页
首先介绍了对手建模的几种不同的类型,引出行为建模中的意图识别问题;随后针对意图识别的过程、分类、主要研究方法、研究展望以及实际应用进行了归纳分析,总结并讨论了相关领域取得的最新研究成果;最后指出意图识别目前存在的不足以及... 首先介绍了对手建模的几种不同的类型,引出行为建模中的意图识别问题;随后针对意图识别的过程、分类、主要研究方法、研究展望以及实际应用进行了归纳分析,总结并讨论了相关领域取得的最新研究成果;最后指出意图识别目前存在的不足以及未来的发展方向。 展开更多
关键词 对手建模 意图识别 目标识别 计划识别 目标识别设计 计划识别设计
下载PDF
计算机博弈中序贯不完美信息博弈求解研究进展
17
作者 罗俊仁 张万鹏 +2 位作者 苏炯铭 魏婷婷 陈璟 《控制与决策》 EI CSCD 北大核心 2023年第10期2721-2748,共28页
计算机博弈是人工智能的果蝇和通用测试基准.近年来,序贯不完美信息博弈求解一直是计算机博弈研究领域的前沿课题.围绕计算机博弈中不完美信息博弈求解问题展开综述分析.首先,梳理计算机博弈领域标志性突破的里程碑事件,简要介绍4类新... 计算机博弈是人工智能的果蝇和通用测试基准.近年来,序贯不完美信息博弈求解一直是计算机博弈研究领域的前沿课题.围绕计算机博弈中不完美信息博弈求解问题展开综述分析.首先,梳理计算机博弈领域标志性突破的里程碑事件,简要介绍4类新评估基准,归纳3种研究范式,提出序贯不完美信息博弈求解研究框架;然后,着重对序贯不完美信息博弈的博弈模型和解概念进行调研,从博弈构建、子博弈和元博弈、解概念以及评估3方面进行简要介绍;接着,围绕离线策略求解,系统梳理算法博弈论、优化理论和博弈学习3大类方法,围绕在线策略求解,系统梳理对手近似式学习、对手判别式适变和对手生成式搜索3大类方法;最后,从环境、智能体(对手)和策略求解3个角度分析面临的挑战,从博弈动力学和策略空间理论、多模态对抗博弈和序贯建模、通用策略学习和离线预训练、对手建模(剥削)和反剥削、临机组队和零样本协调5方面展望未来研究前沿课题.对于当前不完美信息博弈求解问题进行全面概述,期望能够为人工智能和博弈论领域相关研究带来启发. 展开更多
关键词 计算机博弈 不完美信息博弈 扩展式博弈 反事实后悔最小化 在线凸优化 无悔学习 对手建模
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部