期刊文献+
共找到20篇文章
< 1 >
每页显示 20 50 100
智能空战深度强化决策方法现状与展望
1
作者 张烨 涂远刚 +2 位作者 张良 崔颢 王靖宇 《航空兵器》 CSCD 北大核心 2024年第3期21-31,共11页
本文聚焦于现代智能空战决策技术的发展需求,分析了智能空战场景的要素与特点,介绍了现有智能空战决策理论的研究现状,包括基于博弈理论的决策方法、先验数据驱动的决策方法、基于自主学习的决策方法,着重梳理了基于价值和基于策略的深... 本文聚焦于现代智能空战决策技术的发展需求,分析了智能空战场景的要素与特点,介绍了现有智能空战决策理论的研究现状,包括基于博弈理论的决策方法、先验数据驱动的决策方法、基于自主学习的决策方法,着重梳理了基于价值和基于策略的深度强化学习智能决策方法。最后,面向未来智能空战面临的各种挑战以及传统深度强化学习的局限性,展望了深度强化学习技术在空战领域的发展方向:面向集群作战的多体智能决策技术、面向广域时空的高效智能决策技术、面向复杂场景的泛化智能决策技术。 展开更多
关键词 空战决策 人工智能 强化学习 智能博弈 集群作战 深度学习
下载PDF
基于博弈论与强化学习的多智能体路径规划算法
2
作者 熊文博 郭磊 焦彤宇 《深圳大学学报(理工版)》 CAS CSCD 北大核心 2024年第3期274-282,共9页
针对平面上多个智能体构成的路径规划求解算法普遍存在的速度慢效率低等问题进行研究,将多智能体路径规划问题归结为非零和随机博弈,使用多智能体强化学习算法赢或快速学习-策略爬山(win or learn fast-policy hill-climbing,WoLF-PHC)... 针对平面上多个智能体构成的路径规划求解算法普遍存在的速度慢效率低等问题进行研究,将多智能体路径规划问题归结为非零和随机博弈,使用多智能体强化学习算法赢或快速学习-策略爬山(win or learn fast-policy hill-climbing,WoLF-PHC)得到纳什均衡策略,为各智能体做出无冲突的最优路径决策,提出能够快速自适应的WoLF-PHC(fast adaptive WoLF-PHC,FA-WoLF-PHC)算法,通过构建目标函数,使用梯度下降对学习率进行自适应更新.在猜硬币和自定义收益矩阵2个博弈场景中使用FA-WoLF-PHC,并与策略爬山(policy hill-climbing,PHC)算法和Wolf-PHC算法进行比较.结果表明,FA-WoLF-PHC算法的学习速度较WoLF-PHC算法有所提升,并有效减小了WoLF-PHC算法和PHC算法在学习过程中出现的振荡现象.在多智能体路径规划问题中,FA-WoLF-PHC算法的学习速度比WoLF-PHC算法提高了16.01%.将路径规划问题的环境栅格地图扩大为6×6,智能体数量增加为3个时,FA-WoLF-PHC、WoLF-PSP和多头绒泡菌-人工势场Sarsa(physarum polycephalum-artificial potential state-action-reward-state-action,PP-AP Sarsa)算法在10次实验中学习到最终策略需要的平均时间分别为16.30、20.59和17.72 s.在多智能体路径规划问题中,FA-WoLF-PHC算法能够得到各智能体的纳什均衡策略,学习速度较WoLF-PSP和PP-AP Sarsa算法有显著提高.FA-WoLF-PHC算法在常见的博弈场景中能够快速获得纳什策略,在多智能体路径规划问题中可为多个智能体生成无冲突的最优路径,并且在学习速度等方面较其他算法有显著提高. 展开更多
关键词 人工智能 博弈论 动态规划 纳什均衡策略 强化学习 多智能体路径规划
下载PDF
结合行为树与Q-learning优化UT2004中agent行为决策 被引量:6
3
作者 刘晓伟 高春鸣 《计算机工程与应用》 CSCD 北大核心 2016年第3期113-118,共6页
针对FPS游戏UT2004中的NPC(Non-Player-Character,即非玩家角色)的行为决策不够灵活多变,不够智能等问题,结合行为树与Q-learning强化学习算法,提出了一种预处理与在线学习结合的方式优化NPC行为决策的方法。通过在行为树上的强化学习,... 针对FPS游戏UT2004中的NPC(Non-Player-Character,即非玩家角色)的行为决策不够灵活多变,不够智能等问题,结合行为树与Q-learning强化学习算法,提出了一种预处理与在线学习结合的方式优化NPC行为决策的方法。通过在行为树上的强化学习,NPC行为决策更为灵活、智能,即human-like。实验结果表明了该方法的有效性与可行性。 展开更多
关键词 行为决策 游戏人工智能(AI) Q学习 强化学习 行为树
下载PDF
多智能体博弈、学习与控制 被引量:8
4
作者 王龙 黄锋 《自动化学报》 EI CAS CSCD 北大核心 2023年第3期580-613,共34页
近年来,人工智能(Artificial intelligence,AI)技术在棋牌游戏、计算机视觉、自然语言处理和蛋白质结构解析与预测等研究领域取得了众多突破性进展,传统学科之间的固有壁垒正在被逐步打破,多学科深度交叉融合的态势变得越发明显.作为现... 近年来,人工智能(Artificial intelligence,AI)技术在棋牌游戏、计算机视觉、自然语言处理和蛋白质结构解析与预测等研究领域取得了众多突破性进展,传统学科之间的固有壁垒正在被逐步打破,多学科深度交叉融合的态势变得越发明显.作为现代智能科学的三个重要组成部分,博弈论、多智能体学习与控制论自诞生之初就逐渐展现出一种“你中有我,我中有你”的关联关系.特别地,近年来在AI技术的促进作用下,这三者间的交叉研究成果正呈现出一种井喷式增长的态势.为及时反映这一学术动态和趋势,本文对这三者的异同、联系以及最新的研究进展进行了系统梳理.首先,介绍了作为纽带连接这三者的四种基本博弈形式,进而论述了对应于这四种基本博弈形式的多智能体学习方法;然后,按照不同的专题,梳理了这三者交叉研究的最新进展;最后,对这一新兴交叉研究领域进行了总结与展望. 展开更多
关键词 博弈论 多智能体学习 控制论 强化学习 人工智能
下载PDF
Context-awareness approach in game style application
5
作者 YU Xue-li ZHOU Chang-neng +1 位作者 BAI Ling-fen LI San-yan 《通讯和计算机(中英文版)》 2008年第12期61-65,共5页
关键词 人工智能 游戏式训练 训练方式 传感器
下载PDF
社会化人工智能的适应性 被引量:1
6
作者 李开阳 宋保林 《科技管理研究》 北大核心 2023年第8期237-242,共6页
当前学界对社会化人工智能的探讨较少关涉人工智能所面对的社会化是一个怎样的议题,并缺乏明确的判定标准。随着人工智能的技术进步,人工智能越来越深地嵌入到人、机、环境三重交互的社会化环境中,实现人工智能的社会化是人工智能发展... 当前学界对社会化人工智能的探讨较少关涉人工智能所面对的社会化是一个怎样的议题,并缺乏明确的判定标准。随着人工智能的技术进步,人工智能越来越深地嵌入到人、机、环境三重交互的社会化环境中,实现人工智能的社会化是人工智能发展的核心诉求之一,即从求解结构化的简单命题过渡到动态适应非结构化的不完全信息动态博弈命题。具身人工智能凭借身体优势,是实现人工智能从实验室到社会化的可能路径之一,其多功能性和具身交互能力为应对社会化不完全信息动态博弈提供了在环境中摄取多样信息的能力,以及解决复杂问题的多样性方案。通过举例深度进化强化学习,证明具身性为人工智能提供了与现实交互和获取多样信息的通道;社会化算法和多功能方案则证明,具身人工智能的发展应当增强自身的多模态信息处理能力、解决环境中的多模态任务,实现其在社会化环境中适应性的飞速发展。因此应当大力发展如传感器、云计算、材料科学、运行算法等具身人工智能相关产业,同时更重要的是,应形成具身人工智能构造理论。 展开更多
关键词 人工智能 具身性 社会化环境 不完全信息动态博弈 深度进化强化学习
下载PDF
基于深度强化学习的人机智能对抗综述
7
作者 刘玮 张永亮 程旭 《指挥信息系统与技术》 2023年第2期28-37,共10页
人机对抗是人工智能的热门领域,同时也为探索机器智能的内在原理与发展提供了途径。基于深度强化学习,讨论了人机智能对抗技术,并分析了人机对抗的内涵与机理。首先,简化了感知-判断-决策-行动(OODA)模型,总结了适用于深度强化学习的人... 人机对抗是人工智能的热门领域,同时也为探索机器智能的内在原理与发展提供了途径。基于深度强化学习,讨论了人机智能对抗技术,并分析了人机对抗的内涵与机理。首先,简化了感知-判断-决策-行动(OODA)模型,总结了适用于深度强化学习的人机对抗框架,并归纳了态势认知、决策与优化以及协同与通信等关键技术;然后,阐述了态势特征提取与神经网络选择、策略制定与策略优化以及多智体训练模型与通信等技术内容;最后,列举了当前人机对抗的应用与挑战,并对人机对抗的未来发展做出了展望。 展开更多
关键词 人工智能 深度强化学习 人机对抗 认知决策
下载PDF
人机对抗智能技术最新进展及军事应用 被引量:5
8
作者 聂凯 曾科军 +1 位作者 孟庆海 魏超 《兵器装备工程学报》 CSCD 北大核心 2021年第6期6-11,26,共7页
人机对抗技术是人工智能研究的前沿内容和热点,能够为指挥作战提供逼真模拟训练系统和辅助决策支持,具有广阔的军事应用前景。在人机对抗机理定义的基础上,梳理了博弈论、蒙特卡洛树搜索、深度强化学习等当前人机对抗的核心智能技术。... 人机对抗技术是人工智能研究的前沿内容和热点,能够为指挥作战提供逼真模拟训练系统和辅助决策支持,具有广阔的军事应用前景。在人机对抗机理定义的基础上,梳理了博弈论、蒙特卡洛树搜索、深度强化学习等当前人机对抗的核心智能技术。将人机对抗智能技术分为完整信息博弈、不完整信息博弈和不完整信息、多智能体博弈等3种,通过列举其代表性游戏阐述最新研究进展。最后指出人机对抗智能技术应用于军事领域面临的挑战,以飞行器攻防红蓝对抗为例阐述了在模拟训练系统、创新战法、态势智能认知和辅助决策等方面可能的军事应用前景。 展开更多
关键词 人机对抗 人工智能 强化学习 深度学习 智能博弈 态势认知
下载PDF
自博弈理论及其在军事中的应用综述 被引量:1
9
作者 张宏伟 潘晓刚 《兵器装备工程学报》 CAS 北大核心 2019年第S02期180-182,共3页
从博弈的定义出发,对自博弈理论进行了界定,并结合计算机围棋和电子竞技游戏,对人工智能中的深度强化学习和神经网络等技术进行了介绍,对自博弈理论在军事领域的应用前景进行了展望。
关键词 自博弈理论 人工智能 深度强化学习 军事应用
下载PDF
深度学习在游戏中的应用 被引量:22
10
作者 郭潇逍 李程 梅俏竹 《自动化学报》 EI CSCD 北大核心 2016年第5期676-684,共9页
综述了近年来发展迅速的深度学习技术及其在游戏(或博弈)中的应用.深度学习通过多层神经网络来构建端对端的从输入到输出的非线性映射,相比传统的机器学习模型有显见的优势.最近,深度学习被成功地用于解决强化学习中的策略评估和策略优... 综述了近年来发展迅速的深度学习技术及其在游戏(或博弈)中的应用.深度学习通过多层神经网络来构建端对端的从输入到输出的非线性映射,相比传统的机器学习模型有显见的优势.最近,深度学习被成功地用于解决强化学习中的策略评估和策略优化的问题,并于多种游戏的人工智能取得了突破性的提高.本文详述了深度学习在常见游戏中的应用. 展开更多
关键词 深度学习 博弈 深度强化学习 围棋 人工智能
下载PDF
有限信息环境下基于学习自动机的发电商竞价策略 被引量:9
11
作者 贾乾罡 陈思捷 +2 位作者 李亦言 严正 徐澄科 《电力系统自动化》 EI CSCD 北大核心 2021年第6期133-139,共7页
电力市场是典型的不完全竞争市场,发电商可以通过策略性报价以提高自身收益。现有的发电商报价策略研究通常假设发电商能利用充分的市场信息,但这种假设在市场启动初期往往不成立。为解决发电商在有限信息环境下的报价策略问题,文中提... 电力市场是典型的不完全竞争市场,发电商可以通过策略性报价以提高自身收益。现有的发电商报价策略研究通常假设发电商能利用充分的市场信息,但这种假设在市场启动初期往往不成立。为解决发电商在有限信息环境下的报价策略问题,文中提出了一种改进的强化学习自动机算法,该方法对外部信息量要求较低,且计算复杂度小,易于实现。此外,将发电商报价和市场出清的过程建模为重复博弈而非广泛使用的马尔可夫博弈,避免了马尔可夫博弈要求系统状态具有时间相关性这一强假设。最后,算例验证了该算法的有效性。 展开更多
关键词 电力市场 不完全信息 强化学习自动机 重复博弈 人工智能
下载PDF
人工智能与“星际争霸”:多智能体博弈研究新进展 被引量:17
12
作者 张宏达 李德才 何玉庆 《无人系统技术》 2019年第1期5-16,共12页
多智能体博弈游戏具有实时对抗、群体协作、非完全信息博弈、庞大的搜索空间、多复杂任务和时间空间推理等特点,是当前人工智能领域极具挑战的难题。同时,该领域研究成果在社会管理、智能交通、经济、军事等领域有广阔的应用前景。以具... 多智能体博弈游戏具有实时对抗、群体协作、非完全信息博弈、庞大的搜索空间、多复杂任务和时间空间推理等特点,是当前人工智能领域极具挑战的难题。同时,该领域研究成果在社会管理、智能交通、经济、军事等领域有广阔的应用前景。以具有代表性的多智能体博弈游戏"星际争霸"为主要研究对象,通过分析研究难度、总结研究方法、介绍研究环境及数据集与竞赛资源,对近年来该领域人工智能研究成果进行了梳理和总结,并对该领域未来可能的发展方向进行预测,为相关研究工作的开展提供可借鉴参考信息。 展开更多
关键词 多智能体 实时策略 人工智能 对抗博弈 深度强化学习
下载PDF
全局游戏策略中基于经验的学习方法 被引量:1
13
作者 宋骁健 《计算机应用与软件》 CSCD 北大核心 2012年第1期253-256,275,共5页
全局游戏策略GGP(General Game Playing)旨在开发一种没有游戏经验支撑下能够精通各类游戏的人工智能。在原有强化学习算法研究的基础上,提出一种基于经验的简化学习方法,通过对游戏状态的筛选和游戏经验的归纳,从而降低决策对经验数量... 全局游戏策略GGP(General Game Playing)旨在开发一种没有游戏经验支撑下能够精通各类游戏的人工智能。在原有强化学习算法研究的基础上,提出一种基于经验的简化学习方法,通过对游戏状态的筛选和游戏经验的归纳,从而降低决策对经验数量的需求,提高决策效率,并能达到指定胜利、平局或失败的游戏目标。通过在三种不同的游戏规则下与玩家进行游戏比赛实验表明,该学习方法能有效地达到预期结果。 展开更多
关键词 全局游戏策略 人工智能 强化学习
下载PDF
游戏智能中的AI——从多角色博弈到平行博弈 被引量:12
14
作者 沈宇 韩金朋 +1 位作者 李灵犀 王飞跃 《智能科学与技术学报》 2020年第3期205-213,共9页
总结了国内外人工智能技术在游戏领域的研究进展,分析了游戏领域的研究进步对于现实社会的意义。针对强化学习中免模型方法存在的仿真与真实的鸿沟、基于模型的方法缺乏通用性的问题,提出平行博弈的思想和方法,介绍了平行博弈在解决现... 总结了国内外人工智能技术在游戏领域的研究进展,分析了游戏领域的研究进步对于现实社会的意义。针对强化学习中免模型方法存在的仿真与真实的鸿沟、基于模型的方法缺乏通用性的问题,提出平行博弈的思想和方法,介绍了平行博弈在解决现有单角色博弈和多角色博弈问题上的先进之处。认为虚实结合的平行博弈方法将成为迈向通用人工智能的奠基石。 展开更多
关键词 游戏智能 多角色博弈 平行博弈 深度强化学习 人工智能
下载PDF
人工智能在无人战场态势预判与博弈对抗中的应用 被引量:6
15
作者 汤润泽 张承龙 李林林 《现代防御技术》 2020年第5期25-31,共7页
在未来高强度火力对抗的战场环境下,具备无人协同、相互协作、优势互补及效能倍增的军事智能无人作战能力,是新时代军队取得战争胜利的关键所在。首先分析了当前智能无人作战的发展现状,然后对未来技术发展进行了研判,提出了人工智能在... 在未来高强度火力对抗的战场环境下,具备无人协同、相互协作、优势互补及效能倍增的军事智能无人作战能力,是新时代军队取得战争胜利的关键所在。首先分析了当前智能无人作战的发展现状,然后对未来技术发展进行了研判,提出了人工智能在战场态势预判与博弈对抗中的应用,最后为智能无人作战的发展进行了总结和展望。 展开更多
关键词 人工智能 无人作战 态势预判 博弈对抗 深度学习 强化学习
下载PDF
军事智能推演研究综述
16
作者 王丹妮 徐丽 李思照 《计算机与网络》 2022年第9期43-51,共9页
军事智能推演在复杂、大规模、多装备军事推演领域扮演着重要的角色,通过模拟战场环境,不仅能够对已经制定好但还未实行的作战计划进行演练与改进,还能复现已经完成的作战任务,对作战过程进行客观评价和理性总结。从智能推演的发展、军... 军事智能推演在复杂、大规模、多装备军事推演领域扮演着重要的角色,通过模拟战场环境,不仅能够对已经制定好但还未实行的作战计划进行演练与改进,还能复现已经完成的作战任务,对作战过程进行客观评价和理性总结。从智能推演的发展、军事仿真推演系统的成果、军事推演的关键技术及其研究现状,以及推演方案评估等几个方面对当前军事智能推演发展情况进行梳理与展望。 展开更多
关键词 智能推演 仿真推演 人工智能 深度强化学习
下载PDF
基于强化学习的爱因斯坦棋的算法研究
17
作者 向宇涛 朱道易 +1 位作者 王忠桃 董羽 《电脑知识与技术》 2020年第22期179-181,共3页
爱因斯坦棋是我国全国大学生指定计算机博弈比赛项目之一,在本文发表之前,多数队伍使用了搜索树算法来参加比赛,而为了提高算法的表现,多数算法需要加入具体的模板处理。然而,如果需要得到最优表现,则要加入大量模板并尽可能地搜索更深... 爱因斯坦棋是我国全国大学生指定计算机博弈比赛项目之一,在本文发表之前,多数队伍使用了搜索树算法来参加比赛,而为了提高算法的表现,多数算法需要加入具体的模板处理。然而,如果需要得到最优表现,则要加入大量模板并尽可能地搜索更深的博弈树。而使用深度强化学习并结合使用树搜索不仅不需要加入过多的模板处理、搜索深层树节点,还能随着接收不同的算法和样本,智能体可以逐步地改善表现,并进一步提高胜率。因此,本文通过使用了深度强化学习中的DQN算法,并结合了极大极小树搜索算法和随机生成行为法测试了该算法的胜率,最后取得了远优于这两种方法的结果。 展开更多
关键词 强化学习 爱因斯坦棋 人工智能 计算机博弈 算法
下载PDF
博弈智能的研究与应用 被引量:3
18
作者 郝建业 邵坤 +4 位作者 李凯 李栋 毛航宇 胡舒悦 王震 《中国科学:信息科学》 CSCD 北大核心 2023年第10期1892-1923,共32页
博弈智能是一个涵盖博弈论、人工智能等方向的交叉领域,重点研究个体或组织间的交互作用,以及如何通过对博弈关系的定量建模进而实现最优策略的精确求解,最终形成智能化决策和决策知识库.近年来,随着行为数据的海量爆发和博弈形式的多样... 博弈智能是一个涵盖博弈论、人工智能等方向的交叉领域,重点研究个体或组织间的交互作用,以及如何通过对博弈关系的定量建模进而实现最优策略的精确求解,最终形成智能化决策和决策知识库.近年来,随着行为数据的海量爆发和博弈形式的多样化,博弈智能吸引了越来越多学者的研究兴趣,并在现实生活中得到广泛应用.本文围绕博弈智能这一研究领域,分别从3个方面进行了系统的调研、分析和总结.首先,回顾了博弈智能的相关背景,涵盖了单智能体马尔可夫(Markov)决策过程,基于博弈论的多智能体建模技术,以及强化学习、博弈学习等多智能体求解方案.其次,依照智能体之间的博弈关系不同,将博弈分为合作博弈、对抗博弈以及混合博弈这三大类范式,并分别介绍了每种博弈智能范式下的主要研究问题、主流研究方法以及当前典型应用.最后,总结了博弈智能的研究现状,以及亟待解决的主要问题与研究挑战,并展望了学术界和工业界的未来应用前景,为相关研究人员提供参考,进一步推动国家人工智能发展战略. 展开更多
关键词 博弈智能 博弈论 人工智能 多智能体系统 强化学习 均衡求解
原文传递
未来智能空战发展综述 被引量:39
19
作者 孙智孝 杨晟琦 +2 位作者 朴海音 白成超 葛俊 《航空学报》 EI CAS CSCD 北大核心 2021年第8期28-42,共15页
随着装备战斗力生成模式逐渐向机械化、信息化、智能化"三化融合"发展演变,未来航空主战装备的定位、形态及运用将可能发生根本性变革。为应对新时期空战任务所面临的环境高复杂性、博弈强对抗性、响应高实时性、信息不完整... 随着装备战斗力生成模式逐渐向机械化、信息化、智能化"三化融合"发展演变,未来航空主战装备的定位、形态及运用将可能发生根本性变革。为应对新时期空战任务所面临的环境高复杂性、博弈强对抗性、响应高实时性、信息不完整性、边界不确定性等一系列挑战,交叉融合人工智能理论与空战对抗技术,研发智能空战系统,将有望在下一代无人制空装备谱系中构建不对称"智能代差",成为制胜未来空天战场的核心关键。本文完整梳理了智能空战研究的发展脉络,总结了以专家机动逻辑、自动规则生成、规则演进、机器学习等方法为代表的智能空战基础理论。从体系、应用及技术视角全面剖析了智能空战的发展趋势,以智能空战的不确定性、安全性、解释性、迁移性、协同性为切入点阐述了智能空战应用落地的若干问题,以期为未来智能空战技术研究勾勒出一条新的探索路径,为人工智能理论与航空科学技术的跨领域交叉融合提供新的发展思路。 展开更多
关键词 空战 人工智能 演化计算 博弈 强化学习
原文传递
面向文本游戏的深度强化学习模型
20
作者 刘勇 徐雷 张楚晗 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2022年第3期666-674,共9页
为了提高文本游戏中智能体的表现性能,提出了一种基于孪生网络和深度后继表示的深度强化学习模型SADSR。首先,使用自然语言处理技术对文本信息进行处理,得到词的嵌入向量,有效地将文本信息转化为数字向量。然后,利用孪生网络分别对状态... 为了提高文本游戏中智能体的表现性能,提出了一种基于孪生网络和深度后继表示的深度强化学习模型SADSR。首先,使用自然语言处理技术对文本信息进行处理,得到词的嵌入向量,有效地将文本信息转化为数字向量。然后,利用孪生网络分别对状态和动作信息进行特征提取,通过提取到的状态特征向量预测即时奖励,使用状态和动作的联合向量预测后继表示。最后,将后继表示与特定层的权重向量通过交互函数进行计算得到动作价值。实验结果表明:该模型可以有效对价值函数进行拟合,与目前的主流模型相比,SADSR可以将文本游戏中智能体的表现性能提高10%~60%。 展开更多
关键词 人工智能 文本游戏 深度强化学习 孪生网络 深度后继表示
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部