期刊文献+
共找到50篇文章
< 1 2 3 >
每页显示 20 50 100
一种非遗藏族久棋项目计算机博弈智能体的评估方法 被引量:4
1
作者 张小川 刘溜 +1 位作者 陈龙 涂飞 《重庆理工大学学报(自然科学)》 CAS 北大核心 2021年第12期119-126,共8页
提出计算机博弈五大构成要素并基于分层递进思想设计了博弈智能体的分层结构,以久棋为案例,构建了久棋博弈智能体的知识库,重点提出了规则库、开局库的构造方法。针对藏族久棋规则的特殊性,面向久棋特有的3个阶段,基于量化思想,建立了... 提出计算机博弈五大构成要素并基于分层递进思想设计了博弈智能体的分层结构,以久棋为案例,构建了久棋博弈智能体的知识库,重点提出了规则库、开局库的构造方法。针对藏族久棋规则的特殊性,面向久棋特有的3个阶段,基于量化思想,建立了分段评估体系。最后,以此方法开发久棋博弈程序,参加了全国计算机博弈大赛并获得好成绩,验证了方法的可行性和有效性。 展开更多
关键词 藏族久棋 知识库 博弈智能 棋型匹配 分段评估方法
下载PDF
一种智能博弈象棋机器人系统设计与实现
2
作者 林建华 林二妹 《机电工程技术》 2024年第7期68-73,共6页
随着人工智能技术的迅速发展,智能博弈机器人已成为人工智能领域研究的热点。研究并提出了一种智能博弈象棋机器人系统。与传统工业机器人不同,该系统以三菱Q系PLC为控制核心,自制搭建设计象棋机器人平台结构,并整合三菱触摸屏人机交互... 随着人工智能技术的迅速发展,智能博弈机器人已成为人工智能领域研究的热点。研究并提出了一种智能博弈象棋机器人系统。与传统工业机器人不同,该系统以三菱Q系PLC为控制核心,自制搭建设计象棋机器人平台结构,并整合三菱触摸屏人机交互系统、伺服运动控制、步进控制、上位机系统、气动控制和通信等模块。通过PLC程序设计来实现虚拟象棋棋盘矩阵生成、走棋规则约束、行棋功能控制。触摸屏实现人机交互,各种模式下棋盘界面显示和各项功能操作。上位机则负责棋子图像识别处理以及中国象棋博弈算法的实现,从而完成象棋人机对弈的全过程,且性能稳定,定位精准,动作自如。所提设计对其他娱乐性的智能游戏机器人领域具有一定的实用价值和研究意义。 展开更多
关键词 PLC 智能博弈 博弈机器人 人工智能 搜索算法
下载PDF
结合先验知识的多智能体博弈对抗研究
3
作者 袁婷帅 冯宇 李永强 《高技术通讯》 CAS 北大核心 2024年第3期256-264,共9页
无实时奖励的复杂对抗环境是目前深度强化学习(DRL)领域的研究热点,面对此类环境,纯粹使用深度强化学习算法会导致智能体训练无法快速收敛以及对抗效果不佳等问题。基于此,本文提出了一种基于先验知识与深度强化学习相结合的智能博弈流... 无实时奖励的复杂对抗环境是目前深度强化学习(DRL)领域的研究热点,面对此类环境,纯粹使用深度强化学习算法会导致智能体训练无法快速收敛以及对抗效果不佳等问题。基于此,本文提出了一种基于先验知识与深度强化学习相结合的智能博弈流程框架,设计了数据处理、增强机制以及动作决策3个模块,通过威胁评估、任务调度和损失比率3种增强机制来提升智能体在复杂对抗环境下的收敛速度和对抗效果。在数据堡垒(DC)平台上进行仿真,实验结果验证了本文所提出的智能博弈流程框架训练的智能体相较于单纯基于深度强化学习的智能体拥有更快的收敛速度以及更高的胜率。 展开更多
关键词 智能博弈 先验知识 深度强化学习(DRL) 威胁评估 任务调度
下载PDF
基于分层强化学习的多智能体博弈策略生成方法
4
作者 畅鑫 李艳斌 刘东辉 《无线电工程》 2024年第6期1361-1367,共7页
典型基于深度强化学习的多智能体对抗策略生成方法采用“分总”框架,各智能体基于部分可观测信息生成策略并进行决策,缺乏从整体角度生成对抗策略的能力,大大限制了决策能力。为了解决该问题,基于分层强化学习提出改进的多智能体博弈策... 典型基于深度强化学习的多智能体对抗策略生成方法采用“分总”框架,各智能体基于部分可观测信息生成策略并进行决策,缺乏从整体角度生成对抗策略的能力,大大限制了决策能力。为了解决该问题,基于分层强化学习提出改进的多智能体博弈策略生成方法。基于分层强化学习构建观测信息到整体价值的决策映射,以最大化整体价值作为目标构建优化问题,并推导了策略优化过程,为后续框架结构和方法实现的设计提供了理论依据;基于决策映射与优化问题构建,采用神经网络设计了模型框架,详细阐述了顶层策略控制模型和个体策略执行模型;基于策略优化方法,给出详细训练流程和算法流程;采用星际争霸多智能体对抗(StarCraft Multi-Agent Challenge,SMAC)环境,与典型多智能体方法进行性能对比。实验结果表明,该方法能够有效生成对抗策略,控制异构多智能体战胜预设对手策略,相比典型多智能体强化学习方法性能提升明显。 展开更多
关键词 分层强化学习 智能博弈 深度神经网络
下载PDF
面向体系对抗的智能博弈框架及关键技术
5
作者 胡志强 朱丹 +2 位作者 冯田田 姜松 刘永普 《国防科技》 2024年第5期92-100,共9页
在体系对抗背景下,围绕战争中的智能博弈问题,首先分析战场态势认知与理解的复杂性,进而分析智能博弈决策问题的关键—“应变”与“设局”。在此基础上,构建面向体系对抗的智能博弈模型框架,然后介绍实现该模型框架的3项特色关键技术:... 在体系对抗背景下,围绕战争中的智能博弈问题,首先分析战场态势认知与理解的复杂性,进而分析智能博弈决策问题的关键—“应变”与“设局”。在此基础上,构建面向体系对抗的智能博弈模型框架,然后介绍实现该模型框架的3项特色关键技术:大数据“智能算法高架”技术、平行仿真推演技术、试探行动策略与Bayes估计技术。最后,讨论智能博弈模型框架的应用问题及发展方向。 展开更多
关键词 体系对抗 态势认知 智能博弈 决策分析 关键技术
下载PDF
量子智能博弈的概念架构、实验进展及应用展望
6
作者 刘军 《国防科技》 2024年第4期12-21,共10页
在对量子智能博弈优势进行分析的基础上,尝试初步搭建其概念架构,梳理研究团队的实验进展,并对量子智能博弈在战略、战役及战术层面的可能应用进行展望。量子智能博弈是量子科学技术、人工智能与博弈论相互交叉融合的前沿领域。相较于... 在对量子智能博弈优势进行分析的基础上,尝试初步搭建其概念架构,梳理研究团队的实验进展,并对量子智能博弈在战略、战役及战术层面的可能应用进行展望。量子智能博弈是量子科学技术、人工智能与博弈论相互交叉融合的前沿领域。相较于经典智能博弈,量子智能博弈在算力、算法、数据及博弈框架方面存在优势。可通过对概念内涵、模式划分及实现路径等方面进行深入剖析,构建量子智能博弈的基本框架。随着量子科学技术的加速推进,量子智能博弈将成为获取对抗优势的重要手段。 展开更多
关键词 量子智能博弈 概念架构 技术路径 计算实验 应用设想
下载PDF
面向博弈对抗的多智能体强化学习建模与迁移技术
7
作者 李渊 刘运韬 +1 位作者 徐新海 万珂嘉 《指挥与控制学报》 CSCD 北大核心 2024年第2期226-231,共6页
多智能体博弈对抗问题涉及智能体之间的协作配合,传统基于博弈论等方法的解决方案并不适用于复杂场景的博弈对抗问题。基于强化学习的多智能体协同训练机制是近年来的研究热点。针对中国电子科技集团发布的多智能体博弈对抗问题,设计基... 多智能体博弈对抗问题涉及智能体之间的协作配合,传统基于博弈论等方法的解决方案并不适用于复杂场景的博弈对抗问题。基于强化学习的多智能体协同训练机制是近年来的研究热点。针对中国电子科技集团发布的多智能体博弈对抗问题,设计基于值分解的多智能体深度强化学习方法,为每个智能体独立构建网络模型,通过引入混合网络连接各个智能体,训练时以混合网络指导各智能体网络更新,执行时各智能体网络独立运行,实现集中式学习、分散式执行的训练模式。针对同构异构场景,设计一种高效的迁移训练技术,提升多智能体强化学习方法在不同场景下的快速训练效率。对同构和异构博弈对抗问题分别进行测试,实验结果表明基于值分解的多智能体强化学习方法和迁移技术,能够有效提升智能体的协作行为以及训练效率。 展开更多
关键词 智能体对抗博弈 深度强化学习 迁移学习 值分解 混合网络 训练效率
下载PDF
核事故场内多智能体博弈疏散动力学分析
8
作者 戴剑勇 高文卉 +2 位作者 张澳 李佩东 张雨婷 《南华大学学报(自然科学版)》 2024年第5期30-40,共11页
核事故危险性大容易引发群众恐慌,且会对社会秩序和公共安全造成严重威胁,应急疏散对降低人员伤亡具有重要意义,疏散过程中个体之间的相互作用与博弈是群体动态演化的重要机制。本研究旨在模拟核事故场内人员疏散中冲突行人之间的复杂... 核事故危险性大容易引发群众恐慌,且会对社会秩序和公共安全造成严重威胁,应急疏散对降低人员伤亡具有重要意义,疏散过程中个体之间的相互作用与博弈是群体动态演化的重要机制。本研究旨在模拟核事故场内人员疏散中冲突行人之间的复杂互动行为,将空间博弈理论与元胞自动机模型相结合,建立了基于智能体博弈的人员疏散动力学。疏散模型中考虑了具有两类行为的疏散人员,即选择行为和模仿行为。疏散人员分别考虑了三种博弈策略即耐心策略Patient(P)、正常策略Normal(N)、不耐烦策略Inpatient(I),P策略倾向于合作,I策略更倾向于竞争,而N介于两者之间。通过数值研究表明:在紧急情况下,疏散人员更倾向于竞争;摩擦成本和个体行为也会对疏散策略的选择产生影响。 展开更多
关键词 智能博弈 疏散动力学 摩擦成本
下载PDF
博弈智能的研究与应用 被引量:6
9
作者 郝建业 邵坤 +4 位作者 李凯 李栋 毛航宇 胡舒悦 王震 《中国科学:信息科学》 CSCD 北大核心 2023年第10期1892-1923,共32页
博弈智能是一个涵盖博弈论、人工智能等方向的交叉领域,重点研究个体或组织间的交互作用,以及如何通过对博弈关系的定量建模进而实现最优策略的精确求解,最终形成智能化决策和决策知识库.近年来,随着行为数据的海量爆发和博弈形式的多样... 博弈智能是一个涵盖博弈论、人工智能等方向的交叉领域,重点研究个体或组织间的交互作用,以及如何通过对博弈关系的定量建模进而实现最优策略的精确求解,最终形成智能化决策和决策知识库.近年来,随着行为数据的海量爆发和博弈形式的多样化,博弈智能吸引了越来越多学者的研究兴趣,并在现实生活中得到广泛应用.本文围绕博弈智能这一研究领域,分别从3个方面进行了系统的调研、分析和总结.首先,回顾了博弈智能的相关背景,涵盖了单智能体马尔可夫(Markov)决策过程,基于博弈论的多智能体建模技术,以及强化学习、博弈学习等多智能体求解方案.其次,依照智能体之间的博弈关系不同,将博弈分为合作博弈、对抗博弈以及混合博弈这三大类范式,并分别介绍了每种博弈智能范式下的主要研究问题、主流研究方法以及当前典型应用.最后,总结了博弈智能的研究现状,以及亟待解决的主要问题与研究挑战,并展望了学术界和工业界的未来应用前景,为相关研究人员提供参考,进一步推动国家人工智能发展战略. 展开更多
关键词 博弈智能 博弈 人工智能 智能体系统 强化学习 均衡求解
原文传递
雷达智能博弈抗干扰技术综述与展望 被引量:13
10
作者 李康 纠博 +1 位作者 赵宇 刘宏伟 《现代雷达》 CSCD 北大核心 2023年第5期15-26,共12页
随着认知电子战技术的发展,干扰机电磁对抗能力大幅提升,为有效对抗智能化干扰机,雷达需采取智能博弈抗干扰技术。文中围绕雷达智能博弈抗干扰技术发展现状,从相关理论基础、干扰感知、智能抗干扰策略学习方法、雷达/干扰博弈抗干扰方... 随着认知电子战技术的发展,干扰机电磁对抗能力大幅提升,为有效对抗智能化干扰机,雷达需采取智能博弈抗干扰技术。文中围绕雷达智能博弈抗干扰技术发展现状,从相关理论基础、干扰感知、智能抗干扰策略学习方法、雷达/干扰博弈抗干扰方法梳理相关技术原理和代表性工作,并进一步分析了该领域的发展趋势,为后续理论研究提供必要参考。 展开更多
关键词 电磁对抗 智能博弈抗干扰技术 干扰感知 雷达抗干扰决策 认知电子战
下载PDF
智能博弈视阈下电信网络诈骗犯罪的打击治理体系创新 被引量:9
11
作者 李丹 《武汉公安干部学院学报》 2023年第1期73-76,共4页
当前,电信网络诈骗犯罪案件高位运转,呈现出黑灰产业延伸化、诈骗类型迭代化、洗钱方式虚拟化等变异态势,给侦查办案和打击治理工作带来一系列困难和挑战,诈骗与反诈骗的对抗博弈全面升级。针对当前打击治理中出现的博弈困境及产生根源... 当前,电信网络诈骗犯罪案件高位运转,呈现出黑灰产业延伸化、诈骗类型迭代化、洗钱方式虚拟化等变异态势,给侦查办案和打击治理工作带来一系列困难和挑战,诈骗与反诈骗的对抗博弈全面升级。针对当前打击治理中出现的博弈困境及产生根源,应创新预警打击、协同共治、法律保障、宣传防范等博弈路径和治理体系。 展开更多
关键词 电信网络诈骗 智能博弈 电子取证 智慧治理 法律规制
下载PDF
面向多智能体博弈的并行蒙特卡洛树搜索算法研究 被引量:3
12
作者 管延霞 刘逊韵 +2 位作者 刘运韬 谢旻 徐新海 《计算机工程与科学》 CSCD 北大核心 2022年第12期2128-2133,共6页
蒙特卡洛树搜索算法是一种常用的强化学习算法,博弈过程中动态空间的指数级增长是制约该算法学习效率的因素。基于并行方法对蒙特卡洛树搜索算法进行优化,提出基于胜率估值传递的并行蒙特卡洛树搜索算法。改进后的并行博弈搜索策略框架... 蒙特卡洛树搜索算法是一种常用的强化学习算法,博弈过程中动态空间的指数级增长是制约该算法学习效率的因素。基于并行方法对蒙特卡洛树搜索算法进行优化,提出基于胜率估值传递的并行蒙特卡洛树搜索算法。改进后的并行博弈搜索策略框架包含一个主进程和多个子进程,其中子进程用于探索,主进程根据子进程传递的胜率估值数据进行决策。结合多智能体博弈平台Pommerman进行实验验证,与传统的蒙特卡罗树搜索算法相比,并行蒙特卡罗树搜索算法有效提高了资源利用率、博弈胜率及决策效率。 展开更多
关键词 智能博弈 Pommerman 多进程 并行蒙特卡洛树搜索
下载PDF
智能博弈综述:游戏AI对作战推演的启示 被引量:16
13
作者 孙宇祥 彭益辉 +3 位作者 李斌 周佳炜 张鑫磊 周献中 《智能科学与技术学报》 2022年第2期157-173,共17页
智能博弈领域已逐渐成为当前AI研究的热点之一,游戏AI领域、智能兵棋领域都在近年取得了一系列的研究突破。但是,游戏AI如何应用到实际的智能作战推演依然面临巨大的困难。综合分析智能博弈领域的国内外整体研究进展,详细剖析智能作战... 智能博弈领域已逐渐成为当前AI研究的热点之一,游戏AI领域、智能兵棋领域都在近年取得了一系列的研究突破。但是,游戏AI如何应用到实际的智能作战推演依然面临巨大的困难。综合分析智能博弈领域的国内外整体研究进展,详细剖析智能作战推演的主要属性需求,并结合当前最新的强化学习发展概况进行阐述。从智能博弈领域主流研究技术、相关智能决策技术、作战推演技术难点3个维度综合分析游戏AI发展为智能作战推演的可行性,最后给出未来智能作战推演的发展建议。以期为智能博弈领域的研究人员介绍一个比较清晰的发展现状并提供有价值的研究思路。 展开更多
关键词 智能博弈 游戏AI 智能作战推演 智能兵棋 深度强化学习
下载PDF
基于对手动作预测的智能博弈对抗算法 被引量:1
14
作者 韩润海 陈浩 +1 位作者 刘权 黄健 《计算机工程与应用》 CSCD 北大核心 2023年第7期190-197,共8页
智能博弈对抗场景中,多智能体强化学习算法存在“非平稳性”问题,智能体的策略不仅取决于环境,还受到环境中对手(其他智能体)的影响。根据对手与环境的交互信息,预测其策略和意图,并以此调整智能体自身策略是缓解上述问题的有效方式。... 智能博弈对抗场景中,多智能体强化学习算法存在“非平稳性”问题,智能体的策略不仅取决于环境,还受到环境中对手(其他智能体)的影响。根据对手与环境的交互信息,预测其策略和意图,并以此调整智能体自身策略是缓解上述问题的有效方式。提出一种基于对手动作预测的智能博弈对抗算法,对环境中的对手进行隐式建模。该算法通过监督学习获得对手的策略特征,并将其与智能体的强化学习模型融合,缓解对手对学习稳定性的影响。在1v1足球环境中的仿真实验表明,提出的算法能够有效预测对手的动作,加快学习收敛速度,提升智能体的对抗水平。 展开更多
关键词 对手动作预测 竞争双深度Q网络(D3QN) 智能博弈对抗 深度强化学习
下载PDF
对抗环境下的智能兵棋系统设计及其关键技术 被引量:1
15
作者 孙宇祥 李原百 +2 位作者 周胜 赵俊杰 周献中 《火力与指挥控制》 CSCD 北大核心 2024年第2期33-41,共9页
智能博弈对抗领域已成为当前研究的热门领域之一。侧重在兵棋推演系统的体系构建和模块设计,分析了兵棋推演系统的建模要素,包括兵棋要素、兵棋规则及智能接口设计,构建了智能兵棋推演系统的整体架构。通过A3C强化学习智能算法对系统设... 智能博弈对抗领域已成为当前研究的热门领域之一。侧重在兵棋推演系统的体系构建和模块设计,分析了兵棋推演系统的建模要素,包括兵棋要素、兵棋规则及智能接口设计,构建了智能兵棋推演系统的整体架构。通过A3C强化学习智能算法对系统设计进行可行性验证。其中,改进了强化学习训练过程的奖励设置,明确智能兵棋环境的状态输入、算法驱动过程及动作输出过程,通过自主实现的智能兵棋推演系统,验证了所提的系统理论与工作。该工作为基于强化学习的智能博弈系统的设计与实现提供了可行路径,并为以后基于强化学习的智能博弈对抗研究提供了基础平台。 展开更多
关键词 智能博弈 智能兵棋 强化学习 系统设计
下载PDF
智能博弈对抗方法:博弈论与强化学习综合视角对比分析 被引量:13
16
作者 袁唯淋 罗俊仁 +3 位作者 陆丽娜 陈佳星 张万鹏 陈璟 《计算机科学》 CSCD 北大核心 2022年第8期191-204,共14页
智能博弈对抗是人工智能认知决策领域亟待解决的前沿热点问题。以反事实后悔最小化算法为代表的博弈论方法和以虚拟自博弈算法为代表的强化学习方法,依托大规模算力支撑,在求解智能博弈策略中脱颖而出,但对两种范式之间的关联缺乏深入... 智能博弈对抗是人工智能认知决策领域亟待解决的前沿热点问题。以反事实后悔最小化算法为代表的博弈论方法和以虚拟自博弈算法为代表的强化学习方法,依托大规模算力支撑,在求解智能博弈策略中脱颖而出,但对两种范式之间的关联缺乏深入发掘。文中针对智能博弈对抗问题,定义智能博弈对抗的内涵与外延,梳理智能博弈对抗的发展历程,总结其中的关键挑战。从博弈论和强化学习两种视角出发,介绍智能博弈对抗模型、算法。多角度对比分析博弈理论和强化学习的优势与局限,归纳总结博弈理论与强化学习统一视角下的智能博弈对抗方法和策略求解框架,旨在为两种范式的结合提供方向,推动智能博弈技术前向发展,为迈向通用人工智能蓄力。 展开更多
关键词 智能博弈对抗 反事实后悔值最小化 虚拟自博弈 纳什均衡 强化学习
下载PDF
智能博弈技术军事应用展望 被引量:4
17
作者 马悦 吴琳 郭圣明 《指挥与控制学报》 CSCD 2023年第2期135-145,共11页
为利用智能技术解决现代战争中的意图判断、威胁评估与指挥控制,提高军事决策水平,将军事问题转化为博弈问题,综合利用博弈论和人工智能(artificial intelligence,AI)技术寻求策略均衡解.通过深入剖析游戏智能博弈的最新进展,梳理美军... 为利用智能技术解决现代战争中的意图判断、威胁评估与指挥控制,提高军事决策水平,将军事问题转化为博弈问题,综合利用博弈论和人工智能(artificial intelligence,AI)技术寻求策略均衡解.通过深入剖析游戏智能博弈的最新进展,梳理美军人工智能军事应用项目研究情况,总结常用智能方法的优缺点,分析军事博弈面临的挑战及应对措施,为突破复杂战场环境下高动态不确定的军事智能决策问题提供借鉴. 展开更多
关键词 军事决策 博弈 智能博弈 人工智能 机器学习
下载PDF
基于改进TICC聚类算法的智能博弈宏观策略生成技术
18
作者 周盼 程健庆 初阳 《舰船电子工程》 2023年第2期69-74,共6页
随着军事智能技术的发展,采用智能博弈技术构建决策智能体已成为热点研究方向。当前,以深度强化学习算法为主构建的决策智能体输出主要是基于实时态势的微观决策指令,而作战决策人员需要的往往是未来一段时间内的宏观策略。针对智能博... 随着军事智能技术的发展,采用智能博弈技术构建决策智能体已成为热点研究方向。当前,以深度强化学习算法为主构建的决策智能体输出主要是基于实时态势的微观决策指令,而作战决策人员需要的往往是未来一段时间内的宏观策略。针对智能博弈中微观决策指令周期短,战场态势数据规模大、维度高,导致难以对智能博弈中宏观策略进行提取的问题,提出了一种基于时间序列的改进TICC分割聚类算法,对智能博弈形成的数据进行分割聚类,生成宏观策略,为作战方案的制作提供支撑。 展开更多
关键词 聚类分析 智能博弈 宏观策略
下载PDF
基于深度强化学习的智能博弈对抗关键技术 被引量:45
19
作者 曹雷 《指挥信息系统与技术》 2019年第5期1-7,共7页
阐述了军事智能博弈对抗的发展需求和概念内涵,分析了基于强化学习的博弈对抗特点,并针对智能博弈对抗过程存在的问题,提出了基于深度逆向强化学习、多智能体强化学习、分层强化学习及元深度强化学习等手段的应用模式,展望了智能博弈对... 阐述了军事智能博弈对抗的发展需求和概念内涵,分析了基于强化学习的博弈对抗特点,并针对智能博弈对抗过程存在的问题,提出了基于深度逆向强化学习、多智能体强化学习、分层强化学习及元深度强化学习等手段的应用模式,展望了智能博弈对抗技术发展方向,以期为军事智能博弈对抗技术研究提供参考. 展开更多
关键词 深度强化学习 逆向强化学习 智能体强化学习 分层强化学习 元强化学习 智能博弈对抗
下载PDF
基于元权值学习方法的智能博弈对抗研究 被引量:2
20
作者 徐志雄 王锋 《军事运筹与评估》 2022年第3期31-36,共6页
针对基于传统强化学习方法的策略模型在解决博弈对抗问题时,存在初始策略模型优化的冷启动问题,提出了基于历史行动轨迹梯度的元深度强化学习方法,通过研究不同历史轨迹梯度的特点和形式,根据指挥员对不同历史轨迹数据的评价,确定网络... 针对基于传统强化学习方法的策略模型在解决博弈对抗问题时,存在初始策略模型优化的冷启动问题,提出了基于历史行动轨迹梯度的元深度强化学习方法,通过研究不同历史轨迹梯度的特点和形式,根据指挥员对不同历史轨迹数据的评价,确定网络参数梯度更新方向,在此基础上学习元知识,为初始策略模型提供一种高效的网络初始化方法。实验结果表明,该方法缩短了策略模型训练时长,提升了决策模型性能。 展开更多
关键词 智能化指挥控制 深度强化学习 元学习 智能博弈对抗策略
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部