期刊文献+
共找到1,212篇文章
< 1 2 61 >
每页显示 20 50 100
基于分布鲁棒优化的车-站-网日前能量管理与交易 被引量:1
1
作者 葛少云 杜咏梅 +3 位作者 郭玥 崔凯 刘洪 李俊锴 《电力系统自动化》 EI CSCD 北大核心 2024年第5期11-20,共10页
为考虑上级电网电价、光伏出力等多重多层级不确定性对车-站-网互动博弈模型的影响,且充分体现配电网主动管理技术支撑效果,文中提出了一种基于分布鲁棒优化的车-站-网能量管理与交易方法。首先,针对主动配电网内多元主体能量管理与交... 为考虑上级电网电价、光伏出力等多重多层级不确定性对车-站-网互动博弈模型的影响,且充分体现配电网主动管理技术支撑效果,文中提出了一种基于分布鲁棒优化的车-站-网能量管理与交易方法。首先,针对主动配电网内多元主体能量管理与交易问题,建立了配电网运营商、充电站和电动汽车的日前市场互动框架。其次,融合主动网络管理技术和网络约束,在配电网运营商与聚合了电动汽车的多个充电站之间构建了以多主体各自利益最大为目标的双层Wasserstein分布鲁棒互动博弈模型。然后,提出了结合Karush-Kuhn-Tucker条件、对偶原理和大M法的化简方法以解决多层级不确定性造成的求解难题,将双层Wasserstein分布鲁棒模型转化为单层混合整数二阶锥规划模型,并利用商业求解器YALMIP/GUROBI进行了求解。最后,通过算例仿真验证了所提模型和方法的有效性。 展开更多
关键词 分布鲁棒优化 能量管理与交易 主动配电网 互动博弈 多层级不确定性
下载PDF
基于随机博弈与A3C深度强化学习的网络防御策略优选
2
作者 胡浩 赵昌军 +3 位作者 刘璟 宋昱欣 姜迎畅 张玉臣 《指挥与控制学报》 CSCD 北大核心 2024年第1期47-58,共12页
网络资源的有限性和攻防对抗的动态性导致最优防御策略难以选取,将深度强化学习引入攻防随机博弈建模领域,通过构建网络攻防actor策略网络和critic价值网络,结合随机博弈模型构建了网络攻防博弈决策模型总体结构,在此基础上引入异步优... 网络资源的有限性和攻防对抗的动态性导致最优防御策略难以选取,将深度强化学习引入攻防随机博弈建模领域,通过构建网络攻防actor策略网络和critic价值网络,结合随机博弈模型构建了网络攻防博弈决策模型总体结构,在此基础上引入异步优势演员评论家算法(asynchronous advantage actor-critic,A3C)智能体学习框架设计了防御策略选取算法;针对现有方法未考虑攻击方群体间的共谋攻击,引入群智能体性格特征,建立合作系数μ来刻画攻击者之间的合作对攻防策略收益的影响,进而得出对防御策略选取的影响,构建的博弈决策模型更符合攻防实际情况。实验结果表明,该方法的策略求解速度要优于现有方法,同时由于考虑了攻击合作关系,能够用于分析攻击者群体间合作关系对防御者决策的影响,防御策略选取更有针对性,期望防御收益更高。 展开更多
关键词 网络攻防 最优防御决策 随机博弈 多智能体 A3C算法
下载PDF
基于谈判博弈的三峡梯级蓄水期多目标调度
3
作者 李英海 兰回归 +3 位作者 王永强 张海荣 李赟洁 何良哲 《水力发电学报》 CSCD 北大核心 2024年第1期1-10,共10页
汛后蓄水期是三峡梯级防洪向兴利调度转换的重要时间窗口,不合理的蓄水调度将对梯级防洪、发电兴利、生态效益造成不利影响。本文以发电量最大、防洪库容占用比最小以及修正流量偏差最小作为三峡梯级蓄水期调度目标构建优化调度模型,进... 汛后蓄水期是三峡梯级防洪向兴利调度转换的重要时间窗口,不合理的蓄水调度将对梯级防洪、发电兴利、生态效益造成不利影响。本文以发电量最大、防洪库容占用比最小以及修正流量偏差最小作为三峡梯级蓄水期调度目标构建优化调度模型,进而引入谈判博弈模型将各个调度目标作为不同谈判主体,通过逐步缩减各调度目标期望效益值进行多轮谈判,最终得到纳什均衡调度方案。实例计算表明,应用谈判博弈模型能够求解得出三峡梯级蓄水期不同调度主体的最优蓄水调度方案,同时该蓄水调度方案也能够达到其他调度主体期望效益值,被其他目标主体所接受。研究成果可为三峡梯级多目标调度决策提供新的思路。 展开更多
关键词 三峡梯级 蓄水期 多目标调度 博弈论 谈判博弈
下载PDF
基于SD演化博弈的建筑工程质量潜在缺陷保险履约研究
4
作者 薛松 方洁 +1 位作者 陈静妍 黄国华 《工程管理学报》 2024年第3期117-122,共6页
当前,我国大力推行的住宅质量潜在缺陷保险(Inherent Defects Insurance,IDI)实施效果亟需改善。针对寻租行为导致的工程质量问题,基于保险公司视角构建履约阶段保险公司、承包商、风险管理机构的三方博弈模型,运用系统动力学进行仿真,... 当前,我国大力推行的住宅质量潜在缺陷保险(Inherent Defects Insurance,IDI)实施效果亟需改善。针对寻租行为导致的工程质量问题,基于保险公司视角构建履约阶段保险公司、承包商、风险管理机构的三方博弈模型,运用系统动力学进行仿真,改变合作损失、名誉损失、监督成本等数值,探究各主体行为演化过程及各因素对主体策略变化的影响。结果表明,保险公司积极监督受到承包商寻租和风险管理机构意向寻租策略的正向影响,出于长久合作考虑,不会出现寻租行为,监督成本是影响保险公司策略的主要因素。验证结果具有科学性,为IDI在市场中的顺利推行和应用提供了理论依据。 展开更多
关键词 房屋建筑 工程质量潜在缺陷保险 利益相关者 多元主体 演化博弈 系统动力学
下载PDF
无人机集群对抗决策算法研究综述
5
作者 李潍 黄诗怡 +1 位作者 刘宏明 孙张俊 《航空科学技术》 2024年第4期9-17,共9页
无人机集群博弈对抗已经成为未来战争的发展趋势,无人机对抗决策算法的选择对提升无人机集群作战能力至关重要。本文深入探讨了基于规则的、基于博弈论的和基于神经网络的三大类无人机集群博弈对抗决策算法,并对它们的优势和局限性进行... 无人机集群博弈对抗已经成为未来战争的发展趋势,无人机对抗决策算法的选择对提升无人机集群作战能力至关重要。本文深入探讨了基于规则的、基于博弈论的和基于神经网络的三大类无人机集群博弈对抗决策算法,并对它们的优势和局限性进行了全面分析与总结。在此基础上,提出将“基于多智能体强化学习的信用分配模型”和“基于角色的多智能体强化学习模型”应用于无人机集群博弈对抗的研究思路。最后,强调了选择适当的决策算法对于提高无人机集群作战效能的重要性,并为未来无人机对抗决策的发展提出了有益的建议,为相关领域的研究和应用提供了深入见解。 展开更多
关键词 无人机集群 博弈对抗 专家系统 博弈论 多智能体强化学习
下载PDF
基于多准则决策和博弈论的水权配置分析:以浙江省为例
6
作者 袁艳斌 郭峰 肖静 《水利水电技术(中英文)》 北大核心 2024年第2期90-100,共11页
【目的】水资源的配置是解决水资源冲突的一个重要途径。统筹考虑用水主体的社会经济发展和决策交互等情况,以期合理配置水权。【方法】以浙江省为研究区域,分别基于多准则决策来构建指标体系以及基于博弈论构建主从博弈模型进行水权配... 【目的】水资源的配置是解决水资源冲突的一个重要途径。统筹考虑用水主体的社会经济发展和决策交互等情况,以期合理配置水权。【方法】以浙江省为研究区域,分别基于多准则决策来构建指标体系以及基于博弈论构建主从博弈模型进行水权配置,并联系实际情况对配置结果进行对比分析,探究两种方案的适用性。【结果】结果显示:两种方案总水权相同,博弈论方案用水总收益为65167亿元,较多准则决策方案的59649亿元提升了9%;两种方案在绍兴、金华和台州等城市的水权配置结果以及总收益十分接近,博弈论方案水权分配结果较符合各地区用水需求,多准则决策方案在衢州、湖州和丽水的水权分配远超其需水量。【结论】多准则决策方案在信息较少时可依据各项指标对水权进行粗略度量。构建的水权配置指标体系有其合理性,但定权及评价等还不完善,配置结果与实际需求存在差距。主从博弈模型能够有效调和不同层次的冲突,满足用水个体供水保证率,水权配置结果也更科学合理,可在一定程度上约束水资源的浪费和低效利用情况。研究对比分析了两种方案的水权配置结果,可为管理者进行水权分配科学决策提供一定参考依据。 展开更多
关键词 水资源配置 多准则决策 主从博弈 水资源 影响因素
下载PDF
计及需求响应和季节性氢储的多微网合作运行策略
7
作者 徐艳春 宋文宇 +2 位作者 汪平 王霖 MI Lu 《三峡大学学报(自然科学版)》 CAS 北大核心 2024年第4期96-104,共9页
为促进可再生能源的消纳,解决综合能源系统中源荷季节性不平衡的问题,提出一种计及需求响应和季节性氢储的多微网合作运行策略.首先对综合能源系统中的季节性氢储系统和用户的需求响应行为进行建模,随后通过电力通道将多个微网连接成多... 为促进可再生能源的消纳,解决综合能源系统中源荷季节性不平衡的问题,提出一种计及需求响应和季节性氢储的多微网合作运行策略.首先对综合能源系统中的季节性氢储系统和用户的需求响应行为进行建模,随后通过电力通道将多个微网连接成多微网系统.由于各个微网属于不同的利益主体,微网与用户之间也存在利益交互,因此引入合作-主从博弈框架对本文多利益主体博弈进行描述,其中主从博弈中多微网系统为领导者,能源用户为跟随者.在对主从博弈求解完成后,最后提出一种议价能力对各微网联盟的贡献进行描述,利用纳什议价对各微网的合作利益进行合理分配.算例表明,本文策略可有效促进可再生能源的消纳,降低用户购能成本和促进各微网能源传输. 展开更多
关键词 季节性氢存储 需求响应 主从合作博弈 纳什谈判 多微网系统
下载PDF
风电租赁储能参与电能-调频市场竞价策略
8
作者 李咸善 胡长宇 +2 位作者 张远航 李欣 李飞 《电网技术》 EI CSCD 北大核心 2024年第5期1992-2002,I0057,I0054-I0056,共15页
风电参与市场化竞价运营,可有效激发风电的市场力及其主动租赁储能改善调频性能的积极性,在提升风电运营效益的同时,助力电网的调频调峰,但需解决风储调频性能指标优化及其电能-调频双市场竞价策略协同优化等关键问题。为此,提出了风电... 风电参与市场化竞价运营,可有效激发风电的市场力及其主动租赁储能改善调频性能的积极性,在提升风电运营效益的同时,助力电网的调频调峰,但需解决风储调频性能指标优化及其电能-调频双市场竞价策略协同优化等关键问题。为此,提出了风电参与电能-调频市场竞价双层优化模型:上层为双市场多主体竞价出清模型;下层为各主体竞价策略优化模型,响应上层出清结果,优化调整竞价策略,达到各主体效益最大化。下层模型嵌套了考虑风电不确定性的储能运营商与风电集群储能租赁价格/容量主从博弈优化模型。双层模型联合求解,得出最终风电集群租赁储能容量及其双市场竞价策略。算例结果表明,所提方法能够提升风电运营效益,助力电网调频调峰。 展开更多
关键词 风电集群 综合调频性能指标 不确定性 储能租赁 多主体竞价 主从博弈 两阶段鲁棒优化
下载PDF
计及能源交易下基于纳什议价模型的多微网合作博弈运行优化策略 被引量:1
9
作者 田海东 何山 +3 位作者 艾纯玉 樊小朝 胡兵 徐立军 《电力系统保护与控制》 EI CSCD 北大核心 2024年第6期29-41,共13页
以能源交易为背景,针对多微电网合作中的运行优化问题,提出了基于Nash议价模型的合作博弈策略,旨在实现微电网之间的合作,以最大化整体利益,同时考虑能源交易和成本优化。首先,将各微电网视为博弈参与者,构建了基于Nash议价理论的多微... 以能源交易为背景,针对多微电网合作中的运行优化问题,提出了基于Nash议价模型的合作博弈策略,旨在实现微电网之间的合作,以最大化整体利益,同时考虑能源交易和成本优化。首先,将各微电网视为博弈参与者,构建了基于Nash议价理论的多微电网合作博弈模型,通过选择能源交易策略和运行策略来影响其能源成本和效益。其次,采用交替方向乘子法(alternating direction multiplier method,ADMM)求解此多参与者优化问题,通过将原问题分解为子问题并引入乘子变量来实现迭代求解。最后,在每次迭代中,各微电网根据其局部信息更新能源交易和运行策略,并利用乘子变量进行信息交换和博弈协调,以达到全局一致性。结果表明,该策略在多微电网合作中能够实现整体性能的提升,有效促进了可再生能源的消纳水平,平衡了各参与者的利益,同时降低了能源成本。 展开更多
关键词 多微网系统 能源交易 合作博弈 Nash议价
下载PDF
基于演化博弈的反转网络舆情多阶段治理研究
10
作者 江长斌 徐思思 +3 位作者 李汾萦 黄英辉 徐紫琪 詹若贤 《武汉理工大学学报(信息与管理工程版)》 CAS 2024年第3期392-401,共10页
为分析反转网络舆情演化的内在机理和影响因素,得到最优策略,结合反转舆情形成期、扩散期和反转期三阶段的现实特征,分别构建有限理性个体策略选择的演化博弈模型。通过求解不同阶段的演化均衡解,并根据利益相关关系进行数值仿真,分析... 为分析反转网络舆情演化的内在机理和影响因素,得到最优策略,结合反转舆情形成期、扩散期和反转期三阶段的现实特征,分别构建有限理性个体策略选择的演化博弈模型。通过求解不同阶段的演化均衡解,并根据利益相关关系进行数值仿真,分析决策成本、奖惩机制与主体合作这3个主要因素对舆情演化的影响。研究表明:在形成期最优治理状态为{全面爆料,不传播},增加知情者爆料成本和公众传播成本能够从源头减少反转;在扩散期最优治理状态为{追随自媒体,全面报道,松弛监管},权威机构增强奖惩力度特别是惩罚能够有效促使自媒体全面报道;在反转期最优治理状态为{相信反转,推动反转,积极},同时自媒体与权威机构配合传播真相有助于反转舆情治理和迅速趋于稳定。 展开更多
关键词 演化博弈 反转网络舆情 多阶段 仿真分析 舆情治理
下载PDF
多主体博弈下基于改进灰狼算法的综合能源服务商优化运行策略
11
作者 关红伟 刘丽娟 +3 位作者 白牧可 贾宇琛 刘永福 张立梅 《电力系统及其自动化学报》 CSCD 北大核心 2024年第7期78-85,共8页
为促进新能源消纳和满足不同负荷需求,本文提出了多主体博弈下的综合能源服务商优化运行策略。通过分析不同主体的交互及利益关系,建立综合能源服务商与分布式发电商、负荷用户的主从博弈双层优化模型,上层综合能源服务商通过售能价格... 为促进新能源消纳和满足不同负荷需求,本文提出了多主体博弈下的综合能源服务商优化运行策略。通过分析不同主体的交互及利益关系,建立综合能源服务商与分布式发电商、负荷用户的主从博弈双层优化模型,上层综合能源服务商通过售能价格激励下层负荷用户调整用能需求,并以高于新能源上网电价的购电价格激励下层分布式发电商进行售电量调整。针对模型的高维、非线性特征,通过引入差分进化和精英保留策略加速灰狼算法的全局搜索能力和收敛性。仿真结果表明所建模型在兼顾不同主体利益的同时,降低了系统的碳排放量,所提优化求解方法快速高效。 展开更多
关键词 综合能源服务商 多主体博弈 灰狼优化算法 差分进化
下载PDF
基于三级养护标准的沥青路面预养护方案多目标加权灰靶决策
12
作者 李海莲 司金忠 +4 位作者 贾卫东 付琳 李清华 杨斯媛 张茗 《北京工业大学学报》 CAS CSCD 北大核心 2024年第5期591-599,共9页
针对沥青路面最佳预防性养护策略选择问题,结合关于沥青路面预防性养护指标及规范标准,建立了基于判断性指标、综合性指标和控制性指标的三级预防性养护判断标准。在此标准下,以多年度项目级养护规划为研究对象,结合GM(1,1)预测模型确... 针对沥青路面最佳预防性养护策略选择问题,结合关于沥青路面预防性养护指标及规范标准,建立了基于判断性指标、综合性指标和控制性指标的三级预防性养护判断标准。在此标准下,以多年度项目级养护规划为研究对象,结合GM(1,1)预测模型确定预防性养护时段,并引入多目标智能加权灰靶决策模型对适用性预防性养护方案进行优化决策。在此过程中,确定了养护费用、耐久性等8个养护目标并利用博弈论组合赋权法确定权重,选取G30连霍高速甘肃省境内某路段进行决策分析。结果表明:该路段最早需要开展预防性养护的时间为第3年,在第6年底之后不宜再实施预防性养护,在该预防性养护时段内,方案4的综合效益值最大,其值为0.735 8,即应在第4年采取超薄层罩面预养护措施。该方法简单实用,可成为沥青路面预防性养护策略选择的一种新方法。 展开更多
关键词 道路工程 沥青路面 预防性养护 预防性养护标准 多目标灰靶决策 博弈论组合赋权
下载PDF
多智能体博弈学习研究进展 被引量:1
13
作者 罗俊仁 张万鹏 +2 位作者 苏炯铭 袁唯淋 陈璟 《系统工程与电子技术》 EI CSCD 北大核心 2024年第5期1628-1655,共28页
随着深度学习和强化学习而来的人工智能新浪潮,为智能体从感知输入到行动决策输出提供了“端到端”解决方案。多智能体学习是研究智能博弈对抗的前沿课题,面临着对抗性环境、非平稳对手、不完全信息和不确定行动等诸多难题与挑战。本文... 随着深度学习和强化学习而来的人工智能新浪潮,为智能体从感知输入到行动决策输出提供了“端到端”解决方案。多智能体学习是研究智能博弈对抗的前沿课题,面临着对抗性环境、非平稳对手、不完全信息和不确定行动等诸多难题与挑战。本文从博弈论视角入手,首先给出了多智能体学习系统组成,进行了多智能体学习概述,简要介绍了各类多智能体学习研究方法。其次,围绕多智能体博弈学习框架,介绍了多智能体博弈基础模型及元博弈模型,均衡解概念和博弈动力学,学习目标多样、环境(对手)非平稳、均衡难解且易变等挑战。再次,全面梳理了多智能体博弈策略学习方法,离线博弈策略学习方法,在线博弈策略学习方法。最后,从智能体认知行为建模与协同、通用博弈策略学习方法和分布式博弈策略学习框架共3个方面探讨了多智能体学习的前沿研究方向。 展开更多
关键词 博弈学习 多智能体学习 元博弈 在线无悔学习
下载PDF
基于正向解析式和多目标博弈优化算法的复杂装备体系优化设计方法
14
作者 丁伟 明振军 +2 位作者 王国新 阎艳 禹磊 《兵工学报》 EI CAS CSCD 北大核心 2024年第6期1974-1990,共17页
针对复杂装备体系(Complex Equipment System-of-systems,CES)优化设计中指标变量多、仿真依赖性强、易陷入局部最优的问题,提出一种基于正向解析式和多目标博弈理论(Multi-Objective Game Theory,MOGT)优化算法的CES优化设计方法。为提... 针对复杂装备体系(Complex Equipment System-of-systems,CES)优化设计中指标变量多、仿真依赖性强、易陷入局部最优的问题,提出一种基于正向解析式和多目标博弈理论(Multi-Objective Game Theory,MOGT)优化算法的CES优化设计方法。为提升CES优化设计的可解释性,构建任务级—能力级—装备级的评估指标体系;在此基础上,基于装备机理和效用函数表征装备评估指标与作战能力之间的正向映射关系,并利用相邻优属度熵权法计算各指标权重;通过正向解析式与约束条件建立多目标优化模型,并采用MOGT优化算法获得最佳优化结果。以某作战推演平台中防空攻防想定为例,开展算例评估与验证分析。研究结果表明,该方法能够实现CES中最优设计方案的求解,可显著提高设计效率和降低设计成本,为下一代装备发展论证、设计评估和作战试验提供了基础性工作。 展开更多
关键词 复杂装备体系 正向优化设计 多目标博弈理论优化算法 相邻优属度熵权 作战推演仿真
下载PDF
基于分层强化学习的多智能体博弈策略生成方法
15
作者 畅鑫 李艳斌 刘东辉 《无线电工程》 2024年第6期1361-1367,共7页
典型基于深度强化学习的多智能体对抗策略生成方法采用“分总”框架,各智能体基于部分可观测信息生成策略并进行决策,缺乏从整体角度生成对抗策略的能力,大大限制了决策能力。为了解决该问题,基于分层强化学习提出改进的多智能体博弈策... 典型基于深度强化学习的多智能体对抗策略生成方法采用“分总”框架,各智能体基于部分可观测信息生成策略并进行决策,缺乏从整体角度生成对抗策略的能力,大大限制了决策能力。为了解决该问题,基于分层强化学习提出改进的多智能体博弈策略生成方法。基于分层强化学习构建观测信息到整体价值的决策映射,以最大化整体价值作为目标构建优化问题,并推导了策略优化过程,为后续框架结构和方法实现的设计提供了理论依据;基于决策映射与优化问题构建,采用神经网络设计了模型框架,详细阐述了顶层策略控制模型和个体策略执行模型;基于策略优化方法,给出详细训练流程和算法流程;采用星际争霸多智能体对抗(StarCraft Multi-Agent Challenge,SMAC)环境,与典型多智能体方法进行性能对比。实验结果表明,该方法能够有效生成对抗策略,控制异构多智能体战胜预设对手策略,相比典型多智能体强化学习方法性能提升明显。 展开更多
关键词 分层强化学习 多智能体博弈 深度神经网络
下载PDF
全民健身公共服务多元协同供给的演化博弈分析与实施路径研究 被引量:1
16
作者 朱本澍 曹莉 《天津体育学院学报》 CAS 北大核心 2024年第2期225-232,共8页
落实全民健身公共服务多元协同供给,是“十四五”时期深入实施全民健身国家战略的迫切要求,是全面建设社会主义现代化国家的应然选择。借助公共产品理论、协同学理论和演化博弈理论,构建以政府、市场和社会组织三方为参与主体的全民健... 落实全民健身公共服务多元协同供给,是“十四五”时期深入实施全民健身国家战略的迫切要求,是全面建设社会主义现代化国家的应然选择。借助公共产品理论、协同学理论和演化博弈理论,构建以政府、市场和社会组织三方为参与主体的全民健身公共服务多元协同供给演化博弈模型,分析三方主体的演化策略选择,并分别就三方主体的初始意愿、激励成本、补贴力度和处罚力度对演化策略的影响程度进行数值仿真。分析认为,通过提高初始意愿,控制激励成本,对市场和社会组织进行适度补贴并合理规制,能够有效实现全民健身公共服务多元协同供给。以供给全过程为逻辑理路,提出重构供给主体的权责关系、丰富供给内容的差序格局、健全供给系统的监督反馈机制等全民健身公共服务多元协同供给实施路径。 展开更多
关键词 全民健身公共服务 多元协同 供给主体 演化博弈分析
下载PDF
仿鹰鸽捕食逃逸行为的多无人机分组对抗博弈方法
17
作者 仝秉达 段海滨 魏晨 《控制理论与应用》 EI CAS CSCD 北大核心 2024年第5期855-865,共11页
针对多无人机对抗问题,本文提出了一种三维空间中仿鹰鸽捕食逃逸行为的多无人机分组对抗博弈方法.在分析鹰鸽捕食逃逸行为的基础上,文章构建了多无人机博弈对抗系统模型,并定义了微分博弈中的连续可微值函数,证明了值函数满足Hamilton-J... 针对多无人机对抗问题,本文提出了一种三维空间中仿鹰鸽捕食逃逸行为的多无人机分组对抗博弈方法.在分析鹰鸽捕食逃逸行为的基础上,文章构建了多无人机博弈对抗系统模型,并定义了微分博弈中的连续可微值函数,证明了值函数满足Hamilton-Jacobi-Isaacs(HJI)方程,从而保证鞍点策略存在.使用最优分配方法,为仿鹰无人机一方设计了分组对抗分配策略,以解决多无人机追逃场景中的任务分配问题.本文对比仿真实验结果验证了所提出方法的有效性. 展开更多
关键词 多无人机对抗 微分博弈 任务分配 捕食逃逸 鞍点策略
下载PDF
多代理技术下基于主从博弈的多微网系统经济优化调度
18
作者 马越 蔺红 《太阳能学报》 EI CAS CSCD 北大核心 2024年第1期574-582,共9页
为实现同一区域内多个不同利益主体微网之间的电能互济,提出一种多代理技术下基于主从博弈的多微网系统经济优化调度方法。首先,设计一种由多微网代理(MMGA)制定系统内部电价,各微网代理(MGA)对电价作出响应的多微网系统能量交互框架;其... 为实现同一区域内多个不同利益主体微网之间的电能互济,提出一种多代理技术下基于主从博弈的多微网系统经济优化调度方法。首先,设计一种由多微网代理(MMGA)制定系统内部电价,各微网代理(MGA)对电价作出响应的多微网系统能量交互框架;其次,引入可信性理论的模糊机会约束处理可再生能源以及负荷不确定性对调度决策的影响,基于主从博弈建立含模糊机会约束的多微网系统经济优化调度模型;最后,采用遗传算法嵌套CPLEX求解器进行求解。仿真结果表明:所提方法在提高各方经济效益的同时可减小多微网系统与电网的交互电量,有利于分布式资源的就地消纳和电网安全稳定的运行。 展开更多
关键词 分布式发电 微电网 不确定性分析 主从博弈 多代理技术 优化调度
下载PDF
多人追逃的协商微分对策最优躲避策略
19
作者 赵燊佳 张海瑞 +2 位作者 梁卓 吕瑞 涂海峰 《航天控制》 CSCD 2024年第2期48-54,共7页
针对夺旗运动中追逃博弈的最优躲避问题,提出了一种多人追逃的协商微分对策最优躲避策略。首先,建立夺旗追逃线性化模型,并对模型进行降阶。其次,考虑能量约束和交汇时刻博弈双方距离的代价函数,构造了哈密顿函数。最后,利用Hamilton-Ja... 针对夺旗运动中追逃博弈的最优躲避问题,提出了一种多人追逃的协商微分对策最优躲避策略。首先,建立夺旗追逃线性化模型,并对模型进行降阶。其次,考虑能量约束和交汇时刻博弈双方距离的代价函数,构造了哈密顿函数。最后,利用Hamilton-Jacobi-Isaacs(H-J-I)方程组,求解得到了协商微分对策最优躲避策略。对所设计最优躲避策略进行了“二追一”仿真和多层追捕仿真,结果表明夺旗一方的队员成功夺旗的同时能量消耗最小,验证了本文提出协商微分对策躲避策略的有效性和适用性。 展开更多
关键词 飞行器制导 多人追逃博弈 协商微分对策 夺旗
下载PDF
一种结合MADDPG和对比学习的无人机追逃博弈方法
20
作者 王若冰 王晓芳 《宇航学报》 EI CAS CSCD 北大核心 2024年第2期262-272,共11页
针对复杂作战环境中无人机的追逃博弈问题,建立了其马尔科夫模型,采用零和博弈思想,设计了追逃双方的奖励函数。构建了集中训练-分布执行的多智能体深度确定性强化学习算法(MADDPG)的训练流程,求解得到追逃博弈的纳什均衡解。针对以追... 针对复杂作战环境中无人机的追逃博弈问题,建立了其马尔科夫模型,采用零和博弈思想,设计了追逃双方的奖励函数。构建了集中训练-分布执行的多智能体深度确定性强化学习算法(MADDPG)的训练流程,求解得到追逃博弈的纳什均衡解。针对以追逃双方初始位置等高维向量构成的捕获域(逃逸域)难以解析表征的问题,在MADDPG博弈网络基础上,结合深度对比学习算法,通过构建和训练孪生神经网络,实现了对高维捕获域(逃逸域)的间接表征。仿真结果表明,MADDPG算法可以有效求出给定条件下的无人机追逃博弈的纳什均衡解,同时,对比学习算法结合收敛的MADDPG网络对高维的捕获域(逃逸域)表征的正确率达到95%。 展开更多
关键词 无人机(UAV) 追逃博弈 多智能体 强化学习 纳什均衡 深度对比学习
下载PDF
上一页 1 2 61 下一页 到第
使用帮助 返回顶部