期刊文献+
共找到23篇文章
< 1 2 >
每页显示 20 50 100
未知环境中基于图型博弈和multi-Q学习的动态信道选择算法 被引量:2
1
作者 李方伟 唐永川 朱江 《通信学报》 EI CSCD 北大核心 2013年第11期1-7,共7页
研究了分布式无线网络中,没有任何信息交换、也没有环境变化先验知识情况下的动态信道接入算法。运用图型博弈模型对用户的实际拓扑进行建模分析,证明了此博弈模型存在纯策略纳什均衡并且此纳什均衡是全局最优解。同时,采用multi-Q学习... 研究了分布式无线网络中,没有任何信息交换、也没有环境变化先验知识情况下的动态信道接入算法。运用图型博弈模型对用户的实际拓扑进行建模分析,证明了此博弈模型存在纯策略纳什均衡并且此纳什均衡是全局最优解。同时,采用multi-Q学习求解模型的纯策略纳什均衡解。仿真实验验证了multi-Q学习能获得较高的系统容量以及在图型博弈模型中用户的效用主要由节点的度决定,而与用户数量无直接关系。 展开更多
关键词 动态信道选择 博弈 multi-Q学习 纯策略纳什均衡
下载PDF
基于图型博弈的动态频谱分配算法
2
作者 刘觉夫 杨将 +1 位作者 朱丙虎 胡静 《计算机工程与设计》 北大核心 2016年第6期1464-1470,共7页
针对在Underlay频谱共享方式下的认知无线网络动态频谱分配问题,为提高认知用户接入频谱的概率并最大化认知无线网络的吞吐量,提出一种分布式动态频谱分配算法。考虑认知用户之间干扰关系的独立性,建立一种图型博弈模型,设计效用函数,... 针对在Underlay频谱共享方式下的认知无线网络动态频谱分配问题,为提高认知用户接入频谱的概率并最大化认知无线网络的吞吐量,提出一种分布式动态频谱分配算法。考虑认知用户之间干扰关系的独立性,建立一种图型博弈模型,设计效用函数,引入价格函数量化对主用户的干扰影响,理论验证该模型纳什均衡的存在性。仿真实验结果表明,该算法收敛速度快,可以增大认知用户接入频谱的概率,提高网络吞吐量。 展开更多
关键词 认知无线网络 动态频谱分配 Underlay频谱共享 博弈 效用函数
下载PDF
求解图型博弈的Nash均衡
3
作者 李劲 刘惟一 《计算机工程与应用》 CSCD 北大核心 2004年第26期62-65,111,共5页
图型博弈是一种新的博弈表示方法。求解Nash均衡是图型博弈的核心问题。论文把求解图型博弈的Nash均衡看作是离散空间中的优化问题,给出了求解图型博弈ε-Nash均衡的迭代优化算法。另外,为加快算法的收敛速度,提出了一个获得高迭代效率... 图型博弈是一种新的博弈表示方法。求解Nash均衡是图型博弈的核心问题。论文把求解图型博弈的Nash均衡看作是离散空间中的优化问题,给出了求解图型博弈ε-Nash均衡的迭代优化算法。另外,为加快算法的收敛速度,提出了一个获得高迭代效率策略剖面的方法:基于博弈的图形结构进行多策略更新。实验结果表明算法是可行、高效的。 展开更多
关键词 博弈 ε-Nash均衡 迭代优化算法
下载PDF
无线网络中基于图型演化博弈的动态频谱接入机制
4
作者 李方伟 袁迎慧 朱江 《通信学报》 EI CSCD 北大核心 2015年第7期1-9,共9页
无线网络中,为了实现用户高效的数据传输,针对用户的有限理性特性,提出了一种基于图型演化博弈的动态频谱接入机制,而图型博弈可以较好地反映用户之间真实的博弈关系。同时设计了一种动态频谱接入算法和与之对应的动态方程以降低博弈的... 无线网络中,为了实现用户高效的数据传输,针对用户的有限理性特性,提出了一种基于图型演化博弈的动态频谱接入机制,而图型博弈可以较好地反映用户之间真实的博弈关系。同时设计了一种动态频谱接入算法和与之对应的动态方程以降低博弈的复杂度,而且能以较快的速度收敛到Nash均衡并获得较高的系统吞吐量和效用。理论证明该动态方程具有全局逐步稳定性,当用户发生局部的理性偏移时依然能够保证较快收敛和较小性能偏离。仿真对比验证了该机制的上述优势。 展开更多
关键词 动态频谱接入机制 型演化博弈 动态方程 NASH均衡
下载PDF
图上合作博弈和图的边密度 被引量:7
5
作者 李理 单而芳 《运筹学学报》 CSCD 北大核心 2018年第4期99-107,共9页
1977年,Myerson建立了以图作为合作结构的可转移效用博弈模型(也称图博弈),并提出了一个分配规则,也即"Myerson值",它推广了著名的Shapley值.该模型假定每个连通集合(通过边直接或间接内部相连的参与者集合)才能形成可行的合... 1977年,Myerson建立了以图作为合作结构的可转移效用博弈模型(也称图博弈),并提出了一个分配规则,也即"Myerson值",它推广了著名的Shapley值.该模型假定每个连通集合(通过边直接或间接内部相连的参与者集合)才能形成可行的合作联盟而取得相应的收益,而不考虑连通集合的具体结构.引入图的局部边密度来度量每个连通集合中各成员之间联系的紧密程度,即以该连通集合的导出子图的边密度来作为他们的收益系数,并由此定义了具有边密度的Myerson值,证明了具有边密度的Myerson值可以由"边密度分支有效性"和"公平性"来唯一确定. 展开更多
关键词 博弈 边密度 Myerson值 分支有效性 公平性
下载PDF
合作图博弈在车载网数据分发中的应用 被引量:1
6
作者 费翔 栾西 +2 位作者 依那 李俊 吴建军 《无线电通信技术》 2015年第4期91-95,共5页
针对日益突显的车载自组织网络中的内容分发问题,对车载网中的流行内容分发进行了简要介绍,论述了现有方案的不足之处,并创新性地采用合作图博弈对该问题进行了建模,在该模型中,车载单元(the On-Board Units,OBUs)根据通过博弈建立的网... 针对日益突显的车载自组织网络中的内容分发问题,对车载网中的流行内容分发进行了简要介绍,论述了现有方案的不足之处,并创新性地采用合作图博弈对该问题进行了建模,在该模型中,车载单元(the On-Board Units,OBUs)根据通过博弈建立的网络进行数据分发。对提出的基于图论的合作博弈方案在车载网数据分发中的性能进行了仿真分析,结果表明,与传统的非合作方法相比,该方法具有明显的优势。 展开更多
关键词 车载自组织网络 流行内容分发 合作博弈 成对稳定
下载PDF
支付模糊图合作博弈分配模型及其应用 被引量:1
7
作者 苏东风 杨洁 《福州大学学报(自然科学版)》 CAS 北大核心 2018年第4期458-465,共8页
针对限制结盟结构下联盟支付模糊的各局中人收益分配问题,引入λ截集置信水平,提出一种具有区间型特征的支付模糊图合作博弈的模糊A-T解(average tree solution)分配模型.采用公理化体系对此解的存在性进行证明,且任意局中人收益分配的... 针对限制结盟结构下联盟支付模糊的各局中人收益分配问题,引入λ截集置信水平,提出一种具有区间型特征的支付模糊图合作博弈的模糊A-T解(average tree solution)分配模型.采用公理化体系对此解的存在性进行证明,且任意局中人收益分配的上下界容易求得.最后将此方法应用到产学研协同创新收益分配实例中,并通过与Shapley方法比较,表明该方法的可行性和合理性. 展开更多
关键词 合作博弈 限制结盟 模糊支付 A-T分配值 协同创新
下载PDF
图博弈下具有未知动态的供应链系统变更设计
8
作者 范佳慧 李庆奎 《北京信息科技大学学报(自然科学版)》 2022年第1期19-26,共8页
为了研究具有未知动态的供应链系统变更一致性问题,将供应链系统建模为多智能体系统,针对多智能体系统图博弈问题,提出一种自适应最优分布式算法,该算法基于数值迭代启发式动态规划,无需系统动力学知识即可求解耦合的Hamilton-Jacobi-Is... 为了研究具有未知动态的供应链系统变更一致性问题,将供应链系统建模为多智能体系统,针对多智能体系统图博弈问题,提出一种自适应最优分布式算法,该算法基于数值迭代启发式动态规划,无需系统动力学知识即可求解耦合的Hamilton-Jacobi-Isaacs(HJI)方程。此外,使用神经网络来识别每个子链的未知动态,证明了所提对策的闭环系统稳定性。仿真结果表明,该方法可以保证供应链变更系统的稳定性与一致性。 展开更多
关键词 供应链系统 零和博弈 系统辨识 启发式动态规划算法
下载PDF
一种有限资源约束的博弈概率图规划模型
9
作者 刘兆鹏 罗睿 +1 位作者 张金璐 黄润宇 《指挥与控制学报》 CSCD 2022年第4期483-488,共6页
在分析传统智能规划建模优缺点基础上,针对联合作战任务规划面临的资源有限性、人机结合性、对抗性、不确定性特点,设计了虚实结合的规划框架,提出了博弈概率图规划模型,改进了规划步的终止方法,针对敌方作战体系的鲁棒性特征,采用遗传... 在分析传统智能规划建模优缺点基础上,针对联合作战任务规划面临的资源有限性、人机结合性、对抗性、不确定性特点,设计了虚实结合的规划框架,提出了博弈概率图规划模型,改进了规划步的终止方法,针对敌方作战体系的鲁棒性特征,采用遗传算法优化了行动方案,通过实验验证了博弈概率图规划模型的有效性. 展开更多
关键词 联合作战 任务规划 有限资源约束 博弈概率规划
下载PDF
一种面向多Agent交互的博弈Nash均衡求解方法 被引量:1
10
作者 李劲 岳昆 刘惟一 《计算机科学》 CSCD 北大核心 2007年第3期181-185,共5页
现有的图型博弈Nash均衡求解方法基本是在离散化剖面空间中搜索求解,最终只能得到近似Nash均衡。针对现有求解方法存在的不足,把求解图型博弈的Nash均衡看作是连续策略空间中的函数优化问题,定义Agents在策略剖面中的效用偏离度之和为... 现有的图型博弈Nash均衡求解方法基本是在离散化剖面空间中搜索求解,最终只能得到近似Nash均衡。针对现有求解方法存在的不足,把求解图型博弈的Nash均衡看作是连续策略空间中的函数优化问题,定义Agents在策略剖面中的效用偏离度之和为优化目标,其最优解就是博弈的Nash均衡。本文基于对实例的分析指出目标函数下降梯度的计算可归结为一组线性规划,进而提出一种求解图型博弈Nash均衡的新型梯度下降算法。算法分析及实验研究表明,对于多Agent交互模型中的相关问题,本文提出的方法可求解任意图结构图型博弈Nash均衡,对于大规模图型博弈也有较好的求解精度和求解效率。 展开更多
关键词 多Agent交互模型 博弈 NASH均衡 线性规划 梯度下降算法
下载PDF
基于博弈理论的认知星地网络抗干扰信道选择方法 被引量:1
11
作者 王梦阳 贾录良 +1 位作者 颜培杰 陈亚明 《兵器装备工程学报》 CAS CSCD 北大核心 2023年第1期254-262,共9页
针对认知星地网络频谱稀缺、易受干扰的特点,研究了认知星地网络中的抗干扰信道选择问题。首先考虑到地面认知用户受到多方面干扰,根据用户和干扰之间的主从关系将其构造为Stackelberg博弈。同时针对用户间互扰呈现局部影响的特性,又将... 针对认知星地网络频谱稀缺、易受干扰的特点,研究了认知星地网络中的抗干扰信道选择问题。首先考虑到地面认知用户受到多方面干扰,根据用户和干扰之间的主从关系将其构造为Stackelberg博弈。同时针对用户间互扰呈现局部影响的特性,又将用户间关系构造为图博弈,并从理论上证明上述博弈均衡的存在性。然后为了获得抗干扰信道选择问题的均衡解,提出一种基于局部信息交互的分层学习算法,在该算法中,认知用户不仅考虑自身吞吐量,还考虑邻居用户的吞吐量,通过局部最优实现全局最优。经过仿真分析,从实验层面验证了所提算法的收敛性和有效性。 展开更多
关键词 认知星地网络 抗干扰 STACKELBERG博弈 博弈 局部信息交互
下载PDF
图联盟结构核的求解算法
12
作者 尚传启 刘惊雷 《计算机科学与探索》 CSCD 北大核心 2018年第5期804-819,共16页
联盟结构核是人工智能领域中的一个重要研究内容,特别是生成满足核要求的联盟结构及其分配,是当前主要的研究任务。传统算法存在一些缺陷,比如假定所有联盟可生成且联盟利益满足超加性,忽视外部环境对生成联盟的限制作用。采用约束图作... 联盟结构核是人工智能领域中的一个重要研究内容,特别是生成满足核要求的联盟结构及其分配,是当前主要的研究任务。传统算法存在一些缺陷,比如假定所有联盟可生成且联盟利益满足超加性,忽视外部环境对生成联盟的限制作用。采用约束图作为联盟生成的约束条件,按劳分配作为初始分配方案,谈判集、稳定成本作为分配调整方案,设计SCP(stable core programming)算法生成联盟结构核,使得生成的联盟结构核可以满足所有处于联盟状态Agent的最大利益期望,保证联盟结构的稳定性。 展开更多
关键词 联盟博弈 联盟结构核 按劳分配 谈判集 稳定成本
下载PDF
在线社交网络中谣言传播行为的图上博弈分析
13
作者 丁学君 王慧婷 田勇 《系统科学与数学》 CSCD 北大核心 2024年第5期1373-1388,共16页
复杂社交网络中谣言不断地滋生与蔓延.为对谣言进行有效管控,文章基于图上博弈理论,通过引入详尽可能性模型及情绪认知理论,探究谣言转发行为的影响因素,并从信息内容差异化角度,构建了社交网络用户谣言传播行为演化博弈模型.仿真结果表... 复杂社交网络中谣言不断地滋生与蔓延.为对谣言进行有效管控,文章基于图上博弈理论,通过引入详尽可能性模型及情绪认知理论,探究谣言转发行为的影响因素,并从信息内容差异化角度,构建了社交网络用户谣言传播行为演化博弈模型.仿真结果表明:1)提高用户对谣言/反谣言信息的兴趣会直接影响其转发谣言或反驳谣言的行为;2)信息发布的强度对信息的传播效果有着直接影响;3)用户面对不确定信息时,更加愿意转发亲密节点的信息;4)谣言内容包含积极内容及用户个人情绪不稳定时,用户更易做出转发行为.据此,文章提出了治理社交网络谣言传播的相关建议,为相关部门制定有效的谣言治理策略提供了理论支持. 展开更多
关键词 谣言 博弈 传播行为 详尽可能性模型 情绪认知理论
原文传递
Shapley值及其应用
14
作者 吴孟达 毛紫阳 王丹 《数学建模及其应用》 2024年第1期110-119,共10页
Shapley值是合作博弈理论中最重要的概念之一,其在经济学、社会管理等领域具有十分广泛的应用.本文回顾了合作博弈的Shapley值的理论研究,并从Shapley-Shubik权力指数、拼车费用分摊、图博弈的Page-Shapley值以及SHAP方法与机器学习等4... Shapley值是合作博弈理论中最重要的概念之一,其在经济学、社会管理等领域具有十分广泛的应用.本文回顾了合作博弈的Shapley值的理论研究,并从Shapley-Shubik权力指数、拼车费用分摊、图博弈的Page-Shapley值以及SHAP方法与机器学习等4个方面介绍了Shapley值的应用进展. 展开更多
关键词 合作博弈 SHAPLEY值 权力指数 博弈 SHAP方法
下载PDF
基于层级结构的空−地协同预设时间最优容错控制
15
作者 成旺磊 张柯 姜斌 《自动化学报》 EI CAS CSCD 北大核心 2024年第8期1589-1600,共12页
研究了发生执行器故障的无人机−无人车异构编队系统的层级预设时间最优编队控制问题.以保容错性能和收敛速度的优化控制为研究主线,以层级控制、图博弈理论和预设时间控制为技术基础,构建了一种预设时间最优容错控制算法.虚拟层设计了... 研究了发生执行器故障的无人机−无人车异构编队系统的层级预设时间最优编队控制问题.以保容错性能和收敛速度的优化控制为研究主线,以层级控制、图博弈理论和预设时间控制为技术基础,构建了一种预设时间最优容错控制算法.虚拟层设计了基于一致性跟踪误差和能量消耗的二次型性能指标函数,借助耦合哈密顿−雅克比−贝尔曼(Hanmilton-Jacobi-Bellman,HJB)方程和强化学习求解近似最优控制策略,实现多智能体的同步最优控制和交互纳什均衡.实际控制层基于最优信号并利用滑模控制和自适应技术,设计了预设时间容错跟踪控制器,实现对最优编队轨迹的有限时间跟踪.在保证全局收敛时间完全不依赖于系统的初始状态和控制器参数的同时,也有效实现对执行器故障参数的逼近.最后,通过仿真实验验证了所提控制策略的有效性. 展开更多
关键词 空−地协同 执行器故障 预设时间编队 博弈 最优控制
下载PDF
多无人机系统在线强化学习最优安全跟踪控制 被引量:1
16
作者 弓镇宇 杨飞生 《航空科学技术》 2024年第4期25-30,共6页
在无人机(UAV)编队跟踪任务中,虚假数据注入(FDI)攻击者可向控制指令注入误导性数据,导致无人机无法形成指定的编队构型,故需设计安全编队跟踪控制器。为此,本文利用零和图博弈对攻防过程进行建模,其中FDI攻击者和安全控制器是博弈的参... 在无人机(UAV)编队跟踪任务中,虚假数据注入(FDI)攻击者可向控制指令注入误导性数据,导致无人机无法形成指定的编队构型,故需设计安全编队跟踪控制器。为此,本文利用零和图博弈对攻防过程进行建模,其中FDI攻击者和安全控制器是博弈的参与者,攻击者的目标是最大化设定的成本函数,而安全控制器的目标与之相反,求解博弈并获得最优安全控制策略依赖于求取Hamilton-Jacobi-Isaacs(HJI)方程的解。而HJI方程是耦合偏微分方程,难以直接求解,因此结合经验回放机制引入了有限时间收敛的在线强化学习算法,设计了单评价神经网络近似值函数并获得了最优安全控制策略。最终利用仿真验证了算法的有效性。 展开更多
关键词 FDI攻击 多无人机 在线强化学习 优化控制 零和博弈
下载PDF
图博弈的比例分离解及其在区域大气污染治理中的应用
17
作者 顾雯玮 张广 《数学的实践与认识》 北大核心 2024年第5期46-56,共11页
近年来,环京津地区的大气污染治理问题一直是国家重点关注的环境问题,治理成本的分摊机制是解决该地区大气污染问题的关键.聚焦环京津地区大气污染联合治理问题,结合各城市的地理位置,采用具有图结构合作博弈(简称图博弈)模型进行研究.... 近年来,环京津地区的大气污染治理问题一直是国家重点关注的环境问题,治理成本的分摊机制是解决该地区大气污染问题的关键.聚焦环京津地区大气污染联合治理问题,结合各城市的地理位置,采用具有图结构合作博弈(简称图博弈)模型进行研究.首先,将经典合作博弈中的比例分离解推广到图博弈中,提出了图博弈的比例分离解;其次,基于一致性公理探讨了图博弈比例分离解的公理刻画问题.随后,将图博弈的比例分离解应用于环京津地区的大气污染治理的成本分摊问题中,并通过实际算例以及与其他分配规则的对比分析,探讨了图博弈比例分离解的合理性. 展开更多
关键词 大气污染治理 比例分离解 博弈 公理刻画
原文传递
分布式网络中采用图型博弈的动态频谱接入 被引量:1
18
作者 李方伟 唐永川 +1 位作者 朱江 张海波 《北京邮电大学学报》 EI CAS CSCD 北大核心 2014年第2期18-22,共5页
针对分布式无线网络中用户关系拓扑结构的任意性和复杂性带来的维灾问题,提出了一种基于图型博弈的动态频谱接入算法.利用环境信息的非对称性把频谱接入问题抽象为图型博弈模型,并用模型中的图型拓扑表示现实环境中博弈的内在结构;以最... 针对分布式无线网络中用户关系拓扑结构的任意性和复杂性带来的维灾问题,提出了一种基于图型博弈的动态频谱接入算法.利用环境信息的非对称性把频谱接入问题抽象为图型博弈模型,并用模型中的图型拓扑表示现实环境中博弈的内在结构;以最小化个人后悔值代替最小化系统后悔值来求解纯策略纳什均衡点.与现有算法比较,该算法能有效降低运算复杂度,满足通信中实时性的要求.仿真结果表明,该算法能快速收敛到无冲突的纯策略纳什均衡,提高了系统容量和功率利用率,在资源匮乏时优势明显. 展开更多
关键词 分布式无线网络 博弈 纳什均衡 动态频谱接入
原文传递
不断学习是记者的立身之本
19
作者 孔亚立 《青年记者》 2010年第7Z期146-146,共1页
记者要想出色地完成任务,需要有高度的政治觉悟和理论水平做先导,需要有扎实的新闻知识技能作基础,需要有严谨的工作作风作保障。第一,职业性质的需要。记者这种职业是富于挑战性的职业,要求从业者必须政治、经济、文化、科技、天文。
关键词 身之本 政治觉悟 职业性质 工作作风 博弈图 三网融合 业务能力 人才密集型
下载PDF
当记者就必须终身学习
20
作者 朱海山 《青年记者》 2009年第7Z期97-97,共1页
记者是时代的忠实记录者,担负着引导舆论、传承文明、服务社会的神圣使命,责任重大而重要,使命艰巨而光荣。这就要求记者自身必须具备"政治强、业务精、纪律严、作风正"的综合素质。终身学习。
关键词 忠实记录者 职业性质 综合素质 广播电视局 受众需求 兵种协同 欣赏品位 学者型 改革创新 博弈图
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部