期刊文献+
共找到223篇文章
< 1 2 12 >
每页显示 20 50 100
Data-based Optimal Control for Discrete-time Zero-sum Games of 2-D Systems Using Adaptive Critic Designs 被引量:8
1
作者 WEI Qing-Lai ZHANG Hua-Guang CUI Li-Li 《自动化学报》 EI CSCD 北大核心 2009年第6期682-692,共11页
关键词 自适应系统 最优控制 离散时间 自动化系统
下载PDF
Interactive Fuzzy Approaches for Solving Multiobjective Two-Person Zero-Sum Games
2
作者 Hitoshi Yano Ichiro Nishizaki 《Applied Mathematics》 2016年第5期387-398,共12页
In this paper, we consider multiobjective two-person zero-sum games with vector payoffs and vector fuzzy payoffs. We translate such games into the corresponding multiobjective programming problems and introduce the pe... In this paper, we consider multiobjective two-person zero-sum games with vector payoffs and vector fuzzy payoffs. We translate such games into the corresponding multiobjective programming problems and introduce the pessimistic Pareto optimal solution concept by assuming that a player supposes the opponent adopts the most disadvantage strategy for the self. It is shown that any pessimistic Pareto optimal solution can be obtained on the basis of linear programming techniques even if the membership functions for the objective functions are nonlinear. Moreover, we propose interactive algorithms based on the bisection method to obtain a pessimistic compromise solution from among the set of all pessimistic Pareto optimal solutions. In order to show the efficiency of the proposed method, we illustrate interactive processes of an application to a vegetable shipment problem. 展开更多
关键词 Multiobjective Two-Person zero-sum games LR Fuzzy Numbers Fuzzy Payoff Matrices Fuzzy Goals Possibility Measure Pareto Optimal Solutions Linear Programming
下载PDF
Polynomial Time Method for Solving Nash Equilibria of Zero-Sum Games
3
作者 Yoshihiro Tanaka Mitsuru Togashi 《American Journal of Computational Mathematics》 2021年第1期23-30,共8页
There are a few studies that focus on solution methods for finding a Nash equilibrium of zero-sum games. We discuss the use of Karmarkar’s interior point method to solve the Nash equilibrium problems of a zero-sum ga... There are a few studies that focus on solution methods for finding a Nash equilibrium of zero-sum games. We discuss the use of Karmarkar’s interior point method to solve the Nash equilibrium problems of a zero-sum game, and prove that it is theoretically a polynomial time algorithm. We implement the Karmarkar method, and a preliminary computational result shows that it performs well for zero-sum games. We also mention an affine scaling method that would help us compute Nash equilibria of general zero-sum games effectively. 展开更多
关键词 zero-sum games Nash Equilibria Karmarkar’s Method Polynomial Time
下载PDF
基于多人零和博弈的模块化机器人系统近似最优控制
4
作者 董博 朱新野 +1 位作者 马冰 安天骄 《长春工业大学学报》 CAS 2024年第2期114-124,共11页
提出一种基于多人零和博弈的模块化机器人(Modular Robot Manipulators, MRMs)系统近似最优控制方法。建立了具有交联耦合(Interconnected Dynamic Couplings, IDC)的模块化机器人系统动力学模型。将机器人系统的控制律和IDC效应作为零... 提出一种基于多人零和博弈的模块化机器人(Modular Robot Manipulators, MRMs)系统近似最优控制方法。建立了具有交联耦合(Interconnected Dynamic Couplings, IDC)的模块化机器人系统动力学模型。将机器人系统的控制律和IDC效应作为零和博弈的参与者,MRM系统的最优跟踪控制问题转化为多人零和博弈问题。根据自适应动态规划(Adaptive Dynamic Programming, ADP)算法,通过建立评判神经网络求解哈密顿-雅克比-埃塞克斯(Hamilton-Jacobi-Issacs, HJI)方程,推导出最优控制律。基于李雅普诺夫定理,证明了闭环机器人系统是渐近稳定的,最后通过实验验证了所提控制方法的有效性。 展开更多
关键词 自适应动态规划 模块化机器人 多人零和博弈 最优控制
下载PDF
面向6G的生成对抗网络研究进展综述 被引量:1
5
作者 孟婵媛 熊轲 +2 位作者 高博 张煜 樊平毅 《物联网学报》 2024年第1期1-16,共16页
人工智能(AI,artificial intelligence)与通信技术的深度融合是6G网络的典型特征。一方面,AI为6G网络发展注入了新动力,能够有效利用网络运行产生的历史数据,使网络具备自维护、自优化的功能,加速了网络智能化进程。另一方面,6G网络丰... 人工智能(AI,artificial intelligence)与通信技术的深度融合是6G网络的典型特征。一方面,AI为6G网络发展注入了新动力,能够有效利用网络运行产生的历史数据,使网络具备自维护、自优化的功能,加速了网络智能化进程。另一方面,6G网络丰富的场景和大规模的物联设备入网应用为AI提供了广阔的应用渠道和海量的训练数据,使AI能够更好地训练和部署,充分发挥AI的内在优势,为用户提供更加优质的智能服务。尽管如此,在一些实际应用中,受复杂环境的影响,存在数据样本收集困难、收集成本高和样本普适性不足等问题,难以充分发挥AI的性能优势。为此,学术界和工业界将生成对抗网络(GAN,generative adversarial network)引入无线网络的设计中,利用GAN强大的特征学习和特征表达能力产生大量模拟实际的生成样本,实现无线数据库的扩充,从而有效提升面向无线网络的AI模型的泛化能力。由于其优秀的性能表现,以GAN为代表的生成式模型在无线网络领域受到越来越多的关注,并迅速发展成为6G网络新的研究热点。首先,综述了GAN的原理及其改进衍生模型,对各种衍生模型的框架及优缺点进行了分析归纳;然后,综述了这些模型在无线网络领域的研究及应用现状;最后,面向6G网络的需求展望了GAN在6G网络中的研究趋势,为未来的研究提供了一些有价值的探索。 展开更多
关键词 生成对抗网络 无线网络 信道估计 物理层安全 无线感知 零和博弈
下载PDF
基于双人零和博弈的孤岛微电网有界L2增益负荷频率控制 被引量:1
6
作者 李寅生 王冰 +1 位作者 陈玉全 黄浩乾 《电力系统自动化》 EI CSCD 北大核心 2024年第3期93-102,共10页
针对含不确定建模误差和新能源接入的孤岛微电网,提出了一种结合有界L2增益基线控制和扰动补偿的综合负荷频率控制(LFC)方法。首先,推导了微电网的全驱模型,将建模误差和新能源的影响总结成一个综合扰动。为提高系统的鲁棒性,该综合扰... 针对含不确定建模误差和新能源接入的孤岛微电网,提出了一种结合有界L2增益基线控制和扰动补偿的综合负荷频率控制(LFC)方法。首先,推导了微电网的全驱模型,将建模误差和新能源的影响总结成一个综合扰动。为提高系统的鲁棒性,该综合扰动被定义成控制信号的对手玩家。进一步,关于扰动抑制的有界L2增益问题被等价成求解综合扰动和控制信号的零和博弈Nash均衡,由此推导出有界L2增益基线控制器。为改善频率的二次控制,设计了基于五阶广义积分观测器的扰动补偿控制,并在此基础上引入了一种针对发电速率约束(GRC)的新型抗发电速率约束(anti-GRC)措施。最后,搭建了16 MW的新能源-柴油混合微电网仿真模型,并在多种工况下对所提出的综合LFC方法进行测试,验证了其有效性。 展开更多
关键词 孤岛微电网 负荷频率控制 零和博弈 有界L2增益 扰动补偿控制 发电速率约束
下载PDF
两方零和马尔科夫博弈策略梯度算法及收敛性分析
7
作者 王卓 李永强 +1 位作者 冯宇 冯远静 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2024年第3期480-491,共12页
为了解决基于策略的强化学习方法在两方零和马尔科夫博弈中学习效率低下的问题,提出同时更新双方玩家策略的近似纳什均衡策略优化算法.将两方零和马尔科夫博弈问题描述为最大最小优化问题,针对参数化策略,给出马尔科夫博弈的策略梯度定... 为了解决基于策略的强化学习方法在两方零和马尔科夫博弈中学习效率低下的问题,提出同时更新双方玩家策略的近似纳什均衡策略优化算法.将两方零和马尔科夫博弈问题描述为最大最小优化问题,针对参数化策略,给出马尔科夫博弈的策略梯度定理,并通过近似随机策略梯度的推导,为算法实施提供可行性基础.通过比较分析不同的最大最小问题梯度更新方法,发现额外梯度相较于其他方法具有更好的收敛性能.基于这一发现,提出基于额外梯度的近似纳什均衡策略优化算法,并给出算法的收敛性证明.在Oshi-Zumo游戏上,使用表格式softmax参数化策略以及神经网络作为参数化策略,验证不同游戏规模场景下算法的有效性.通过对比实验,验证算法相对于其他方法的收敛性和优越性. 展开更多
关键词 两方零和马尔科夫博弈 强化学习 策略优化 额外梯度 纳什均衡 神经网络
下载PDF
主观社会阶层与道德判断的关系:独立型自我构念与零和博弈信念的链式中介作用
8
作者 胡汉玉 彭明 陈天龙 《心理科学》 CSCD 北大核心 2024年第3期688-694,共7页
本研究选取523名被试,进行道德判断、主观社会阶层、自我构念与零和博弈信念的测量,以探讨主观社会阶层与道德判断之间的中介机制。结果表明:(1)主观社会阶层显著正向预测功利型道德判断;(2)独立型自我构念和零和博弈信念在主观社会阶... 本研究选取523名被试,进行道德判断、主观社会阶层、自我构念与零和博弈信念的测量,以探讨主观社会阶层与道德判断之间的中介机制。结果表明:(1)主观社会阶层显著正向预测功利型道德判断;(2)独立型自我构念和零和博弈信念在主观社会阶层预测功利型道德判断中起到链式中介作用;(3)零和博弈信念在主观社会阶层和道德判断中起遮掩作用。本研究有助于研究者深入了解社会性因素影响道德判断的机制。 展开更多
关键词 主观社会阶层 自我构念 零和博弈信念 道德判断
下载PDF
Z时代青年“外佛内卷”现象的成因和对策 被引量:1
9
作者 张琳 黄闪闪 《广州开放大学学报》 2024年第1期36-40,108,109,共7页
“外佛内卷”是Z时代青年学业消极情绪中的一种重要体现。作为“佛系”与“内卷”的概念矛盾体,“外佛内卷”从多个维度呈现出不同的类型。“外佛内卷”现象是过度“内卷”的再生产,非此即彼的零和博弈思维是过度“内卷”的内因。“外... “外佛内卷”是Z时代青年学业消极情绪中的一种重要体现。作为“佛系”与“内卷”的概念矛盾体,“外佛内卷”从多个维度呈现出不同的类型。“外佛内卷”现象是过度“内卷”的再生产,非此即彼的零和博弈思维是过度“内卷”的内因。“外佛内卷”现象是假性“佛性”的新形态,应然和实然的落差是假性“佛性”的外因。实现青年群体间的良性互动,需要培养青年人的共同体思维,同时明确自我定位,做好个人规划。 展开更多
关键词 外佛内卷 零和博弈 学习共同体
下载PDF
多无人机系统在线强化学习最优安全跟踪控制 被引量:1
10
作者 弓镇宇 杨飞生 《航空科学技术》 2024年第4期25-30,共6页
在无人机(UAV)编队跟踪任务中,虚假数据注入(FDI)攻击者可向控制指令注入误导性数据,导致无人机无法形成指定的编队构型,故需设计安全编队跟踪控制器。为此,本文利用零和图博弈对攻防过程进行建模,其中FDI攻击者和安全控制器是博弈的参... 在无人机(UAV)编队跟踪任务中,虚假数据注入(FDI)攻击者可向控制指令注入误导性数据,导致无人机无法形成指定的编队构型,故需设计安全编队跟踪控制器。为此,本文利用零和图博弈对攻防过程进行建模,其中FDI攻击者和安全控制器是博弈的参与者,攻击者的目标是最大化设定的成本函数,而安全控制器的目标与之相反,求解博弈并获得最优安全控制策略依赖于求取Hamilton-Jacobi-Isaacs(HJI)方程的解。而HJI方程是耦合偏微分方程,难以直接求解,因此结合经验回放机制引入了有限时间收敛的在线强化学习算法,设计了单评价神经网络近似值函数并获得了最优安全控制策略。最终利用仿真验证了算法的有效性。 展开更多
关键词 FDI攻击 多无人机 在线强化学习 优化控制 零和图博弈
下载PDF
国际大变局背景下美国贸易政策转向及影响研究
11
作者 鲁欣 《对外经贸实务》 2024年第2期68-76,共9页
2016年美国大选后,其贸易政策格局发生了深刻变化。特朗普推行“美国优先”的保护主义政策,尤其是通过“301调查”对中国产品征税引发了美中贸易战。作为继任者,拜登政府没有推动“自由”贸易和多边贸易改革,而是继续推行前任的民族主... 2016年美国大选后,其贸易政策格局发生了深刻变化。特朗普推行“美国优先”的保护主义政策,尤其是通过“301调查”对中国产品征税引发了美中贸易战。作为继任者,拜登政府没有推动“自由”贸易和多边贸易改革,而是继续推行前任的民族主义政策,并且联合盟友对中国“脱钩断链”。文章通过对特朗普和拜登政府贸易政策的梳理,分析其政策转向的经济与地缘影响,研判美国贸易政策的未来走向,最后为我国外贸发展提出对策建议。面对如今百年未有之大变局,世界经济的相互联系比以往任何时候都更加紧密,保护主义只能使世界变得更缺乏弹性、更加不平等、更容易发生冲突。中国需要在推动“一带一路”共建、新兴市场及发展中国家合作、世贸组织改革等方面进一步发挥大国作用,为世界发展提供新机遇和新动能。 展开更多
关键词 贸易政策 产业政策 供应链 保护主义 零和博弈
下载PDF
Research on Different Heuristics for Minimax Algorithm Insight from Connect-4 Game 被引量:2
12
作者 Xiyu Kang Yiqi Wang Yanrui Hu 《Journal of Intelligent Learning Systems and Applications》 2019年第2期15-31,共17页
Minimax algorithm and machine learning technologies have been studied for decades to reach an ideal optimization in game areas such as chess and backgammon. In these fields, several generations try to optimize the cod... Minimax algorithm and machine learning technologies have been studied for decades to reach an ideal optimization in game areas such as chess and backgammon. In these fields, several generations try to optimize the code for pruning and effectiveness of evaluation function. Thus, there are well-armed algorithms to deal with various sophisticated situations in gaming occasion. However, as a traditional zero-sum game, Connect-4 receives less attention compared with the other members of its zero-sum family using traditional minimax algorithm. In recent years, new generation of heuristics is created to address this problem based on research conclusions, expertise and gaming experiences. However, this paper mainly introduced a self-developed heuristics supported by well-demonstrated result from researches and our own experiences which fighting against the available version of Connect-4 system online. While most previous works focused on winning algorithms and knowledge based approaches, we complement these works with analysis of heuristics. We have conducted three experiments on the relationship among functionality, depth of searching and number of features and doing contrastive test with sample online. Different from the sample based on summarized experience and generalized features, our heuristics have a basic concentration on detailed connection between pieces on board. By analysing the winning percentages when our version fights against the online sample with different searching depths, we find that our heuristics with minimax algorithm is perfect on the early stages of the zero-sum game playing. Because some nodes in the game tree have no influence on the final decision of minimax algorithm, we use alpha-beta pruning to decrease the number of meaningless node which greatly increases the minimax efficiency. During the contrastive experiment with the online sample, this paper also verifies basic characters of the minimax algorithm including depths and quantity of features. According to the experiment, these two characters can both effect the decision for each step and none of them can be absolutely in charge. Besides, we also explore some potential future issues in Connect-4 game optimization such as precise adjustment on heuristic values and inefficiency pruning on the search tree. 展开更多
关键词 HEURISTICS MINIMAX Algorithm zero-sum game Connect-4 game
下载PDF
零和博弈与囚徒困境:对大学参与排名的重新审思 被引量:1
13
作者 陈勇 郑润廷 《黑龙江高教研究》 北大核心 2023年第9期35-41,共7页
近日,中国人民大学宣布退出大学国际排名引发了关于大学排名的激烈讨论,在排名规则的推动下,大学在消费者市场、劳动力市场越发广泛的交集使个别高校之间发生着零和博弈,并最终演化成为整个高等教育系统的囚徒困境。关于大学排名的博弈... 近日,中国人民大学宣布退出大学国际排名引发了关于大学排名的激烈讨论,在排名规则的推动下,大学在消费者市场、劳动力市场越发广泛的交集使个别高校之间发生着零和博弈,并最终演化成为整个高等教育系统的囚徒困境。关于大学排名的博弈以越来越尖锐的形式出现,“伪造数据”“灰色交易”“挖人抢人”等现实情况频繁发生。大学在商业化的排名中已深陷泥潭,亟须外部性干预,教育行政部门应该改变以往对排名不赞成和不支持的中立态度、着力消除消费者市场中的信息不对称、加强对排名的监管、避免以排名为依据的教育资源分配。大学之用是价值尺度的问题,难以用简单的量化指标衡量,排名不能也不应该成为大学发展的指挥棒。 展开更多
关键词 零和博弈 囚徒困境 大学排名
下载PDF
两方零和马尔科夫博弈下的策略梯度算法
14
作者 李永强 周键 +1 位作者 冯宇 冯远静 《模式识别与人工智能》 EI CSCD 北大核心 2023年第1期81-91,共11页
在两方零和马尔科夫博弈中,由于玩家策略会受到另一个玩家策略的影响,传统的策略梯度定理只适用于交替训练两个玩家的策略.为了实现同时训练两个玩家的策略,文中给出两方零和马尔科夫博弈下的策略梯度定理.然后,基于该策略梯度定理,提... 在两方零和马尔科夫博弈中,由于玩家策略会受到另一个玩家策略的影响,传统的策略梯度定理只适用于交替训练两个玩家的策略.为了实现同时训练两个玩家的策略,文中给出两方零和马尔科夫博弈下的策略梯度定理.然后,基于该策略梯度定理,提出基于额外梯度的REINFORCE算法,可使玩家的联合策略收敛到近似纳什均衡.文中从多个维度分析算法的优越性.首先,在同时移动博弈游戏上的对比实验表明,文中算法的收敛性和收敛速度较优.其次,分析文中算法得到的联合策略的特点,并验证这些联合策略达到近似纳什均衡.最后,在不同难度等级的同时移动博弈游戏上的对比实验表明,文中算法在更大的难度等级下仍能保持不错的收敛速度. 展开更多
关键词 马尔科夫博弈 零和博弈 策略梯度定理 近似纳什均衡
下载PDF
基于非零和博弈的自适应人机协作系统设计
15
作者 禹鑫燚 罗惠珍 +2 位作者 史栓武 魏岩 欧林林 《高技术通讯》 CAS 2023年第11期1181-1191,共11页
为了提高人机协作的协调性,本文设计了基于非零和博弈的自适应人机协作系统,系统由互相解耦的内外环构成。在外环中,通过引入非零和博弈的方法设计人机协作策略,构建关于人力和机器人控制输入的能量函数,通过求解博弈中的纳什均衡达到... 为了提高人机协作的协调性,本文设计了基于非零和博弈的自适应人机协作系统,系统由互相解耦的内外环构成。在外环中,通过引入非零和博弈的方法设计人机协作策略,构建关于人力和机器人控制输入的能量函数,通过求解博弈中的纳什均衡达到最优控制。针对能量函数中的不确定参数,采用神经网络估计器进行更新,以估计人和机器人的力。并且通过设计神经网络函数的中心值,获得机器人控制力与跟踪误差的关系,保证控制方法的跟踪性。在更新过程中自适应调整刚度系数,实现人机柔顺协调。另外,在内环中设计了神经网络控制器,采用径向基神经网络,基于实时采集的机器人系统输入输出数据逼近控制器中未知非线性的机器人动力学模型,提高了系统跟踪精度。仿真结果验证了本文方法的有效性。 展开更多
关键词 人机协作 自适应阻抗控制 非零和博弈 神经网络
下载PDF
“双碳”目标下黄河流域城市碳排放配额两阶段分配模型
16
作者 吴凤平 韩宇飞 《中国人口·资源与环境》 CSCD 北大核心 2023年第11期33-46,共14页
黄河流域是中国实现碳减排目标的关键战略区域。在2030年碳减排目标要求下科学制定黄河流域城市碳排放配额方案,明晰沿黄地区碳排放限额的目标与责任,是黄河流域顺利实现“双碳”目标的关键所在。现有研究多要求减排地区缩减碳排放额,... 黄河流域是中国实现碳减排目标的关键战略区域。在2030年碳减排目标要求下科学制定黄河流域城市碳排放配额方案,明晰沿黄地区碳排放限额的目标与责任,是黄河流域顺利实现“双碳”目标的关键所在。现有研究多要求减排地区缩减碳排放额,忽视了黄河流域在碳达峰目标节点前仍有碳排放新增需求,“激进式”降碳会对沿黄地区的经济安全造成隐患。该研究以2030年碳减排目标任务下的黄河流域碳排放总量为控制目标,基于既保障地区公平发展又促进全局效率优化的视角,以“基础配额+新增配额”的分配思路,构建黄河流域沿线城市碳排放配额两阶段分配模型。第一阶段:根据碳排放现状基数确定基础配额;并综合考虑地区减排能力、潜力、责任以及发展需求方面的差异特征,运用熵权-TOPSIS方法分配碳排放可增长空间,预留新增配额以保障减排地区安全运行发展。第二阶段:为确保配额方案的分配效率,构建前沿技术异质性分组的零和博弈-DDF模型,在控制减排幅度、预留新增配额的同时,获得效率优化分配方案。研究发现:(1)面对2030年减排任务目标,沿黄地区仍有碳排放新增的需求与权利;同时为避免碳排放盲目冲高峰,各地区应承担“共同而有区别”的责任。其中高能耗高排放地区承担的减排压力相对较大。(2)碳排放低效地区通过碳减排提升效率时,应把握降碳的幅度力度,确保减排方案有序执行。(3)黄河流域上中下游碳排放配额分配具有空间差异性。上游地区生态保护责任繁重,应承担较高的限额责任;中下游考虑到地区经济发展需求和能源结构短期调整困难,应分配相对较高的碳排放配额确保其平稳转型。 展开更多
关键词 黄河流域 碳达峰 碳中和 碳排放配额 熵权-TOPSIS方法 零和博弈-DDF模型
下载PDF
基于鲁棒强化学习的配网潮流优化方法 被引量:1
17
作者 李晓旭 田猛 +3 位作者 朱紫阳 董政呈 龚立 王先培 《高电压技术》 EI CAS CSCD 北大核心 2023年第6期2329-2338,共10页
传统深度强化学习在优化配网潮流时易受传感器观测误差等干扰,鲁棒性较差。对此,提出一种基于鲁棒强化学习的配网潮流优化方法。首先以最小化配网网损为目标,电压、潮流越限为安全约束,建立包含分布式发电、储能及负荷单元的配网潮流优... 传统深度强化学习在优化配网潮流时易受传感器观测误差等干扰,鲁棒性较差。对此,提出一种基于鲁棒强化学习的配网潮流优化方法。首先以最小化配网网损为目标,电压、潮流越限为安全约束,建立包含分布式发电、储能及负荷单元的配网潮流优化模型。然后将干扰建模为攻击智能体,对配网潮流优化主智能体的观测状态施加扰动,构建双智能体零和博弈鲁棒强化学习模型。最后提出一种双智能体-拉格朗日乘子-信任区域策略优化算法,配网潮流优化主智能体与攻击智能体同步训练、异步学习,相互对抗博弈。仿真结果表明,通过该方法训练的配网潮流优化智能体,能在不同类型的干扰下做出安全决策,提高了配网潮流优化的鲁棒性和安全性。 展开更多
关键词 配网潮流优化 鲁棒强化学习 零和博弈 状态扰动 安全决策
下载PDF
Heston投资模型下的非零和随机微分博弈问题 被引量:1
18
作者 王婕 王秀莲 《首都师范大学学报(自然科学版)》 2023年第3期12-22,共11页
针对竞争保险公司之间的非零和随机微分博弈问题,本文假设保险公司在购买比例再保险的同时可投资于一个无风险资产和一个具有Heston随机波动率的风险资产。以2家保险公司终端财富相对差值绩效最大化为目标,通过博弈理论和动态规划原理... 针对竞争保险公司之间的非零和随机微分博弈问题,本文假设保险公司在购买比例再保险的同时可投资于一个无风险资产和一个具有Heston随机波动率的风险资产。以2家保险公司终端财富相对差值绩效最大化为目标,通过博弈理论和动态规划原理分别得到该博弈在决策者是模糊厌恶和模糊中性2种情形下的纳什均衡再保险投资策略。最后给出一个数值算例阐述参数对纳什均衡策略的影响。 展开更多
关键词 Heston过程 非零和博弈 模糊厌恶 再保险投资策略
下载PDF
电力 CPS 多阶段低代价虚假数据注入攻击方法 被引量:3
19
作者 伊娜 徐建军 +1 位作者 陈月 潘飞宇 《浙江电力》 2023年第11期39-47,共9页
随着信息和通信技术的快速发展,电力系统已发展为信息系统和物理系统深度耦合的CPS(信息物理系统),信息流与电力流的不断交互使电网面临着潜在的网络攻击风险。以PMU(相量测量单元)作为攻防目标,提出一种多阶段低代价FDIA(虚假数据注入... 随着信息和通信技术的快速发展,电力系统已发展为信息系统和物理系统深度耦合的CPS(信息物理系统),信息流与电力流的不断交互使电网面临着潜在的网络攻击风险。以PMU(相量测量单元)作为攻防目标,提出一种多阶段低代价FDIA(虚假数据注入攻击)方法。首先,构建虚假数据,确定PMU最优配置,优化攻击范围并量化攻击后果;其次,基于双人零和博弈理论求解纳什均衡点,得到博弈模型的最优攻防策略;最后,在IEEE 30节点系统上仿真,基于单阶段博弈结果,在不同攻击场景下实施多阶段低代价攻击。研究结果表明:低代价线路花费的攻击代价明显偏低,并且对电力系统的稳定运行造成了影响,验证了所提多阶段攻击模型的有效性与适用性。 展开更多
关键词 信息物理系统 虚假数据注入攻击 同步相量测量单元 双人零和博弈 多阶段攻击 攻击代价
下载PDF
最优投资与风险控制策略的多人非零和博弈及平均场博弈 被引量:2
20
作者 莫仕茵 朱怀念 《广东工业大学学报》 CAS 2023年第5期123-132,共10页
金融市场中存在大量的机构投资者,机构投资者追求高回报高财富的特性导致市场竞争日益激烈,竞争的市场环境使得机构投资者不仅追求自身财富的最大化,还关注与竞争对手之间的财富差距。本文研究多个机构投资者策略互动下的投资与风险控... 金融市场中存在大量的机构投资者,机构投资者追求高回报高财富的特性导致市场竞争日益激烈,竞争的市场环境使得机构投资者不仅追求自身财富的最大化,还关注与竞争对手之间的财富差距。本文研究多个机构投资者策略互动下的投资与风险控制问题。假设每个投资者均可以将财富投资于金融市场中以实现财富增值,同时通过购买保险等方式将面临的风险部分转移给其他金融机构。使用投资者自身财富与市场平均财富之差描述的相对业绩刻画市场竞争,投资者的目标是最大化终端时刻相对绩效的期望效用,在非零和博弈框架下构建了多人投资与风险控制博弈模型,以CARA效用函数为例,运用随机微分博弈理论和平均场博弈理论求出Nash均衡状态下的最优投资与风险控制策略,并进行参数的敏感性分析。研究发现:竞争将导致风险投资攀升,风险控制减弱,从而导致金融市场的系统性风险增加;机构投资者自身及竞争对手的风险偏好和市场竞争程度均会影响均衡投资与风险控制策略;盈余波动影响风险控制策略发生同向改变,但这种影响在波动轻微时较为明显,当波动超过一定程度时,波动对风险控制策略影响甚微。研究为机构投资者的投资与风险控制策略选择提供了有益指导。 展开更多
关键词 投资与风险控制 非零和博弈 平均场博弈 NASH均衡 动态规划
下载PDF
上一页 1 2 12 下一页 到第
使用帮助 返回顶部