面向伙伴选择的模糊Markov博弈控制及仿真研究被引量：1

Study on Fuzzy Markov Game Controller for Partner Selection Management Simulation

下载PDF

导出

摘要针对不确定条件下的伙伴选择决策问题,把自适应模糊控制系统理论及神经网络理论引入到Markov博弈中,提出一种基于多智能体的伙伴选择模糊控制模型。该模型引入基于ANFIS和神经网络的模糊神经网络,实现了一种全新的进行值函数逼近的梯度下降Q学习的算法。并应用该模型对伙伴选择问题进行研究,对多影响因素进行FNN学习,将输出量作为标准Markov博弈模型的输入量,得到影响的策略,最后研究了一个应用实例,利用具体历史数据对建模方法和模型进行了验证和分析。 According to partner selection under uncertain conditions, a multi-agent fuzzy Markov game controller was proposed based on adaptive neuron-fuzzy inference system （ANFIS）, neural network and Markov game. Fuzzy neural network was used as value function approximators. In this model, FNN was used to train the factors which influenced the partner selection and the results of FNN was taken as the input for the standard Markov game while the finial policy was taken as the output. A case was studied and the simulation model was validated by historic data.

作者王惠符策谢益武许瑞雪杨小佳

机构地区大连海事大学经济与管理学院

出处《系统仿真学报》 EI CAS CSCD 北大核心 2007年第15期3572-3576,共5页 Journal of System Simulation

基金国家自然科学基金(70540005)

关键词伙伴选择多智能体自适应模糊控制系统神经网络 Markov博弈 Q学习 partner selection multi-agent ANFIS neural network Markov Game Q learning

分类号 TP391.9 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献17

1杜春侠,高云,张文.多智能体系统中具有先验知识的Q学习算法[J].清华大学学报（自然科学版）,2005,45(7):981-984. 被引量：21
2Littman Michael L.Friend or foe Q-learning in General-sum Markov Games[C]//18th International Conference on Machine Learning.MA:MIT press,2001:322-328.
3Watkins C.Technical note:Q-learning[J].Machine Learning (S0885-6125),1992,8:279-292.
4Littman Michael L.Markov Game as a framework for multi-agent reinforcement learning[C]//11th International Conference on Machine Learning,San Francisco:Morgan Kaufman Publishers,1994:1023-1036.
5Haddaid A Sundermeyer.KBDI agent architectures,0' Hare GMP[C]// Jennings Foundations of DA,New York:John Wiley & Sons,1996:169-185.
6Abolpour B,Javan M,Karamouz M.Water allocation improvement in river basin using Adaptive Neural Fuzzy Reinforcement Learning Approach[J].Applied Soft Computing (S1568-4946),2005,6:21-31.
7李蔚恒,王庆林,李彦志,杨承志.SUGENO型网络在空战CGF战术决策中的应用[J].系统仿真学报,2007,19(6):1274-1276. 被引量：1
8Gavin A.Problem Solving with Reinforcement Learning[D].PHD thesis.Cambridge University Engineering Department,1995.
9Zhang G,Peter Times series forecasting using a hybrid ARIMA and neural network model[J].Neural Computing (S0899-7667),2003,28(12):159-175.
10徐昕,贺汉根.神经网络增强学习的梯度算法研究[J].计算机学报,2003,26(2):227-233. 被引量：21

二级参考文献60

1叶志伟,郑肇葆.蚁群算法中参数α、β、ρ设置的研究——以TSP问题为例[J].武汉大学学报（信息科学版）,2004,29(7):597-601. 被引量：154
2王晓远,丁亚明,朱更明.无刷双馈电机矢量解耦控制方法的研究[J].湖南科技大学学报（自然科学版）,2004,19(2):67-69. 被引量：5
3于功弟.DSS的新决策方法——模糊决策法的应用[J].计算机工程,1993,19(2):20-23. 被引量：2
4姚建明,蒲云.基于动态生产能力约束的MC模式下供应链调度优化[J].系统工程,2005,23(2):25-30. 被引量：20
5孙增圻,徐红兵.基于T-S模型的模糊神经网络[J].清华大学学报（自然科学版）,1997,37(3):76-80. 被引量：85
6MitchellTM著曾华军张银奎译.机器学习[M].北京:机械工业出版社,2003..
7TimothyJRoss.模糊逻辑及其工程应用[M].北京:电子工业出版社,2001.73-109.
8Han-Xiong Li, Shaocheng Tong. A hybrid adaptive fuzzy control for a class of nonlinear MIMO systems[J]. IEEE Transactions on Fuzzy Systems, 2003,11(1):24-34.
9Chunshien Li, Chun-Yi Lee. Self-organizing neuro-fuzzy system for control of unknown plants[J]. IEEE Transactions on Fuzzy Systems, 2003, 11(1) : 135-150.
10Chi-Hsu Wang; Han-Leih Liu; Tsung-Chih Lin. Direct adaptive fuzzy-neural control with state observer and supervisory controller for unknown nonlinear dynamical systems [J]. IEEE Transactions on Fuzzy Systems, 2002, 10(1) : 39-49.

共引文献128

1王乐,王歆涛,陈静雯,王阳,张淑秘.基于1D/3D的运行起始期对地下水源能量利用系统性能的影响分析[J].产业与科技论坛,2019,0(19):74-75.
2陈瑶,殷璐,王亚虹.供应链管理研究综述及展望[J].广东经济,2017,0(7X):170-171.
3郭晓军,杨建军,李红卫.Agent仿真中具有先验知识的混合学习算法与混合结构模型[J].海军航空工程学院学报,2007,22(2):247-251.
4许宪东,洪炳镕,朴松昊,刘强.一种仿人机器人行走距离预测方法[J].华中科技大学学报（自然科学版）,2011,39(S2):298-301.
5ZHOU Han,HU TianJiang,XIE HaiBin,ZHANG DaiBing,SHEN LinCheng.Computational and experimental study on dynamic behavior of underwater robots propelled by bionic undulating fins[J].Science China(Technological Sciences),2010,53(11):2966-2971. 被引量：12
6董沛武,刘微微,娄岩峰.基于遗传算法和神经网络的企业核心竞争力评价模型研究[J].兵工学报,2009,30(S1):114-118. 被引量：6
7马飞,吴梦娜,孙宝凤,杨华.大规模定制下的供应链调度建模与仿真[J].吉林大学学报（工学版）,2009,39(S2):337-340. 被引量：2
8王学宁,徐昕,吴涛,贺汉根.策略梯度强化学习中的最优回报基线[J].计算机学报,2005,28(6):1021-1026. 被引量：6
9何涛,白振兴.多智能体系统设计的关键技术研究[J].现代电子技术,2006,29(14):31-34. 被引量：2
10周昌能,余雪丽.基于BP网络的权值更新快速收敛算法[J].计算机应用,2006,26(8):1940-1942. 被引量：6

同被引文献11

1张宸,林启太.模糊马尔科夫链状预测模型及其工程应用[J].武汉理工大学学报,2004,26(11):63-66. 被引量：19
2苗作华,刘耀林,王海军.耕地需求量预测的加权模糊-马尔可夫链模型[J].武汉大学学报（信息科学版）,2005,30(4):305-308. 被引量：21
3陈淑燕,王炜,瞿高峰.短时交通量时间序列的小波分析-模糊马尔柯夫预测方法[J].东南大学学报（自然科学版）,2005,35(4):637-640. 被引量：8
4姜学鹏,徐志胜,冷彬.火灾预测的模糊马尔柯夫模型[J].灾害学,2006,21(3):27-32. 被引量：15
5梁桂兰,徐卫亚.模糊马尔科夫链状模型在斜坡稳定性预测中的应用[J].中国地质灾害与防治学报,2006,17(4):64-67. 被引量：10
6巴鲁查-赖特A T.杨纪珂,吴立德,译.马尔柯夫过程论初步及其应用[M].上海:上海科学技术出版社,1979.
7陈世全,郭嗣琮.模糊预测[M].贵阳:贵州科技出版社,1994.
8陈珺,刘飞.具有输入约束的模糊Markov跳变系统H_∞控制[J].系统工程与电子技术,2007,29(11):1917-1921. 被引量：1
9方红.模糊马尔可夫预测法在空气质量评价中的应用[J].气象与环境学报,2008,24(1):60-62. 被引量：8
10谢建文,张元标,王志伟.基于无偏灰色模糊马尔可夫链法的铁路货运量预测研究[J].铁道学报,2009,31(1):1-7. 被引量：30

引证文献1

1郭嗣琮,余岚.三种模糊Markov链状预测模型[J].辽宁工程技术大学学报（自然科学版）,2011,30(3):459-463. 被引量：3

二级引证文献3

1张超,贾凤亭.Markov链的组合预测及其应用[J].辽宁工程技术大学学报（自然科学版）,2011,30(6):963-966. 被引量：4
2张向东,王帅,赵阳豪.模糊Markov自动预测程序在辽河泥沙含量预测中的应用[J].清华大学学报（自然科学版）,2014,54(7):859-864. 被引量：2
3郭杰,董秀成,皮光林.突发性天然气供应中断的应急决策[J].天然气工业,2015,35(3):129-134. 被引量：4

1张天平.一类大系统的分散自适应模糊滑模控制[J].自动化学报,1998,24(6):747-753. 被引量：10
2张勇,谭小彬,崔孝林,奚宏生.基于Markov博弈模型的网络安全态势感知方法[J].软件学报,2011,22(3):495-508. 被引量：109
3刘晓南,刘斌.动态任务分配虚拟企业生产调度研究[J].自动化仪表,2011,32(1):39-41. 被引量：1
4刘文芬,张树伟,龚心.一种优化的基于Markov博弈理论的网络风险评估方法[J].电信科学,2014,30(7):13-18. 被引量：8
5孙衢,李人厚.一种鲁棒稳定的自适应模糊控制系统的设计[J].控制与决策,2000,15(6):641-644. 被引量：2
6张建民,张建文.自适应模糊炉温控制系统[J].基础自动化,2001,8(2):21-22. 被引量：5
7廉文利,王秀英,姜波.自适应模糊控制器在跳汰机自动排料系统中应用[J].煤矿机械,2008,29(7):162-164. 被引量：1
8曹梦龙,刘川来,王乾.基于参考模型的自适应模糊控制系统设计与仿真[J].青岛科技大学学报（自然科学版）,2005,26(1):82-84. 被引量：2
9李艳,黄光球,张斌.动态攻击网络Markov演化博弈安全分析模型[J].计算机科学与探索,2016,10(9):1272-1281. 被引量：4
10陈龙,李德超,周孔亢.自适应模糊控制技术在半主动悬架控制中的应用[J].农业机械学报,2005,36(4):5-8. 被引量：9

系统仿真学报

2007年第15期

浏览历史

内容加载中请稍等...

面向伙伴选择的模糊Markov博弈控制及仿真研究被引量：1

参考文献17

二级参考文献60

共引文献128

同被引文献11

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

面向伙伴选择的模糊Markov博弈控制及仿真研究 被引量：1

参考文献17

二级参考文献60

共引文献128

同被引文献11

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

面向伙伴选择的模糊Markov博弈控制及仿真研究被引量：1