-
题名基于SA-FQL算法的区域交通控制方法
被引量:6
- 1
-
-
作者
邓军
刘智勇
-
机构
五邑大学信息学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2010年第27期231-233,237,共4页
-
基金
广东省自然科学基金No.8152902001000014
广东省高等学校自然科学重点研究项目(No.05Z025)~~
-
文摘
将模拟退火算法的Metropolis准则用于平衡模糊Q学习中探索和扩张之间的关系,提出基于Metropolis准则的模糊Q学习算法Simulated Annealing Fuzzy Q-learning(SA-FQL)。利用SA-FQL算法优化区域的公共周期,在给定周期的基础上再用SA-FQL算法优化区域中各干线相邻两路口的相位差,最后根据交通流量确定各路口的绿信比。TSIS仿真结果表明,相比基于Q学习和模糊Q学习的控制方法,该方法能显著提高学习速度和交通效率。
-
关键词
区域交通控制
模拟退火模糊q学习算法
模糊q学习
q学习
METROPOLIS准则
-
Keywords
area traffic control
Simulated Annealing Fuzzy q-Learning (SA-FqL)
fuzzy q-leaming
q-leaming
Metropolis criterion
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于DP-SAMQ行为树的智能体决策模型研究
被引量:2
- 2
-
-
作者
陈妙云
王雷
丁治强
-
机构
中国科学技术大学信息科技学院
-
出处
《计算机仿真》
北大核心
2021年第2期301-307,共7页
-
基金
中科院创新基金(高技术项目CXJJ-17-M139)
中科院重大专项课题(KGFZD-135-18-027)。
-
文摘
在多智能体仿真中使用行为树进行决策具有直观、易扩展等优点,但行为树的设计过程过于复杂,人工调试时效率低下。引入Q-Learning来实现行为树的自动设计。为解决传统Q-Learning的收敛速度慢的问题,将模拟退火算法中的Metropolis准则应用到动作选择策略中,随着学习过程自适应改变次优动作的选择概率以及将动态规划思想应用到Q值更新策略。实验结果证明,基于改进的多步Q-Learning行为树的智能体决策模型具有更快的收敛速度,并且能够实现行为树的自动设计和优化。
-
关键词
多智能体
行为树
模拟退火
动态规划
用动态规划和模拟退火改进的多步q学习
-
Keywords
Multi-agent
Behavior tree
Simulated annealing
Dynamic programming
DP-SAMq
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名计及碳排放权交易的发电商报价策略研究
被引量:3
- 3
-
-
作者
葛炬
罗莎莎
蔡学文
-
机构
华北电力大学电气与电子工程学院
-
出处
《现代电力》
北大核心
2012年第2期80-84,共5页
-
基金
中央高校基本科研业务费专项资金资助(11MG02)
-
文摘
基于agent的市场仿真方法描绘了存在二氧化碳排放权交易的市场环境下发电商的报价博弈过程,采用模拟退火Q学习算法模拟了发电商追求利润最大的行为,并给出了市场出清结果,进而分析了碳排放权交易机制对电力市场运营的影响。仿真计算表明,计及二氧化碳排放权交易后,agent发电商能够根据状态改变以利润最大为目标做出有利的报价决策,实施碳排放权交易会促进清洁能源的发展。
-
关键词
碳排放权交易
报价策略
AGENT
模拟退火q学习
电力市场
-
Keywords
carbon emission rights trading
bidding strategy
agent
simulated annealing q-Learning algorithm
electricity market
-
分类号
TM76
[电气工程—电力系统及自动化]
-