期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
SC2LE场景下基于QMIX算法的多智能体协同控制
被引量:
1
1
作者
方星辰
崔鹏
王庆领
《指挥信息系统与技术》
2021年第2期21-26,共6页
为了解决多智能体协同控制中高维状态空间与环境部分可观测的问题,研究了中心式训练分布式执行框架在多智能体强化学习中的实现方法,以及复杂场景下传统强化学习算法,并采用带注意力机制的QMIX算法实现了协同控制。以星际争霸2学习环境(...
为了解决多智能体协同控制中高维状态空间与环境部分可观测的问题,研究了中心式训练分布式执行框架在多智能体强化学习中的实现方法,以及复杂场景下传统强化学习算法,并采用带注意力机制的QMIX算法实现了协同控制。以星际争霸2学习环境(SC2LE)为基础的小场景中,将多个作战单位作为多智能体进行协同控制并加以试验验证。试验结果表明,与其他多智能体强化学习算法相比,带注意力机制的QMIX算法能够得到收敛的训练模型,可获得较好的协同控制效果。
展开更多
关键词
多智能体强化学习
qmix算法
注意力机制
SC2LE
下载PDF
职称材料
基于QMix的车辆云计算资源动态分配方法
被引量:
2
2
作者
刘金石
Manzoor Ahmed
林青
《计算机工程》
CAS
CSCD
北大核心
2022年第11期284-290,298,共8页
城市交通智能化和通信技术的进步会产生大量基于车辆的应用,但目前车辆有限的计算资源无法满足车辆应用的计算需求与延迟性约束。车辆云(VC)可以高效地调度资源,从而显著降低任务请求的延迟与传输成本。针对VC环境下任务卸载与计算资源...
城市交通智能化和通信技术的进步会产生大量基于车辆的应用,但目前车辆有限的计算资源无法满足车辆应用的计算需求与延迟性约束。车辆云(VC)可以高效地调度资源,从而显著降低任务请求的延迟与传输成本。针对VC环境下任务卸载与计算资源分配问题,提出一个考虑异质车辆和异质任务的计计资源分配算法。对到达的任务构建M/M/1队列模型与计算模型,并定义一个效用函数以最大化系统整体效用。针对环境中车辆地理分布的高度动态系统变化,提出基于双时间尺度的二次资源分配机制(SRA),使用两个不同时间尺度的资源分配决策动作,对其分别构建部分可观测马尔可夫决策过程。两个决策动作通过执行各自的策略获得的奖励进行连接,将问题建模为两层计算资源分配问题。在此基础上提出基于二次资源分配机制的多智能体算法SRA-QMix求解最优策略。仿真结果表明,与深度确定性策略梯度算法对比,该算法的整体效用值和任务完成率分别提高了70%、6%,对于QMix和MADDPG算法分别应用SRA后的任务完成率分别提高了13%与15%,可适用于动态的计算资源分配环境。
展开更多
关键词
车辆云
多智能体强化学习
qmix算法
任务卸载
排队理论
下载PDF
职称材料
题名
SC2LE场景下基于QMIX算法的多智能体协同控制
被引量:
1
1
作者
方星辰
崔鹏
王庆领
机构
东南大学自动化学院
中国电子科技集团公司第二十八研究所
出处
《指挥信息系统与技术》
2021年第2期21-26,共6页
基金
国家自然科学基金(61973074)
国家重点研发计划(2018AAA0101400)
+1 种基金
信息系统工程重点实验室基金(05201902)
中央高校基本科研业务费专项资助项目。
文摘
为了解决多智能体协同控制中高维状态空间与环境部分可观测的问题,研究了中心式训练分布式执行框架在多智能体强化学习中的实现方法,以及复杂场景下传统强化学习算法,并采用带注意力机制的QMIX算法实现了协同控制。以星际争霸2学习环境(SC2LE)为基础的小场景中,将多个作战单位作为多智能体进行协同控制并加以试验验证。试验结果表明,与其他多智能体强化学习算法相比,带注意力机制的QMIX算法能够得到收敛的训练模型,可获得较好的协同控制效果。
关键词
多智能体强化学习
qmix算法
注意力机制
SC2LE
Keywords
multi-agent reinforcement learning
qmix
algorithm
attention mechanism
StarCraft Ⅱ learning environment(SC2LE)
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
基于QMix的车辆云计算资源动态分配方法
被引量:
2
2
作者
刘金石
Manzoor Ahmed
林青
机构
青岛大学计算机科学技术学院
出处
《计算机工程》
CAS
CSCD
北大核心
2022年第11期284-290,298,共8页
基金
国家重点研发计划重点专项(2018YFB2100303)
国家自然科学基金(61802216)
+1 种基金
山东省高等学校青创科技计划创新团队项目(2020KJN011)
山东省自然科学基金(ZR2020MF060)。
文摘
城市交通智能化和通信技术的进步会产生大量基于车辆的应用,但目前车辆有限的计算资源无法满足车辆应用的计算需求与延迟性约束。车辆云(VC)可以高效地调度资源,从而显著降低任务请求的延迟与传输成本。针对VC环境下任务卸载与计算资源分配问题,提出一个考虑异质车辆和异质任务的计计资源分配算法。对到达的任务构建M/M/1队列模型与计算模型,并定义一个效用函数以最大化系统整体效用。针对环境中车辆地理分布的高度动态系统变化,提出基于双时间尺度的二次资源分配机制(SRA),使用两个不同时间尺度的资源分配决策动作,对其分别构建部分可观测马尔可夫决策过程。两个决策动作通过执行各自的策略获得的奖励进行连接,将问题建模为两层计算资源分配问题。在此基础上提出基于二次资源分配机制的多智能体算法SRA-QMix求解最优策略。仿真结果表明,与深度确定性策略梯度算法对比,该算法的整体效用值和任务完成率分别提高了70%、6%,对于QMix和MADDPG算法分别应用SRA后的任务完成率分别提高了13%与15%,可适用于动态的计算资源分配环境。
关键词
车辆云
多智能体强化学习
qmix算法
任务卸载
排队理论
Keywords
Vehicular Cloudlet(VC)
Multi-Agent Reinforcement Learning(MARL)
qmix
algorithm
task offloading
queuing theory
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
SC2LE场景下基于QMIX算法的多智能体协同控制
方星辰
崔鹏
王庆领
《指挥信息系统与技术》
2021
1
下载PDF
职称材料
2
基于QMix的车辆云计算资源动态分配方法
刘金石
Manzoor Ahmed
林青
《计算机工程》
CAS
CSCD
北大核心
2022
2
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部