面向MEC多智能体协同任务卸载的深度强化学习算法

A Deep Reinforcement Learning Algorithm for Multi-agent Collaborative Task Offloading in MEC

下载PDF

导出

摘要针对移动边缘计算中的多用户协同任务卸载场景,提出了一种基于深度强化学习的多智能体协同任务卸载算法(Deep Reinforcement Learning-based Multi-agent Collaborative Task Offloading Algorithm,MCTO-DRL)。考虑到用户移动性、协同性、任务动态优先级以及资源受限等问题,构建了一种多用户协同任务卸载的网络模型。在此基础上建立了端到端优化目标函数,并利用马尔可夫决策过程(Markov Decison Processes,MDP)形式化多任务协同卸载问题。利用双向长短期记忆(Bidirectional Long Short-Term Memory,Bi-LSTM)网络提取状态向量动态时序依赖关系的特征信息,结合强化学习方法建立高维状态与动作之间的关系映射,并设计了一种动态优先级协同采样算法,用于提高多智能体的协同性。实验分析表明,在多智能体协同任务卸载场景中,MCTO-DRL算法最优卸载概率达到86%以上,时隙累积奖励较4种基线算法分别提升约20.0%、16.23%、22.0%、9.44%,并能够适应不同复杂性和需求型的卸载任务。 A deep reinforcement learning based multi-agent collaborative task offloading algorithm(MCTO-DRL)is proposed for the multi-user collaborative task offloading scenario in mobile edge Considering computing.the problems of user mobility,collaboration,task dynamic priority and resource constraints,a multi-user collaborative task offloading network model is constructed.On this base,the end-to-end optimization objective function is established,and the multi-task collaborative offloading problem is formalized by using Markov decision processes(MDP).The bidirectional long short-term memory(Bi-LSTM)network is used to extract the feature information of the dynamic time-series dependency of the state vector.Combined with reinforcement learning method,the relationship mapping between high-dimensional state and action is established,and a dynamic priority collaborative sampling algorithm is designed to improve the collaboration of multi-agent.The experimental analysis shows that in the multi-agent collaborative task offloading scenario,the optimal offloading probability of MCTO-DRL algorithm reaches more than 86%.Compared with that of the four baseline algorithms,the time slot cumulative reward is increased by about 20.0%,16.23%,22.0%and 9.44%,respectively.And it can adapt to offloading tasks with different complexity and requirements.

作者张茜苏冬冬张聪李润川 ZHANG Qian;SU Dongdong;ZHANG Cong;LI Runchuan(School of Artificial Intelligence,Zhongyuan University of Zhengzhou Technology,450007,China;School of Computer Science,Zhongyuan University of Zhengzhou Technology,450007,China;Jiangxing Intelligence Inc.,Shenzhen 518100,China)

机构地区中原工学院人工智能学院中原工学院计算机学院深圳江行联加智能科技有限公司

出处《电讯技术》北大核心 2024年第11期1750-1757,共8页 Telecommunication Engineering

基金河南省科技攻关计划项目(242102211046) 河南省高等学校重点科研项目(25A520039,24B520048) 中原工学院优势学科实力提升计划资助(SD202230) 中原工学院研究生教育教学改革研究项目(JG202424,JG202328) 中原工学院基本科研业务费专项资金项目(K2022QN021)。

关键词移动边缘计算深度强化学习协同卸载双向长短期记忆(Bi-LSTM)网络 mobile edge computing deep reinforcement learning collaborative offloading long short-term memory(Bi-LSTM)network

分类号 TN929.5 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献4

1薛宁,霍如,曾诗钦,汪硕,黄韬.基于DRL的MEC任务卸载与资源调度算法[J].北京邮电大学学报,2019,42(6):64-69. 被引量：6
2邝祝芳,陈清林,李林峰,邓晓衡,陈志刚.基于深度强化学习的多用户边缘计算任务卸载调度与资源分配算法[J].计算机学报,2022,45(4):812-824. 被引量：37
3蔡星娟,郭彦亨,赵天浩,张文生.基于进化多任务的边缘计算服务部署和任务卸载[J].计算机工程,2023,49(7):1-9. 被引量：7
4鲜永菊,刘闯,韩瑞寅,陈万琼.超密集网络中基于MEC的动态任务卸载方案[J].电讯技术,2023,63(6):757-767. 被引量：1

二级参考文献11

1孟浩,霍如,郭倩影,黄韬,刘韵洁.基于机器学习的MEC随机任务迁移算法[J].北京邮电大学学报,2019,42(2):25-30. 被引量：9
2宋朋涛,李超,徐莉婷,梁晓峣.基于个人计算机的智能家居边缘计算系统[J].计算机工程,2017,43(11):1-7. 被引量：29
3谷晓会,章国安,孔德尚.基于SDN和MEC的5G VANET架构及其性能分析[J].电讯技术,2019,59(11):1332-1337. 被引量：11
4Tianchu Zhao,Sheng Zhou,Linqi Song,Zhiyuan Jiang,Xueying Guo,Zhisheng Niu.Energy-Optimal and Delay-Bounded Computation Offloading in Mobile Edge Computing with Heterogeneous Clouds[J].China Communications,2020,17(5):191-210. 被引量：24
5余翔,石雪琴,刘一勋.移动边缘计算中卸载策略与功率的联合优化[J].计算机工程,2020,46(6):20-25. 被引量：16
6杨天,田霖,孙茜,张宗帅,王园园.移动边缘计算中基于用户体验的计算卸载方案[J].计算机工程,2020,46(10):33-40. 被引量：9
7蔡星娟,胡钊鸣,张志霞,王茜,崔志华,张文生.基于高维多目标优化的多无人机协同航迹规划[J].中国科学：信息科学,2021,51(6):985-996. 被引量：16
8Samrat Nath,Jingxian Wu.Deep reinforcement learning for dynamic computation offloading and resource allocation in cache-assisted mobile edge computing systems[J].Intelligent and Converged Networks,2020,1(2):181-198. 被引量：21
9陈清林,邝祝芳.基于DDPG的边缘计算任务卸载和服务缓存算法[J].计算机工程,2021,47(10):26-33. 被引量：13
10Gang Li,Jingbo Miao,Zihou Wang,Yanni Han,Hongyan Tan,Yanwei Liu,Kun Zhai.An Adaptive User Service Deployment Strategy for Mobile Edge Computing[J].China Communications,2022,19(10):238-249. 被引量：1

共引文献47

1周振.基于边缘云计算的数据智能云平台技术研究[J].信息与电脑,2021,33(9):25-27. 被引量：3
2姜姗,朱红磊,曹莉.云计算环境下混合式思政教育资源均衡分配方法[J].信息与电脑,2022,34(21):239-241.
3张文柱,余静华.移动边缘计算中基于云边端协同的任务卸载策略[J].计算机研究与发展,2023,60(2):371-385. 被引量：12
4冯北鹏,黄昱泽,曹宇慧,郭珍珍.基于深度强化学习的移动边缘计算资源分配策略[J].信息与电脑,2023,35(1):44-46. 被引量：1
5桑永宣,魏江坡,王博,宋莹.具有边缘缓存机制的混合启发式任务卸载算法[J].计算机工程,2023,49(4):149-158. 被引量：2
6陈星延,张雪松,谢志龙,赵宇,吴钢.面向“云-边-端”算力系统的计算和传输联合优化方法[J].计算机研究与发展,2023,60(4):719-734. 被引量：3
7张立博,李昌伟,齐伟,王刚,戚鲁凤.神经网络训练处理器的浮点运算优化架构[J].计算机测量与控制,2023,31(6):176-182.
8李晗,孟顺梅,蔡志成.基于博弈论和粒子群优化的移动边缘计算任务卸载方法[J].应用科学学报,2023,41(3):405-418. 被引量：1
9赖丹晖,罗伟峰,黄建华.基于边缘计算的混合储能多微电网功率自适应控制[J].电力大数据,2023,26(4):28-35. 被引量：1
10尚绍法,蒋林,李远成,朱筠.异构平台下卷积神经网络推理模型自适应划分和调度方法[J].计算机应用,2023,43(9):2828-2835. 被引量：3

1包丹文,姚馨宇,刘建荣,陈卓,周佳怡.基于动态优先级的机坪车辆避冲突运行规划方法[J].华东交通大学学报,2024,41(4):99-107.
2胡琳,王思民.政策工具视角下我国公共卫生应急管理政策文本量化分析[J].西部学刊,2024(21):37-40.
3李方昱,刘金溢,黄琰婷,韩红桂.基于深度强化学习的多智能体分布式事件触发优化控制[J].中国科学：技术科学,2024,54(10):1991-2002.
4钟云华,黄小宾.大学生创业失败修复扶持政策的现状审思与发展理路——基于政策工具分析视角[J].贵州师范大学学报（社会科学版）,2024(6):101-113.
5赵琳,王明慧,王丽颖.基于二维分析框架的我国普惠型商业医疗保险政策文本分析[J].中国公共卫生管理,2024,40(5):651-654.
6Sun Gangcan,Sun Jiwei,Hao Wanming,Zhu Zhengyu,Ji Xiang,Zhou Yiqing.Secure Computation Efficiency Resource Allocation for Massive MIMO-Enabled Mobile Edge Computing Networks[J].China Communications,2024,21(11):150-162.
7李苏慧.体育产业与数字经济融合效应分析——基于区域投入产出视角[J].产业创新研究,2024(19):90-92.
8许曼晨,于镝,赵理,郭陈栋.基于MAPPO的无信号灯交叉口自动驾驶决策[J].吉林大学学报（信息科学版）,2024,42(5):790-798.
9刘伟,范旭.政策工具视阈下中国基础研究发展政策的优化探究——基于36份政策文本的量化分析[J].科技智囊,2024(10):31-38.
10Yang Jie,He Jingchao,Cheng Nan,Yin Zhisheng,Han Dairu,Zhou Conghao,Sun Ruijin.Multilayer Satellite Network Collaborative Mobile Edge Caching:A GCN-Based Multi-Agent Approach[J].China Communications,2024,21(11):56-74.

电讯技术

2024年第11期

浏览历史

内容加载中请稍等...

面向MEC多智能体协同任务卸载的深度强化学习算法

参考文献4

二级参考文献11

共引文献47

相关作者

相关机构

相关主题

浏览历史