基于强化学习的边缘计算网络资源在线分配方法被引量：12

Reinforcement learning-based online resource allocation for edge computing network

导出

摘要针对边缘计算应用对实时性的要求,引入软件定义网络和网络功能虚拟化技术对边缘计算网络进行重构.基于此,考虑以最大化长期平均实时任务处理成功率为目标的计算和通信资源在线分配问题.通过建立马尔可夫决策过程模型,提出基于Q学习的资源在线分配方法.Q学习在状态动作空间较大时内存占用大且会发生维度灾难,鉴于此,进一步提出基于DQN的资源在线分配方法.实验结果表明,所提出算法能够较快收敛,且DQN算法相较于Q学习和其他基准方法能够获得更高的实时任务处理成功率. To meet the real-time requirement of the edge computing applications,technologies of software defined network and network function virtualization are introduced to reconstruct the edge computing network.On this basis,we consider the design of online computing and communication resource allocation method,aiming at maximizing the longterm average probability of successfully processing the real-time tasks.By establishing a Markov decision process framework,an online resource allocation method based on Q-learning is proposed.Nevertheless,Q-learning occupies a lot of memory when the state action space is large,and it is prone to dimensional disasters.Therefore,a DQN-based online resource allocation method is proposed.Simulation results show that both proposed algorithms converge quickly and the average probability of successfully processing the real-time tasks achieved by the DQN algorithm is the highest among all the baseline algorithms.

作者李燕君蒋华同高美惠 LI Yan-jun;JIANG Hua-tong;GAO Mei-hui(School of Computer Science and Technology,Zhejiang University of Technology,Hangzhou 310023,China)

机构地区浙江工业大学计算机科学与技术学院

出处《控制与决策》 EI CSCD 北大核心 2022年第11期2880-2886,共7页 Control and Decision

基金国家自然科学基金项目(61772472) 浙江省自然科学基金项目(LZ21F020005) 浙江省属高校基本科研业务费专项资金项目(RF-A2019002)。

关键词边缘计算资源分配实时任务马尔可夫决策过程 Q学习深度强化学习 edge computing resource allocation real-time task Markov decision process Q-learning deep reinforcement learning

分类号 TP273 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献1

1陈加法,赵宜升,高锦程,陈忠辉.基于混合能量收集的移动边缘计算系统资源分配策略[J].重庆邮电大学学报（自然科学版）,2021,33(2):193-201. 被引量：8

二级参考文献3

1简琤峰,裘科意,张美玉.一种面向边缘计算QoE的服务组合及调度方法[J].小型微型计算机系统,2019,40(7):1397-1403. 被引量：10
2刘通.双层边缘计算结构中最小化功率开销的任务卸载策略[J].重庆理工大学学报（自然科学）,2019,33(8):157-164. 被引量：2
3王璐瑶,张文倩,张光林.多用户移动边缘计算迁移的能量管理研究[J].物联网学报,2019,3(1):73-81. 被引量：1

共引文献7

1杨柳青,王冲.基于特征信息定位的Web服务资源均衡分配模型[J].计算机与数字工程,2022,50(9):2005-2011. 被引量：1
2李长云,黎建波,徐曦,李亭立.具有能量收集设备的移动边缘计算资源分配研究[J].系统仿真学报,2022,34(11):2313-2322. 被引量：2
3高丽雪,陈昕,殷波.6G重叠区域中基于博弈论的任务卸载策略[J].计算机科学,2023,50(5):302-312.
4卜理超,李恺,冯文倩.基于5G的MEC系统资源分配方法[J].信息与电脑,2023,35(7):104-106. 被引量：1
5陈涛,冯德品,徐兵,姬帅,赵中华.基于改进自适应量子行为粒子群算法的交直流混合配电网协调优化方法[J].山东电力技术,2023,50(7):13-22. 被引量：2
6王宏杰,徐胜超,陈刚,杨波,毛明扬.基于萤火虫算法的移动边缘计算网络带宽优化策略[J].计算机测量与控制,2023,31(11):280-285. 被引量：2
7蒋鹏,富爽,丁晨阳.多设备多任务场景下基于改进粒子群优化的计算卸载策略[J].黑龙江八一农垦大学学报,2024,36(1):98-107.

同被引文献95

1吴毅凌,李红滨,赵玉萍.一种适用于时不变信道的信道估计方法[J].高技术通讯,2010,20(1):1-7. 被引量：1
2侯艳丽,苏佳,胡佳伟.基于有限反馈机会波束的无线传感器网络[J].传感器与微系统,2014,33(2):57-60. 被引量：1
3吴腾宇,陈嘉俊,蹇洁,余海燕.O2O模式下的配送车辆实时取送货路径选择问题[J].系统工程理论与实践,2018,38(11):2885-2891. 被引量：19
4陈艳,王子健,赵泽,李栋,崔莉.传感器网络环境监测时间序列数据的高斯过程建模与多步预测[J].通信学报,2015,36(10):252-262. 被引量：10
5杨明,李广,董传洋,柴娜,徐殿国.基于电机定子电流的齿轮故障诊断方法[J].北京交通大学学报,2015,39(5):87-91. 被引量：10
6施巍松,孙辉,曹杰,张权,刘伟.边缘计算:万物互联时代新型计算模型[J].计算机研究与发展,2017,54(5):907-924. 被引量：502
7刘金海,臧东,汪刚.基于Markov特征的油气管道泄漏检测与定位方法[J].仪器仪表学报,2017,38(4):944-951. 被引量：16
8田华亭,李涛,秦颖.基于A~*改进算法的四向移动机器人路径搜索研究[J].控制与决策,2017,32(6):1007-1012. 被引量：18
9苟景卫.基于神经网络算法的油田油气管道泄漏检测[J].石化技术,2017,24(6):121-121. 被引量：1
10田辉,范绍帅,吕昕晨,赵鹏涛,贺硕.面向5G需求的移动边缘计算[J].北京邮电大学学报,2017,40(2):1-10. 被引量：84

引证文献12

1李俊卿,王祖凡,王罗,胡晓东,秦静茹,何玉灵.基于电流信号和深度强化学习的电机轴承故障诊断方法[J].电力科学与工程,2023,39(3):61-70. 被引量：5
2夏天豪,夏长清,潘昊,许驰,金曦.基于强化学习的算力资源度量方法[J].燕山大学学报,2023,47(3):246-254. 被引量：2
3党伟超,王珏.基于深度强化学习的雾计算容器整合[J].计算机系统应用,2023,32(8):303-311.
4马大中,王天彪,胡旭光,刘羽洋,刘金海.基于数据驱动的管道云边协同泄漏检测方法[J].控制与决策,2023,38(8):2415-2424. 被引量：1
5王哲,王启名,李陶深,葛丽娜.基于深度强化学习的SWIPT边缘网络联合优化方法[J].计算机应用,2023,43(11):3540-3550. 被引量：3
6郑岚,徐丽萍.改进DQN算法在WSNs资源分配中的应用[J].成都工业学院学报,2023,26(6):56-60. 被引量：1
7纪苗苗,吴志彬.考虑工人路径的多智能体强化学习空间众包任务分配方法[J].控制与决策,2024,39(1):319-326. 被引量：1
8刘磊.宽带电力线通信网络多层信道资源分配方法[J].通信电源技术,2024,41(4):182-184.
9董甲东,潘凯,陈琳.边缘计算中工业任务卸载调度与资源分配算法研究[J].安庆师范大学学报（自然科学版）,2024,30(1):83-89.
10侯祥鹏,兰兰,陶长乐,寇小勇,丛佩金,邓庆绪,周俊龙.边缘智能与协同计算:前沿与进展[J].控制与决策,2024,39(7):2385-2404. 被引量：1

二级引证文献15

1郭宇骞.基于边缘计算与物联网技术的信息系统项目实时监测及控制平台开发[J].科技创新与应用,2023,13(34):132-135. 被引量：4
2陈磊.基于深度学习的继电保护故障诊断方法研究[J].信息与电脑,2023,35(24):28-30.
3谢庆助.深度学习算法在有线宽带网络中的应用与性能评估[J].通信电源技术,2024,41(3):158-160.
4王宇清,杨莘苑,张折桂,阚超豪.异步电机轴承故障的诊断方法研究[J].微特电机,2024,52(4):33-37.
5邹易奇.深度学习支持下的无线异构网络中继决策分析[J].无线互联科技,2024,21(5):13-15.
6夏威.基于深度学习的电力设备故障诊断与自动化维护[J].电气技术与经济,2024(5):216-218.
7祝淑琼,徐青青,李小涛,陈维.算力度量与任务调度:物联网端侧设备策略研究[J].电信科学,2024,40(4):122-138. 被引量：1
8杨惠.传感器网络中基于深度强化学习的路由优化算法[J].电子制作,2024,32(10):53-56.
9李炜航,林挺豪,高振博,王宇清,阚超豪.三相异步电机轴承故障的诊断策略[J].微电机,2024,57(5):7-10.
10刘电霆,尚磊,代宣军,张祖琼.社群化制造中众包物流任务分配模型与优化求解[J].制造业自动化,2024,46(6):36-41.

1柴沛华,满君怡,曾一锋,曹浪财.基于马尔可夫决策过程的社团演化干预[J].东北大学学报（自然科学版）,2022,43(11):1536-1543.
2罗云霁,吴琼雁.基于Q学习的合成孔径活塞误差校正方法[J].光学与光电技术,2022,20(5):100-107. 被引量：1
3杜婧涵,胡明华,尹嘉男,张魏宁.基于强化学习方法的航班滑出时间预测研究[J].航空计算技术,2022,52(6):26-29. 被引量：2
4郭娜先,阿成凤.浅析虚拟化技术在省级气象基础设施资源池中的应用[J].青海科技,2022,29(5):138-141. 被引量：1
5邱逸凡,张小康,陈东升,童峰.一种适用于非稳态浅海信道的强化学习自适应调制方案[J].厦门大学学报（自然科学版）,2022,61(6):1072-1081.
6欧洋,徐扬,张金鹏,罗德林.无人机空战的竞争与双重深度强化学习机动对抗决策[J].厦门大学学报（自然科学版）,2022,61(6):975-985. 被引量：2
7王子昊,王旭,蒋传文,龚开,白冰青,邓晖.基于近端策略优化算法的灾后配电网韧性提升方法[J].电力系统自动化,2022,46(21):62-70. 被引量：4
8杜喜梅,徐群磊.基于云计算的通信网络路由数据传输控制方法研究[J].信息与电脑,2022,34(14):199-201. 被引量：5
9唐茂林.新形势下智慧电网网络营销管理信息系统设计[J].信息与电脑,2022,34(15):166-168. 被引量：2
10王建楠,吕胜涛,牛健.基于改进YOLOv5的无人机检测方法[J].光学与光电技术,2022,20(5):48-56. 被引量：6

控制与决策

2022年第11期

浏览历史

内容加载中请稍等...

基于强化学习的边缘计算网络资源在线分配方法被引量：12

参考文献1

二级参考文献3

共引文献7

同被引文献95

引证文献12

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

基于强化学习的边缘计算网络资源在线分配方法 被引量：12

参考文献1

二级参考文献3

共引文献7

同被引文献95

引证文献12

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

基于强化学习的边缘计算网络资源在线分配方法被引量：12