基于改进型TD3算法的车载边缘计算任务卸载决策

Vehicle edge computing task offloading decision based on improved TD3 algorithm

下载PDF

导出

摘要为满足复杂车辆任务在时延、能耗和计算性能方面的要求,同时减少网络资源的竞争和消耗,设计了一种基于车载边缘计算(VEC)的任务卸载策略,以最小化任务处理延迟和能源消耗之间平衡的长期成本为目标,将车联网中的任务卸载问题建模为马尔可夫决策过程(MDP),提出了在传统双延时深度确定性策略梯度(TD3)的基础上,利用长短期记忆网络(LSTM)来逼近策略函数和价值函数,将系统状态进行归一化处理以加速网络收敛并增强训练稳定性的改进算法(LN-TD3)。仿真结果表明,LN-TD3性能与全部本地计算和全部卸载计算相比提高了两倍以上;收敛速度上与深度确定性策略梯度DDPG、TD3相比提高了约20%。 A task offloading strategy based on Vehicle Edge Computing(VEC)is designed to meet the requirements of complex vehicular tasks in terms of latency,energy consumption,and computational performance,while reducing network resource competition and consumption.The goal is to minimize the long-term cost balancing between task processing latency and energy consumption.The task offloading problem in vehicular networks is modeled as a Markov Decision Process(MDP).An improved algorithm,named LN-TD3,is proposed building upon the traditional Twin Delayed Deep Deterministic Policy Gradient(TD3).This improvement incorporates Long Short-Term Memory(LSTM)networks to approximate the policy and value functions.The system state is normalized to accelerate network convergence and enhance training stability.Simulation results demonstrate that LN-TD3 outperforms both fully local computation and fully offloaded computation by more than two times.In terms of convergence speed,LN-TD3 exhibits approximately a 20%improvement compared to DDPG and TD3.

作者李亚王卫岗张原刘瑞鹏 Li Ya;Wang Weigang;Zhang Yuan;Liu Ruipeng(Institute of Physics and Electronic Information,Henan Polytechnic University,Jiaozuo 454000,China)

机构地区河南理工大学物理与电子信息学院

出处《电子测量技术》北大核心 2024年第6期64-70,共7页 Electronic Measurement Technology

基金中层大气和全球环境探测重点实验室开放课题(LAGEO-2022-02)项目资助。

关键词车载边缘计算 TD3算法任务卸载深度强化学习马尔可夫决策过程 VEC TD3 algorithm task offloading deep reinforcement learning markov decision process

分类号 TN929 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献3

1张仪,冯伟,王卫军,杨之乐,张艳辉,朱子翰,谭勇.融合LSTM和PPO算法的移动机器人视觉导航[J].电子测量与仪器学报,2022,36(8):132-140. 被引量：13
2赵海涛,张唐伟,陈跃,赵厚麟,朱洪波.基于DQN的车载边缘网络任务分发卸载算法[J].通信学报,2020,41(10):172-178. 被引量：17
3丁飞,沙宇晨,洪莹,蒯晓,张登银.智能网联汽车计算卸载与边缘缓存联合优化策略[J].系统仿真学报,2023,35(6):1203-1214. 被引量：3

二级参考文献16

1陈山枝,胡金玲,时岩,赵丽.LTE-V2X车联网技术、标准与应用[J].电信科学,2018,34(4):1-11. 被引量：92
2谢人超,廉晓飞,贾庆民,黄韬,刘韵洁.移动边缘计算卸载技术综述[J].通信学报,2018,39(11):138-155. 被引量：124
3刘建伟,高峰,罗雄麟.基于值函数和策略梯度的深度强化学习综述[J].计算机学报,2019,42(6):1406-1438. 被引量：128
4Jindou Xie,Yunjian Jia,Zhengchuan Chen,Zhaojun Nan,Liang Liang.Efficient Task Completion for Parallel Offloading in Vehicular Fog Computing[J].China Communications,2019,16(11):42-55. 被引量：5
5郭辉,芮兰兰,高志鹏.车辆边缘网络中基于多参数MDP模型的动态服务迁移策略[J].通信学报,2020,41(1):1-14. 被引量：7
6张海波,王子心,贺晓帆.SDN和MEC架构下V2X卸载与资源分配[J].通信学报,2020,41(1):114-124. 被引量：12
7王君,纪晓东,张欣然,温晓然,佟佳俊.5G蜂窝车联网组网性能研究[J].电信科学,2020,36(1):49-57. 被引量：7
8张海波,荆昆仑,刘开健,贺晓帆.车联网中一种基于软件定义网络与移动边缘计算的卸载策略[J].电子与信息学报,2020,42(3):645-652. 被引量：26
9余翔,刘一勋,石雪琴,王政.车联网场景下的移动边缘计算卸载策略[J].计算机工程,2020,46(11):29-34. 被引量：14
10孙龙龙,江明,焦传佳.基于运动矢量的改进视觉SLAM算法[J].电子测量与仪器学报,2020,32(9):23-31. 被引量：12

共引文献30

1吴晓敏,贺苗,刘暾东,张馨月,邵桂芳.基于狄利克雷过程聚类的机器人演示学习研究[J].仪器仪表学报,2023,44(1):265-274. 被引量：2
2林艳,闫帅,张一晋,李春国,束锋.基于交通流量预测的车联网双边拍卖边缘计算迁移方案[J].通信学报,2020,41(12):205-214. 被引量：8
3张凤荔,赵佳君,刘东,王瑞锦.基于深度强化学习的边云协同串行任务卸载算法[J].电子科技大学学报,2021,50(3):398-404. 被引量：5
4章坚武,王路鑫,孙玲芬,章谦骅,单杭冠.人工智能在5G系统中的应用综述[J].电信科学,2021,37(5):14-31. 被引量：13
5张鹏,田辉,赵鹏涛,贺硕,童一帆.多智能体协作场景下基于强化学习值分解的计算卸载策略[J].通信学报,2021,42(6):1-15. 被引量：5
6贺文晨,郭少勇,邱雪松,陈连栋,张素香.基于DRL的联邦学习节点选择方法[J].通信学报,2021,42(6):62-71. 被引量：10
7方娟,叶志远,张梦媛,史佳眉,滕自怡.边云协同场景下基于强化学习的精英分层任务卸载策略研究[J].物联网学报,2022,6(1):91-100. 被引量：1
8张平,邱超,郭璞,樊冰,陈恺.面向区块链网络的边缘计算任务分配算法[J].电力信息与通信技术,2022,20(5):9-15. 被引量：3
9周振宇,王曌,廖海君,汪洋,张慧.电力物联网5G云–边–端协同框架与资源调度方法[J].电网技术,2022,46(5):1641-1651. 被引量：42
10王松烨.基于深度Q学习的工业多任务资源分配方案[J].企业科技与发展,2022(4):50-53.

1俞恬,刘少华,魏安华,郭洁茹,张程亮,刘东,刘喆隆.基于Markov模型的胰高血糖素样肽1受体激动剂联合二甲双胍治疗2型糖尿病药物经济学评价[J].药物流行病学杂志,2024,33(4):388-401. 被引量：2
2徐少平,肖楠,罗洁,程晓慧,陈晓军.双通道深度图像先验降噪模型[J].电子学报,2024,52(1):58-68.
3罗良清,邱东.真实链位论与经济统计——前一轮全球化过程中国际竞争格局的一个分析框架[J].统计研究,2024,41(4):3-11.

电子测量技术

2024年第6期

浏览历史

内容加载中请稍等...

基于改进型TD3算法的车载边缘计算任务卸载决策

参考文献3

二级参考文献16

共引文献30

相关作者

相关机构

相关主题

浏览历史