-
题名基于改进型DDPG的单用户任务迁移优化
- 1
-
-
作者
胡灿
朱正伟
朱晨阳
诸燕平
-
机构
常州大学微电子与控制工程学院
常州大学计算机与人工智能学院
-
出处
《计算机工程与设计》
北大核心
2023年第11期3352-3359,共8页
-
基金
国家自然科学基金项目(61801055)
常州市重点研发计划基金项目(CJ20210123)
+1 种基金
江苏省研究生科研创新基金项目(KYCX22_3053、KYCX22_3060)
江苏省高等学校自然科学面上基金项目(22KJB520012)。
-
文摘
针对传统强化学习算法在具有随机任务到达和时变无线信道的边缘服务器上最小化计算成本存在收敛速度慢、收敛不稳定等问题,提出一种改进型DDPG算法(IDDPG)。将DDPG的Critic网络结构替换为Dueling结构,通过将状态价值函数拆分为优势函数和价值函数,使其收敛更快;将Critic网络的更新频率调整为高于Actor网络的更新频率,使整体训练更加稳定;在Actor网络选出来的动作上增加Ornstein-Uhlenbeck噪声以提高算法探索能力,将动作噪声大小进行分段设置,保证收敛的稳定性。实验结果表明,相较其它算法,IDDPG算法能够更好最小化计算成本,在收敛速度和收敛稳定性方面都有一定提升。
-
关键词
深度强化学习
边缘计算
任务卸载
策略优化
网络结构
算法优化
探索噪声
-
Keywords
deep reinforcement learning
edge computing
task offloading
strategy optimization
network structure
algorithm optimization
explore noise
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-