星地融合网络中基于深度强化学习的多业务缓存策略

Multi-type Services Caching Strategy Based on Deep Reinforcement Learning in Integrated Satellite-Terrestrial Networks

下载PDF

导出

摘要星地融合网络承载的通信服务呈现出多类型业务并发、业务需求差异化、数据流量聚集、大量重复请求等鲜明特征。针对多样化重复请求业务并发时链路负载过大、用户体验质量(Quality of Experience,QoE)难以保障的问题,提出一种基于深度强化学习(Deep Reinforcement Learning,DRL)的多业务缓存(Caching for Multi-Type Services,CMTS)策略。通过对星地融合网络中获取请求内容时延与三类典型业务时间效用函数分析建模,建立以最大化系统和效用为目标的优化问题,并提出一种基于多智能体深度确定性策略梯度(Multi-Agent Deep Deterministic Policy Gradient,MADDPG)的MADDPG-CMTS算法,综合考虑业务效用差异化特征、用户请求、星地缓存、网络拓扑等多种因素确定缓存更新决策。仿真结果表明,所提算法与最受欢迎内容(Most Popular Content,MPC)策略、随机替换(Random Replacement,RR)策略等传统缓存更新策略相比,系统总效用可提升约47%。 The communication services carried by integrated satellite-terrestrial networks exhibit distinctive characteristics,including multi-type services concurrent,differentiated service requirements,data traffic aggregation,and a large volume of repetitive requests.In response to the issue of excessive link load and difficulty in ensuring the Quality of Experience(QoE) when dealing with diverse repetitive requests,a Caching for Multi-Type Services(CMTS) strategy is obtained based on Deep Reinforcement Learning(DRL).Through analyzing and modeling the delay of obtaining request content and the time utility functions of three typical services in satellite-terrestrial integrated networks,an optimization problem to maximize the total system utility is formulated,and then a MADDPG-CMTS algorithm based on Multi-Agent Deep Deterministic Policy Gradient(MADDPG) is proposed.The strategy comprehensively considers multiple factors such as the differentiation of utility,user request status,satellite-terrestrial caching status,and network topology,to determine cache update decisions.Experimental results demonstrate that the proposed algorithm can increase the total system utility by approximately 47%,when compared with traditional cache update strategies such as Most Popular Content(MPC) strategy and Random Replacement(RR) strategy.

作者闫晓曈刘丹谱张志龙 YAN Xiaotong;LIU Danpu;ZHANG Zhilong(School of Information and Communication Engineering,Beijing University of Posts and Telecommunications,Beijing 100876,China)

机构地区北京邮电大学信息与通信工程学院

出处《无线电通信技术》 2023年第5期875-882,共8页 Radio Communications Technology

基金国防科技重点实验室基础项目(DXZT-JC-ZZ-2020-011) 北京市自然科学基金(L202003)。

关键词星地融合网络缓存策略多类型业务深度强化学习 integrated satellite-terrestrial networks caching strategy multi-type services DRL

分类号 TN927.2 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献3

1《中华人民共和国国民经济和社会发展第十三个五年规划纲要辅导》读本[J].全国新书目,2016,0(5):10-10. 被引量：5
2张路,燕锋,章跃跃,夏玮玮,谢晔,石云墀,沈连丰.基于星间链路状态的低轨卫星网络路由算法[J].上海航天（中英文）,2021,38(4):92-100. 被引量：11
3马骋乾,谢伟,孙伟杰.强化学习研究综述[J].指挥控制与仿真,2018,40(6):68-72. 被引量：41

二级参考文献9

1CHEN Mo,ZHANG Ruoyu,PU Fangling,QU Yanyu.Fast Updating Routing Table Method Based on Chord Algorithm in Distributed Satellite Network[J].上海航天（中英文）,2020,37(S01):96-104. 被引量：1
2罗大成,刘岩,刘延飞,徐萍,王秋妍.星间链路技术的研究现状与发展趋势[J].电讯技术,2014,54(7):1016-1024. 被引量：26
3李云,周旋,刘期烈,刘剑锋,封彬,魏武.卫星通信链路性能分析[J].计算机工程与应用,2015,51(12):78-82. 被引量：16
4李贺武,吴茜,徐恪,吴建平,杨增印,江卓,朱亮.天地一体化网络研究进展与趋势[J].科技导报,2016,34(14):95-106. 被引量：65
5魏亮,黄韬,张娇,王泽南,刘江,刘韵洁.基于强化学习的服务链映射算法[J].通信学报,2018,39(1):90-100. 被引量：17
6陈希亮,曹雷,何明,李晨溪,徐志雄.深度逆向强化学习研究综述[J].计算机工程与应用,2018,54(5):24-35. 被引量：18
7梁浩,陈福才,季新生,吕平,高彦钊.天地一体化信息网络发展与拟态技术应用构想[J].中国科学：信息科学,2019,49(7):799-818. 被引量：15
8张甜甜,陈龙,袁卫文,武文权.Ka波段数字信道化体制宽带通信卫星链路预算[J].上海航天,2017,34(6):50-57. 被引量：5
9温渊,白沐炎,易灵,陈长春,方华,李云端.低轨卫星高精度轨道递推算法研究[J].上海航天,2019,36(S2):14-17. 被引量：7

共引文献54

1李茹杨,彭慧民,李仁刚,赵坤.强化学习算法与应用综述[J].计算机系统应用,2020,29(12):13-25. 被引量：42
2蒋方庆,陈自力,高喜俊,王春峰,贺道坤.基于改进TD3算法的无人机决策研究[J].信息化研究,2023,49(3):36-42.
3崔立,宋玉,张进.基于自适应DDPG方法的复杂场景下AUV动动对接[J].船舶工程,2023,45(8):8-14.
4赵元,张合新.基于目标状态距离简化Q-learning算法的迷宫路径规划[J].火箭军工程大学学报,2019(4):79-84.
5李倩,滕葳.种植业标准体系存在的问题和发展建议[J].中国农技推广,2019,35(1):16-18.
6冯俊杰,贾艳辉,张红霞,孙秀路,王玉秀,赵青青,黄修桥.抗旱用轻型滴灌系统的投资与效益分析[J].灌溉排水学报,2018,37(7):76-82. 被引量：3
7杨薛钰.基于Q-Learning算法的电气故障检测模型[J].电脑知识与技术,2020,16(5):258-260.
8刘暾东,陈馨,吴晓敏,邵桂芳.工业机器人运动规划研究进展[J].自动化博览,2020,37(4):56-61.
9陈鹏,王子磊.融合深度学习与搜索的实时策略游戏微操方法[J].计算机工程,2020,46(6):50-59.
10孙嘉浩,陈劲杰.基于强化学习的无人驾驶仿真研究[J].农业装备与车辆工程,2020,58(6):102-106.

1刘雨,操雅琴.智能语音助手拟人化特征及其对用户体验质量的影响[J].洛阳师范学院学报,2023,42(8):36-42.
2沙新欣,杨阳,林霖.冬奥有线电视专网接入网部署方案及相关技术实践[J].广播电视信息,2022,29(S01):30-32.
3徐燕青,刘雨平,李胜才,李延泽.基于VOSviewer的老旧住区更新决策研究现状分析与展望[J].中国名城,2023,37(9):81-87. 被引量：1
4陈金留,李鹏程,王昊琦,甘文泉.社会可持续视角下基于多源大数据的社区活力测度和更新规划策略研究——以苏州市中心城区为例[J].上海城市规划,2023(3):119-127. 被引量：2
5张立,姬文红,郑一畅,张杨冰,谷莉.智慧物资计量在冶金企业中的建设与探索[J].河南冶金,2023,31(2):53-56.
6石绍宾,鞠镇远.“腾笼换鸟”的房价效应:以老工业区搬迁改造为例[J].数量经济技术经济研究,2023,40(6):113-132. 被引量：4
7黄晓野,高一兰.行为经济学视域下的直播电商消费者福利[J].商业经济,2023(10):50-53. 被引量：1
8王军栋.基于GPRS的智能高铁自动驾驶技术应用研究[J].铁路通信信号工程技术,2023,20(9):30-35. 被引量：1
9宋江帆,李金龙.用于连续时间中策略梯度算法的动作稳定更新算法[J].计算机应用研究,2023,40(10):2928-2932. 被引量：2
10刘文涛,Manzoor Ahmed,林青.基于DRL的主动RIS安全无线通信优化方法[J].计算机应用研究,2023,40(9):2808-2814. 被引量：1

无线电通信技术

2023年第5期

浏览历史

内容加载中请稍等...

星地融合网络中基于深度强化学习的多业务缓存策略

参考文献3

二级参考文献9

共引文献54

相关作者

相关机构

相关主题

浏览历史