基于深度强化学习的服务功能链多维资源优化被引量：1

Multi-dimensional Resource Optimization of Service Function Chain Based on Deep Reinforcement Learning

下载PDF

导出

摘要在网络功能虚拟化(Network Function Virtualization,NFV)环境下,保证用户服务功能链(Service Function Chain,SFC)服务质量的同时节约资源消耗,降低运营成本,对运营商来说至关重要。联合考虑SFC部署和无线接入网资源分配,提出一种基于深度强化学习的SFC多维资源联合分配算法。构建一种基于环境感知的SFC资源分配机制,建立用户时延要求、无线速率需求以及资源容量等约束下的SFC部署成本最小化模型。考虑到无线环境的动态变化,将此优化问题转化为一个无模型离散时间马尔科夫决策过程(Markov Decision Process,MDP)模型。由于该MDP状态空间的连续性和动作空间的高维性,采用深度确定性策略梯度(Deep Deterministic Policy Gradient,DDPG)强化学习算法进行求解,得到最小化部署成本的资源分配策略。仿真结果表明,该算法可在满足性能需求及资源容量等约束的同时,有效降低SFC部署成本和端到端传输时延。 In the Network Function Virtualization(NFV)environment,it is important for operators to save resource consumption and reduce operating costs while ensuring the service quality of the users’Service Function Chain(SFC).This paper jointly considers SFC deployment and radio access network resource allocation,and proposes an SFC multi-dimensional resource allocation algorithm based on deep reinforcement learning.Firstly,an SFC resource allocation mechanism based on environment awareness is built,and an SFC deployment cost minimization model is established with the constraints of user delay requirements,wireless rate requirements and resource capacity.Secondly,considering the dynamics of the wireless environment,this optimization problem is transformed into a model-free discrete-time Markov Decision Process(MDP)model.Due to the continuity of the MDP’s state space and the high dimensionality of the action space,a Deep Deterministic Policy Gradient(DDPG)reinforcement learning algorithm is leveraged to solve the problem,accordingly a resource allocation strategy that minimizes the deployment cost is obtained.Simulation results show that the algorithm can effectively reduce the SFC deployment cost and end-to-end transmission delay while satisfying the constraints of performance requirements and resource capacity.

作者王晓唐伦贺小雨陈前斌 WANG Xiao;TANG Lun;HE Xiaoyu;CHEN Qianbin(School of Communication and Information Engineering,Chongqing University of Posts and Telecommunications,Chongqing 400065,China;Key Laboratory of Mobile Communication,Chongqing University of Posts and Telecommunications,Chongqing 400065,China)

机构地区重庆邮电大学通信与信息工程学院重庆邮电大学移动通信技术重点实验室

出处《计算机工程与应用》 CSCD 北大核心 2021年第4期68-76,共9页 Computer Engineering and Applications

基金国家自然科学基金(61571073) 重庆市教委科学技术研究项目(KJZD-M20180601)。

关键词网络功能虚拟化服务功能链部署无线资源分配强化学习深度确定性策略梯度算法 network function virtualization service function chain deployment radio resource allocation reinforcement learning deep deterministic policy gradient

分类号 TN929.5 [电子电信—通信与信息系统] TP393 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1Lu Ma,Xiangming Wen,Luhan Wang,Zhaoming Lu,Raymond Knopp.An SDN/NFV Based Framework for Management and Deployment of Service Based 5G Core Network[J].China Communications,2018,15(10):86-98. 被引量：23

共引文献22

1Yifan Liu,Bo Zhao,Pengyuan Zhao,Peiru Fan,Hui Liu.A Survey: Typical Security Issues of Software-Defined Networking[J].China Communications,2019,16(7):13-31. 被引量：12
2Tao Yu,Yuchen Zhang,Diyue Chen,Hongyan Cui,Jilong Wang.Routing Loop Audit Mechanism Based on SDN[J].China Communications,2019,16(7):96-108. 被引量：2
3Changming Zhao,Tiejun Wang,Alan Yang.A Heterogeneous Virtual Machines Resource Allocation Scheme in Slices Architecture of 5G Edge Datacenter[J].Computers, Materials & Continua,2019(7):423-437.
4Tao Yu,Longfei Yu,Diyue Chen,Hongyan Cui,Jilong Wang.An SDN Oriented Loop Detection Mechanism Based on TTL Statistics[J].China Communications,2020,17(6):1-12. 被引量：2
5Zhongnan Zhao,Huiqiang Wang,Jian Wang,Hongwei Guo.Research on Fault Repair Method of All-Optical Network Based on SDN[J].China Communications,2020,17(6):180-195. 被引量：1
6Yejun He,Yaling Chen,Long Zhang,Sai-Wai Wong,Zhi Ning Chen.An Overview of Terahertz Antennas[J].China Communications,2020,17(7):124-165. 被引量：16
7赵季红,季文君,曲桦,赵建龙,王珂,吴豆豆.基于机器学习数据流突变型服务功能链构建策略[J].计算机应用研究,2020,37(12):3749-3752.
8凌敏,张文金,袁亮,熊继平.面向边缘计算的物联网网络流量测量方法[J].重庆大学学报,2021,44(1):67-77. 被引量：4
9Meng Zhang.Flex Ethernet Technology and Application in 5G Mobile Transport Network[J].China Communications,2021,18(2):250-258. 被引量：3
10王兆堃,陈前斌,唐伦,王威丽.网络切片中物理节点的分布式在线异常检测方法[J].重庆邮电大学学报（自然科学版）,2021,33(4):520-528. 被引量：5

同被引文献8

1孙士清,彭建华,游伟,李英乐.5G网络下资源感知的服务功能链协同构建和映射算法[J].西安交通大学学报,2020,54(8):140-148. 被引量：18
2翟东,孟相如,康巧燕,胡航,韩晓阳.面向时延与可靠性优化的服务功能链部署方法[J].电子与信息学报,2020,42(10):2386-2393. 被引量：13
3金明,李琳琳,张文瑾,刘文.基于深度强化学习的服务功能链映射算法[J].计算机应用研究,2020,37(11):3456-3460. 被引量：8
4祖家琛,胡谷雨,严佳洁,李实吉.网络功能虚拟化下服务功能链的资源管理研究综述[J].计算机研究与发展,2021,58(1):137-152. 被引量：16
5朱国晖,李庆,梁申麟.基于深度强化学习的服务功能链跨域映射算法[J].计算机应用研究,2021,38(6):1834-1837. 被引量：4
6程洪闪,孟欢,张晓辉.服务功能链的优化映射策略[J].计算机与网络,2021,47(8):54-56. 被引量：3
7王建新,李腾旭,王晔茹.基于离散型麻雀搜索算法的食品抽检路径优化[J].中国食品卫生杂志,2021,33(4):409-414. 被引量：3
8邱航,汤红波,游伟.基于深度Q网络的在线服务功能链部署方法[J].电子与信息学报,2021,43(11):3122-3130. 被引量：6

引证文献1

1朱国晖,景文焕,李世昌.基于改进麻雀搜索算法的服务功能链优化映射算法[J].计算机应用研究,2022,39(7):2120-2123. 被引量：3

二级引证文献3

1张岳,张俊楠,吴晓春,洪晨,周静静.基于改进灰狼优化算法的服务功能链映射算法[J].电信科学,2022,38(11):57-72. 被引量：3
2王媛滔,舒兆港,钟一文,邱彩钰,田佳霖.基于VNF实例共享的服务功能链部署算法[J].计算机应用研究,2023,40(6):1806-1811. 被引量：2
3熊泽凯,王素红,王靖君,祝长鸿,覃团发.移动边缘计算中服务功能链的自适应优化部署策略[J].电讯技术,2023,63(11):1678-1686. 被引量：2

1唐伦,贺兰钦,谭颀,陈前斌.基于深度确定性策略梯度的虚拟网络功能迁移优化算法[J].电子与信息学报,2021,43(2):404-411. 被引量：7
2黄培霞.浅谈如何扬长避短制作小学语文微课[J].福建教育研究,2020(6):73-74.
3李文静.微课优化小学语文识字教学[J].散文选刊（中旬刊）,2020(10):95-95.
4Xin Guan,Yang Huang,Chao Dong,Qihui Wu.User Association and Power Allocation for UAV-Assisted Networks: A Distributed Reinforcement Learning Approach[J].China Communications,2020,17(12):110-122. 被引量：6
5巫光福,周欢,李帅,廖列法.一种改进的winner-take-all模型及在图像中的应用[J].计算机应用研究,2021,38(2):631-635.
6祝亢,黄珍,王绪明.基于深度强化学习的智能船舶航迹跟踪控制[J].中国舰船研究,2021,16(1):105-113. 被引量：24
7张松霖.容器云中基于改进遗传算法的资源分配策略[J].计算机测量与控制,2021,29(1):168-173.
8陈瑞.数据驱动型的维修任务分配方法[J].航空维修与工程,2021(1):46-49.
9廖远来.基于大数据的C-RAN无线资源管理[J].电子技术（上海）,2020,49(5):68-69.
10杨云明.4G/5G共建共享场景下的4G网络优化策略研究[J].通信电源技术,2020,37(21):142-145. 被引量：2

计算机工程与应用

2021年第4期

浏览历史

内容加载中请稍等...

基于深度强化学习的服务功能链多维资源优化被引量：1

参考文献1

共引文献22

同被引文献8

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于深度强化学习的服务功能链多维资源优化 被引量：1

参考文献1

共引文献22

同被引文献8

引证文献1

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于深度强化学习的服务功能链多维资源优化被引量：1