基于Q学习的安全服务功能链编排算法

Q-learning-based Algorithm for Orchestrating Security Service Function Chain

下载PDF

导出

摘要随着科技的发展,互联网已成为人类生活中不可或缺的一部分,而网络安全也显得尤为重要。为了保障网络安全,动态安全服务功能链编排是其中一个重要的研究方向。但是,现在对于动态安全服务功能链的网络资源映射和编排算法的研究主要集中在某一种网络资源,研究方向多以优化某个网络资源和降低网络服务延迟为主要目标,忽略了网络整体资源分配的均衡性。本文构建物理网络模型和安全服务功能链模型,在满足用户需求的情况下,同时考虑物理网络节点计算资源和链路带宽资源,目标是取得最好的网络资源均衡分配。根据强化Q学习算法,提出新的链路编排奖励方式,引入贪婪策略避免陷入局部最优,选取一个典型物理网络模型和不同个数的安全服务功能链,多次迭代得到安全服务功能链的最优编排路径。仿真结果表明,提出的安全服务功能链的最优编排与模拟退火算法相比在编排响应时间上减少了38.5%,在资源分配均衡度上提升了2.1%;与遗传算法相比在编排响应时间上减少了96.5%,在资源分配均衡度上提升了2.9%。 With the development of technology,Internet is becoming an indispensable part of human life and network security is becoming particularly important.To ensure network security,the orchestration of dynamic security service function chains is an important research direction.However,current research on network resource mapping and orchestration algorithms for dynamic security service function chains mainly focuses on a specific type of network resource,with the main goal of optimizing a certain network resource and reducing network service latency.They overlook the balance of overall resource allocation in the network.We construct a physical network model and a security service function chain model.Considering both physical network node computing resources and link bandwidth resources while meeting user needs,the goal is to achieve the best-balanced allocation of network resources.Based on the reinforcement Q-learning algorithm,a new link arrangement reward method is proposed,and a greedy strategy is introduced to avoid falling into local optima.A typical physical network model and different numbers of security service function chains that needs to be arranged are selected and the optimal arrangement path of the security service function chain is obtained through multiple iterations.The simulation results show that the optimal arrangement of the proposed security service function chain reduces the arrangement response time by 38.5%and improves the resource allocation balance by 2.1%compared to the simulated annealing algorithm.Compared with a genetic algorithm,it reduces the response time of orchestration by 96.5%and improves the balance of resource allocation by 2.9%.

作者刘行郭靓王正琦韦小刚徐雪菲刘京 LIU Xing;GUO Liang;WANG Zhengqi;WEI Xiaogang;XU Xuefei;LIU Jing(NARI Group Corporation(State Grid Electric Power Research Institute),Nanjing 210000,China;Nanjing NARI Information&Communication Technology Co.,Ltd.,Nanjing 210000,China;State Grid Shandong Electric Power Institute,Jinan 250003,China)

机构地区南瑞集团有限公司(国网电力科学研究院有限公司) 南京南瑞信息通信科技有限公司国网山东省电力公司电力科学研究院

出处《计算机与现代化》 2024年第11期34-40,共7页 Computer and Modernization

基金国家电网有限公司科技项目(5400-202258435A-2-0-ZN) 国家自然科学基金资助项目(62201274)。

关键词网络安全安全服务功能链 Q学习贪婪策略资源分配 network security security service function chain Q-learning greedy strategy resource allocation

分类号 TM769 [电气工程—电力系统及自动化]

引文网络
相关文献

参考文献10

1郝志超,龚汉卿.2022年全球网络空间安全动态综述[J].中国电子科学研究院学报,2023,18(4):392-396. 被引量：7
2阳勇,孟相如,康巧燕,陈港.基于资源需求预测的动态服务功能链迁移方法[J].计算机研究与发展,2023,60(5):1151-1163. 被引量：1
3董仕.软件定义网络安全问题研究综述[J].计算机科学,2021,48(3):295-306. 被引量：22
4姚晓辉,李青,孙焜焜.一种域适配混合遗传算法及在安全服务链编排中的验证[J].电信科学,2020,36(5):16-24. 被引量：4
5徐玉伟,赵宝康,时向泉,苏金树.容器化安全服务功能链低延迟优化编排研究[J].信息网络安全,2020(7):11-18. 被引量：5
6严炜,龙长江,李善军.基于差分量子退火算法的农用无人机路径规划方法[J].华中农业大学学报,2020,39(1):180-186. 被引量：26
7赵炳巍,贾峰,曹岩,孙瑜,刘一鸿.基于模拟退火算法的人工势场法路径规划研究[J].计算机工程与科学,2022,44(4):746-752. 被引量：20
8李少波,宋启松,李志昂,张星星,柘龙炫.遗传算法在机器人路径规划中的研究综述[J].科学技术与工程,2020,20(2):423-431. 被引量：49
9张有兵,林一航,黄冠弘,杨晓东,翁国庆,周致言.深度强化学习在微电网系统调控中的应用综述[J].电网技术,2023,47(7):2774-2787. 被引量：10
10闫冬,彭国政,高海龙,陈盛,周钰山.基于深度强化学习组合优化的配电网拓扑控制研究[J].电网技术,2022,46(7):2547-2554. 被引量：14

二级参考文献84

1刘朝阳,穆朝絮,孙长银.深度强化学习算法与应用研究现状综述[J].智能科学与技术学报,2020(4):314-326. 被引量：48
2王萌,王晓荣,李春贵,张增芳.改进人工势场法的移动机器人路径规划研究[J].计算机工程与设计,2008,29(6):1504-1506. 被引量：35
3罗胜华,刘国荣,蒋燕.一种基于改进人工势场法的移动机器人路径规划[J].微计算机信息,2009,25(29):188-190. 被引量：9
4杨佩佩,艾欣,崔明勇,雷之力.基于粒子群优化算法的含多种供能系统的微网经济运行分析[J].电网技术,2009,33(20):38-42. 被引量：96
5朱大奇,颜明重.移动机器人路径规划技术综述[J].控制与决策,2010,25(7):961-967. 被引量：333
6丁团结,方威,王锋.无人机遥控驾驶关键技术研究与飞行品质分析[J].飞行力学,2011,29(2):17-19. 被引量：17
7汪来富,沈军,金华敏.电信级云计算平台安全策略研究[J].电信科学,2011,27(10):19-23. 被引量：6
8李小玲,王怀民,丁博,郭长国,李小勇.虚拟网络映射问题研究及其进展[J].软件学报,2012,23(11):3009-3028. 被引量：23
9左青云,陈鸣,赵广松,邢长友,张国敏,蒋培成.基于OpenFlow的SDN技术研究[J].软件学报,2013,24(5):1078-1097. 被引量：423
10薛新宇,兰玉彬.美国农业航空技术现状和发展趋势分析[J].农业机械学报,2013,44(5):194-201. 被引量：140

共引文献147

1赵崇娟,朱奕弢,胡钰莹,严雪莹,詹锐烽.基于改进A^(*)算法的变电站自动巡检路径规划研究[J].机械设计,2024,41(S01):153-158. 被引量：3
2郎为民,姚晋芳,余亮琴,邹力,王振义.CPE虚拟环境创建方法研究[J].电信快报,2021(8):1-5.
3郎为民,田尚保,裴云祥,余亮琴,魏声云.SDN的发展趋势研究[J].电信快报,2021(5):1-5. 被引量：3
4李玉珍,姜金铎,刘峰瑞.浅析计算机网络信息安全中数据加密技术[J].新一代信息技术,2022,5(4):23-25. 被引量：1
5晓农.损失空前惨重的湘江之战[J].党史文汇,2000(2):35-37.
6林秀来,刘良明,胡德耀.HAD对创伤失血性休克大鼠肝细胞线粒体功能的保护作用[J].第三军医大学学报,2000,22(5):439-441. 被引量：7
7曹光乔,李亦白,南风,刘东,陈聪,张进龙.植保无人机飞控系统与航线规划研究进展分析[J].农业机械学报,2020,51(8):1-16. 被引量：41
8罗丹,李丹,殷理杰.典型智能算法在机器人路径规划中的研究综述[J].电脑知识与技术,2020,16(26):180-181.
9王宇,王文浩,徐凡,王泾涵,陈海涛.基于改进蚁群算法的植保无人机路径规划方法[J].农业机械学报,2020,51(11):103-112. 被引量：31
10刘洋成,耿端阳,兰玉彬,谭德蕾,牟孝栋,孙延成.基于自动导航的农业装备全覆盖路径规划研究进展[J].中国农机化学报,2020,41(11):185-192. 被引量：21

1姚秋言,赵丹.群智感知需求不确定任务的资源分配方法[J].计算机与数字工程,2024,52(10):3019-3025.
2宋艳蕊,庄雷,徐泽汐,冯旭,莫文帅.基于云边协同的可靠服务功能链部署算法[J].计算机工程,2024,50(12):184-193.
3何立阳.零信任安全架构在南京电视台办公网数据中心的应用[J].网络安全技术与应用,2024(12):126-129.
4田彦明,侯永生,高超.高性能并行计算中节点负载均衡分配算法[J].信息技术与信息化,2024(11):40-43.
5吴杰.快递配送路径优化算法研究[J].中国物流与采购,2024(23):89-90.
6赵文梅.集团化办学助推学校教育高质量发展——以内蒙古自治区包头市第九中学教育集团为例[J].中小学校长,2024(11):58-60.
7雷云,姚思越.小学课堂奖励负效应:表征、成因及纾解对策[J].当代教育科学,2024(9):65-73.
8刘佳美.“互联网+”背景下偏远地区“城乡医疗一体化”高质量发展路径研究[J].进展,2024(21):132-134.
9王道理,车文磊.创新奖励对知识型员工创新行为的影响——基于积极情绪的中介作用[J].科技创业月刊,2024,37(11):48-55.
10丁克良,张玺,何振强,王铜,柯志勇,梁静,马娜,李波,李治多.基于球心拟合的激光跟踪仪隐藏点高精度测量方法与精度分析[J].红外与激光工程,2024,53(11):121-129.

计算机与现代化

2024年第11期

浏览历史

内容加载中请稍等...

基于Q学习的安全服务功能链编排算法

参考文献10

二级参考文献84

共引文献147

相关作者

相关机构

相关主题

浏览历史