基于分层强化学习的智能化攻击路径发现方法被引量：2

Intelligent Attack Path Discovery Based on Hierarchical Reinforcement Learning

下载PDF

导出

摘要智能化攻击路径发现是开展自动化渗透测试的一项关键技术,但现有方法面临着状态、动作空间呈指数型增长和奖励稀疏等问题,导致算法难以收敛。为此,提出了一种基于分层强化学习的智能化攻击路径发现方法iPathD(Intelligent Path Discovery)。iPathD将攻击路径发现过程构建为一个分层的马尔可夫决策过程,以分别描述上层的主机间渗透路径发现和下层的单主机内部攻击路径发现,并在此基础上提出并实现了一种基于分层强化学习的攻击路径发现算法。实验结果表明,与传统基于DQN(Deep Q Learning)及其改进算法的方法相比,iPathD路径发现方法更加快速有效,并且随着主机中漏洞数目的增加,iPathD的效果更好,且适用于大规模的网络场景。 Intelligent attack path discovery is a key technology for automated penetration testing,but existing methods face the problems of exponential growth of state and action space and sparse rewards,which make the algorithm difficult to converge.To this end,an intelligent attack path discovery method(iPathD)based on hierarchical reinforcement learning is proposed.iPathD constructs the attack path discovery process as a layered Markov decision process to describe the upper-layer inter-host penetration path discovery and the lower-layer single-host internal attack path discovery,respectively.On this basis,an attack path discovery algorithm based on hierarchical reinforcement learning is proposed and implemented.Experimental results show that compared with the traditional method based on deep Q learning(DQN)and its improved algorithm,the iPathD path discovery method is faster and more effective.With the increase of the number of vulnerabilities in the host,the effect of iPathD is better,and it is suitable for large-scale network scenarios.

作者曾庆伟张国敏邢长友宋丽华 ZENG Qingwei;ZHANG Guomin;XING Changyou;SONG Lihua(College of Command and Control Engineering,Army Engineering University,Nanjing 210007,China)

机构地区陆军工程大学指挥控制工程学院

出处《计算机科学》 CSCD 北大核心 2023年第7期308-316,共9页 Computer Science

基金国家自然科学基金面上项目(62172432)。

关键词渗透测试马尔可夫决策过程分层强化学习攻击路径发现 DQN算法 Penetration testing Markov decision process Hierarchical reinforcement learning Attack path discovery DQN algorithm

分类号 TP393 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献13

1刘杰,王清贤,罗军勇.一种基于ICMP的逻辑层网络拓扑发现与分析方法[J].计算机应用,2008,28(6):1498-1500. 被引量：11
2崔颖,章丽娟,吴灏.基于攻击图的渗透测试方案自动生成方法[J].计算机应用,2010,30(8):2146-2150. 被引量：13
3李庆朋,王布宏,王晓东,张春明.基于最优攻击路径的网络安全增强策略研究[J].计算机科学,2013,40(4):152-154. 被引量：7
4闫峰,刘淑芬,冷煌.基于转换的攻击图分析方法研究[J].电子学报,2014,42(12):2477-2480. 被引量：4
5胡浩,叶润国,张红旗,杨英杰,刘玉岭.基于攻击预测的网络安全态势量化方法[J].通信学报,2017,38(10):122-134. 被引量：29
6叶子维,郭渊博,王宸东,琚安康.攻击图技术应用研究综述[J].通信学报,2017,38(11):121-132. 被引量：37
7杨本毅.基于攻击图的渗透测试方法[J].电子科技,2019,32(10):75-78. 被引量：3
8Tian-yang ZHOU,Yi-chao ZANG,Jun-hu ZHU,Qing-xian WANG.NIG-AP: a new method for automated penetration testing[J].Frontiers of Information Technology & Electronic Engineering,2019,20(9):1277-1288. 被引量：10
9杨惟轶,白辰甲,蔡超,赵英男,刘鹏.深度强化学习中稀疏奖励问题研究综述[J].计算机科学,2020,47(3):182-191. 被引量：38
10臧艺超,周天阳,朱俊虎,王清贤.领域独立智能规划技术及其面向自动化渗透测试的攻击路径发现研究进展[J].电子与信息学报,2020,42(9):2095-2107. 被引量：11

引证文献2

1李腾,唐智亮,马卓,马建峰.基于强化学习的自免疫动态攻击生成方法[J].电子学报,2023,51(11):3033-3041.
2李成恩,朱东君,贺杰彦,韩兰胜.基于强化学习的智能化渗透路径规划与求解优化[J].计算机科学,2024,51(11):329-339.

1李筱强.人工智能新技术催生金融机构网络信息安全新范式[J].当代金融家,2023(6):109-111.
2王晓翼.基于自动化渗透测试的电力监控系统网络安全脆弱性检测[J].电子设计工程,2023,31(5):75-79. 被引量：3
3李军.基于深度学习的场景化5G传播模型研究[J].电信快报,2023(6):6-8.
4张建东,王鼎涵,杨啟明,史国庆,陆屹,张耀中.基于分层强化学习的无人机空战多维决策[J].兵工学报,2023,44(6):1547-1563. 被引量：9
5邹鹏飞,王义民,默静飞,毛荣海.燃气轮机燃烧室液雾自燃延迟时间预测方法[J].热能动力工程,2023,38(5):65-70.
6王丹菂,徐青,邢帅,林雨准,张国平.机载激光测深近水面渗透误差修正的半经验波形分解方法[J].测绘学报,2023,52(6):944-955.
7刘耀,童昕,陈一风.面向业务需求的算法路径自组配模型[J].计算机应用,2023,43(6):1768-1778.
8李勇,李苹,姚李嘉美.网络地址转换协议的原理分析及实验研究[J].曲靖师范学院学报,2023,42(3):45-49. 被引量：1
9张莹,胡富国,黎军,王佳,李静玲,姚明旿.卫星动态链路上的可预知确定性流量调度[J].无线电工程,2023,53(7):1670-1677.

计算机科学

2023年第7期

浏览历史

内容加载中请稍等...

基于分层强化学习的智能化攻击路径发现方法被引量：2

同被引文献13

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于分层强化学习的智能化攻击路径发现方法 被引量：2

同被引文献13

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于分层强化学习的智能化攻击路径发现方法被引量：2