基于会话统计编码器的恶意加密流量检测方法研究

Malicious Encrypted Traffic Detection Method Based on Conversation Statistical Encoder Model

下载PDF

导出

摘要随着网络技术的发展和广泛应用,加密流量已成为保护用户隐私的关键技术。但同时,恶意软件和攻击者也利用加密流量来隐藏其行为,规避传统的网络入侵检测系统。现有的恶意加密流量检测方法存在一些问题,如基于统计特征的方法需要依赖专家经验进行特征提取,且不同协议的特征无法通用;基于原始输入的深度学习方法存在信息不完整和字段填充等数据问题,对加密流量交互行为的语义表征不足。为解决上述问题,提出了一种名为会话统计编码器模型(Conversation Statistic Encoder Model,CSEM)的方法。与传统的将字节流输入深度神经网络的模式不同,该方法借鉴了transformer-encoder模型,引入了一种新的流量包特征解析方式。所提方法能够针对每个流量包构建出固定长度的向量表示,并且无需进行零填充,同时避免了特征提取过程对具体加密协议的依赖,构建了一个混合深度神经网络,为恶意加密流量检测提供了一种新的思路。在DataCon和自建数据集上对所提模型进行了验证,其在DataCon公开数据集上的召回率达到了0.9911,精确率达到了0.9407,F1值达到了0.9652(相比随机森林模型F1值提升了9%),几项指标均达到了目前的最佳水平。 With the development and widespread application of network technology,encrypted traffic has become a key technology for protecting user privacy.However,malware and attackers also use encrypted traffic to hide their behaviors and evade traditional network intrusion detection systems.Existing malicious encrypted traffic detection methods have some pro-blems.Statistics-based methods rely on expert experience for feature extraction,and features of different protocols cannot be generalized.Deep learning methods based on raw inputs have incomplete information and field padding data issues,leading to insufficient semantic representation of encrypted traffic interactions.To solve the above problems,this paper proposes a method called“conversation statistic encoder model(CSEM)”.The method draws on the transformer encoder model and introduces a new traffic packet feature parsing method,and it is different from the traditional mode of inputting byte streams into deep neural networks.The proposed method can construct fixed-length vector representations for each traffic packet without padding zeros,while avoiding dependence on specific encrypted protocols in the feature extraction process.A hybrid deep neural network is constructed to provide a new idea for malicious encrypted traffic detection.The proposed method is verified on the DataCon dataset and self-built dataset,and the experimental results on Datacon dataset show a recall of 0.9911,precision of 0.9407,and F1 score of 0.9652,reaching the current best level,and the F1 score is 9%higher than that of the random forest model.

作者巩思越刘辉王宝会 GONG Siyue;LIU Hui;WANG Baohui(College of Software,Beihang University,Beijing 100000,China)

机构地区北京航空航天大学软件学院

出处《计算机科学》 CSCD 北大核心 2024年第11期340-346,共7页 Computer Science

关键词会话加密流量检测编码器 Conversation Encrypted traffic detection Encoder

分类号 TP312 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献3

1韦佶宏,郑荣锋,刘嘉勇.基于混合神经网络的恶意TLS流量识别研究[J].计算机工程与应用,2021,57(7):107-114. 被引量：15
2谷勇浩,徐昊,张晓青.基于多粒度表征学习的加密恶意流量检测[J].计算机学报,2023,46(9):1888-1899. 被引量：2
3邹源,张甲,江滨.基于LSTM循环神经网络的恶意加密流量检测[J].计算机应用与软件,2020,37(2):308-312. 被引量：16

二级参考文献6

1陈兴蜀,陈敬涵,曾雪梅,韩珍辉,朱毅,邵国林.基于TDRI的多视图关联DNS流量可视分析[J].工程科学与技术,2018,50(4):123-129. 被引量：2
2陈良臣,高曙,刘宝旭,卢志刚.网络加密流量识别研究进展及发展趋势[J].信息网络安全,2019(3):19-25. 被引量：28
3程华,谢金鑫,陈立皇.基于CNN的加密C&C通信流量识别方法[J].计算机工程,2019,45(8):31-34. 被引量：16
4邹源,张甲,江滨.基于LSTM循环神经网络的恶意加密流量检测[J].计算机应用与软件,2020,37(2):308-312. 被引量：16
5胡斌,周志洪,姚立红,李建华.结合报文负载与流指纹特征的恶意流量检测[J].计算机工程,2020,46(11):157-163. 被引量：15
6蒋彤彤,尹魏昕,蔡冰,张琨.基于层次时空特征与多头注意力的恶意加密流量识别[J].计算机工程,2021,47(7):101-108. 被引量：23

共引文献27

1易灿.网络背景流量的分类与识别分析研究[J].电子测试,2020,31(19):92-93.
2陈明豪,祝跃飞,芦斌,翟懿,李玎.基于Attention-CNN的加密流量应用类型识别[J].计算机科学,2021,48(4):325-332. 被引量：11
3崔见泉,周延森,刘博宇,郝嘉琪.深层卷积神经网络的暗网流量检测比较与改进[J].软件导刊,2022,21(3):176-180. 被引量：1
4张晓琴,汪云飞.基于属性基加密的恶意域名训练异常数据检测[J].信息技术,2022,46(3):90-95.
5魏峰,张驯.基于LSTM模型的APT攻击信道检测方法[J].微型电脑应用,2022,38(3):134-137. 被引量：2
6李小剑,谢晓尧,徐洋,张思聪.基于CNN⁃SIndRNN的恶意TLS流量快速识别方法[J].计算机工程,2022,48(4):148-157. 被引量：8
7桂冠,宁金辉,王禹.半监督学习在恶意软件流量检测中的应用[J].移动通信,2022,46(4):28-32. 被引量：3
8康鹏,杨文忠,马红桥.TLS协议恶意加密流量识别研究综述[J].计算机工程与应用,2022,58(12):1-11. 被引量：7
9张稣荣,陈博,卜佑军,路祥雨,孙嘉.基于迁移学习的加密恶意流量检测方法[J].计算机工程与应用,2022,58(17):130-138. 被引量：5
10罗鹏宇,孙成胜.基于模型研判的TLS恶意流量检测[J].通信技术,2023,56(1):89-97.

1刘文,孟林溪.深度学习在网络入侵检测系统中的应用及其效果[J].移动信息,2024,46(8):220-222.
2贺崇刚.基于人工智能的网络入侵检测系统研究[J].新潮电子,2024(9):34-36.
3王峰.院专题研究数字中心建设[J].四川林勘设计,2024(3).
4倪硕.基于深度学习的网络入侵检测系统设计与实现[J].金融科技时代,2024,32(10):75-79.
5吴立峰.基于云计算的网络入侵检测系统设计与实现[J].电脑编程技巧与维护,2024(10):157-159.
6徐俊波,高海龙.配电系统电力设备数字孪生底座系统设计[J].电力设备管理,2024(18):170-172.
7王麒翔,韩震焘,梁毅.基于博弈论均衡的风险防控经济调度分析[J].中国电力,2024,57(10):69-77.
8方柯.数据加密技术在计算机软件安全防护中的应用研究[J].信息与电脑,2024,36(15):21-23.
9张广就,王国炎,吕宗瑾,冯华铭,阳晟.基于OCS系统遥信与卷积神经网络融合判别GIS刀闸状态的方法[J].自动化与仪器仪表,2024(9):164-167.
10封红旗,郭永祥,张登辉,杨昕立.结合多级注意力和多流图神经网络的多模态会话情绪识别[J].计算机工程与应用,2024,60(21):154-163.

计算机科学

2024年第11期

浏览历史

内容加载中请稍等...

基于会话统计编码器的恶意加密流量检测方法研究

参考文献3

二级参考文献6

共引文献27

相关作者

相关机构

相关主题

浏览历史