基于多粒度表征学习的加密恶意流量检测被引量：1

Multi-Granularity Representation Learning for Encrypted Malicious Traffic Detection

下载PDF

导出

摘要现有加密恶意流量检测方法中,基于统计特征的方法存在特征提取依赖专家经验和特征之间相互独立的问题,基于原始输入的机器学习和深度学习方法存在信息不全、随机字段、单一粒度的问题,对加密流量交互行为的语义表征不足.为解决上述问题,本文提出一种基于多粒度表征学习的加密恶意流量检测方法MGREL(MultiGranularity REpresentation Learning).该方法将加密会话分为字段级和包级两个粒度分别处理.在字段级粒度中,基于词向量进行局部行为建模,提取握手报文并选取关键字段,缓解信息不全导致的语义缺失问题,将字段的字节值表示为词向量,同时增加报文类型与握手类型作为位置前缀,解决位置语义缺失的问题,采用Multi-head Attention计算字段间的交互,再通过Bi LSTM得到报文级语义;在包级粒度中,基于时空进行全局行为建模,提取包的时空状态信息并采用LSTM模型得到流级语义.将两个粒度下得到的局部行为语义和全局行为语义融合,得到加密流量的表征,解决单一粒度表征能力不足的问题.最后,通过对比实验验证本文所提方法MGREL在检测加密恶意流量方面表现最好. In the field of encrypted malicious traffic detection,the current detection methods are insufficient.In the method based on statistical features,feature extraction relies on expert experience,and the features are independent of each other;while the method based on original input has problems of incomplete information,random fields,and single granularity,and cannot learn the semantics of traffic interaction behavior well.In order to overcome the shortcomings of existing methods,this paper proposes an encrypted malicious traffic detection method MGREL(Multi-Granularity REpresentation Learning).This method divides the encrypted session into two granularities,field-level and packet-level.In field-level granularity,local behavior modeling is performed based on word vectors,handshake messages are extracted and key fields are selected to relieve the problem of incomplete information,the byte values of fields are represented as word vectors,and message types are added at the same time.Use the handshake type as the location prefix to solve the problem of lack of location semantics.Multi-head Attention is used to calculate the interaction between fields,and then BiLSTM is used to obtain the message-level semantics.In the packet-level granularity,global behavior modeling is performed based on space and time,and packets are extracted.The spatiotemporal state information is obtained and the LSTM model is used to obtain stream-level semantics.The local behavior semantics and global behavior semantics obtained at two granularities are fused to obtain the representation of encrypted traffic,which solves the problem of insufficient representation capability of a single granularity.Finally,it is verified by comparative experiments that the proposed method MGREL performs the best in detecting encrypted malicious traffic.

作者谷勇浩徐昊张晓青 GU Yong-Hao;XU Hao;ZHANG Xiao-Qing(Beijing Key Laboratory of Intelligent Telecommunications Software and Multimedia,School of Computer Science,Beijing University of Posts and Telecommunications,Beijing 100876;Guangdong Provincial Key Laboratory of Information Security Technology,Sun Yat-sen University,Guangzhou 510275)

机构地区北京邮电大学计算机学院智能通信软件与多媒体北京市重点实验室中山大学广东省信息安全技术重点实验室

出处《计算机学报》 EI CAS CSCD 北大核心 2023年第9期1888-1899,共12页 Chinese Journal of Computers

基金北京邮电大学中央高校基本科研业务费行动计划项目(2021XD-A11-1) CCF-蚂蚁科研基金(20210026) 广东省信息安全技术重点实验室开放基金(2020B1212060078)资助。

关键词加密恶意流量检测多粒度表征学习局部行为全局行为位置语义 encrypted malicious traffic detection multi-granularity representation learning local behavior global behavior positional semantics

分类号 TP309 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献4

1胡斌,周志洪,姚立红,李建华.结合报文负载与流指纹特征的恶意流量检测[J].计算机工程,2020,46(11):157-163. 被引量：14
2程华,谢金鑫,陈立皇.基于CNN的加密C&C通信流量识别方法[J].计算机工程,2019,45(8):31-34. 被引量：16
3蒋彤彤,尹魏昕,蔡冰,张琨.基于层次时空特征与多头注意力的恶意加密流量识别[J].计算机工程,2021,47(7):101-108. 被引量：22
4邹源,张甲,江滨.基于LSTM循环神经网络的恶意加密流量检测[J].计算机应用与软件,2020,37(2):308-312. 被引量：14

二级参考文献8

1陈伟,胡磊,杨龙.基于载荷特征的加密流量快速识别方法[J].计算机工程,2012,38(12):22-25. 被引量：12
2潘吴斌,程光,郭晓军,黄顺翔.网络加密流量识别研究综述及展望[J].通信学报,2016,37(9):154-167. 被引量：64
3陈清明,朱少辉.关于工业控制系统网络安全审查工作的思考[J].信息安全与通信保密,2018,16(6):59-67. 被引量：7
4陈瑞东,赵凌园,张小松.基于模糊聚类的僵尸网络识别技术[J].计算机工程,2018,44(10):46-50. 被引量：4
5王攀,陈雪娇.基于堆栈式自动编码器的加密流量识别方法[J].计算机工程,2018,44(11):140-147. 被引量：17
6陈良臣,高曙,刘宝旭,卢志刚.网络加密流量识别研究进展及发展趋势[J].信息网络安全,2019(3):19-25. 被引量：27
7程华,谢金鑫,陈立皇.基于CNN的加密C&C通信流量识别方法[J].计算机工程,2019,45(8):31-34. 被引量：16
8胡斌,周志洪,姚立红,李建华.结合报文负载与流指纹特征的恶意流量检测[J].计算机工程,2020,46(11):157-163. 被引量：14

共引文献47

1陈荣平.基于DPI和机器学习的加密流量类型识别研究[J].数字通信世界,2019(4):130-130. 被引量：1
2连晓伟,马垚,陈永乐,张壮壮,王建华.基于载荷特征与统计特征的Shodan流量识别[J].计算机工程,2021,47(1):117-122. 被引量：3
3陈明豪,祝跃飞,芦斌,翟懿,李玎.基于Attention-CNN的加密流量应用类型识别[J].计算机科学,2021,48(4):325-332. 被引量：8
4杨超辉.基于行为特征的通信数据分类识别系统设计[J].长江信息通信,2021,34(5):59-61.
5蒋彤彤,尹魏昕,蔡冰,张琨.基于层次时空特征与多头注意力的恶意加密流量识别[J].计算机工程,2021,47(7):101-108. 被引量：22
6王洋,陈紫儿,柳瑞春,李雨泰,尚智婕.基于决策树算法的网络加密流量识别方法[J].长江信息通信,2021,34(11):15-17. 被引量：5
7王曦锐,芦天亮,张建岭,丁锰.基于加权Stacking集成学习的Tor匿名流量识别方法[J].信息网络安全,2021(12):118-125. 被引量：7
8杨东,李丹.基于BoTNet的车辆分类实现[J].电子测试,2021,32(24):57-59.
9姚青,谢永恒,周汉川,余勇,万月亮.新一代深度报文检测设备对城市安全态势感知的影响[J].长江信息通信,2022,35(2):15-19. 被引量：1
10陈紫儿,王洋,柳瑞春,李雨泰,尚智婕.基于XGBoost算法的HTTPS流量识别方法[J].长江信息通信,2022,35(2):105-107.

同被引文献1

1霍跃华,赵法起,吴文昊.多特征融合的煤矿网络加密恶意流量检测方法[J].工矿自动化,2022,48(7):142-148. 被引量：3

引证文献1

1江魁,陈小雷,顾杜娟,李文瑾,李越挺.基于可变长序列的恶意加密流量检测方法[J].福州大学学报（自然科学版）,2023,51(5):711-716.

1陈仲磊,伊鹏,陈祥,胡涛.融合注意力与卷积的系统调用异常检测[J].信息工程大学学报,2023,24(4):475-483.
2刘松岳,王欢.基于多粒度特征融合的叶片分类与分级方法[J].计算机科学,2023,50(3):216-222.
3马静宜.浅谈人工智能背景下财务机器人在会计行业的应用[J].中国电子商务,2023(5):58-60.
4尹禛.基于信息熵的匿名流量检测方法[J].电脑与电信,2023(5):58-62.
5吴逸嘉,于娟,韩建民,曹小倩,姚鑫,彭浩.基于前缀邻接表的高可用性差分隐私轨迹发布方法[J].浙江师范大学学报（自然科学版）,2023,46(3):254-264.
6霍跃华,吴文昊,赵法起,王强.结合协同训练的多视图加密恶意流量检测方法[J].西安电子科技大学学报,2023,50(4):139-147.
7陈媛,陈红.融合底层信息的电气工程领域神经机器翻译[J].河南科技大学学报（自然科学版）,2023,44(6):42-48. 被引量：1
8杨春雷.德本论:华夏道德仁义礼体系的一个经济学视角梳理[J].文史哲,2023(3):31-48. 被引量：2
9陆春媚,杨志景.多级精细化反卷积点云补全网络[J].计算机工程与应用,2023,59(17):242-249. 被引量：2
10许盛亮,郑松.基于CNN-MHA-BiLSTM的云控制系统DDoS攻击检测[J].指挥与控制学报,2023,9(3):355-360.

计算机学报

2023年第9期

浏览历史

内容加载中请稍等...

基于多粒度表征学习的加密恶意流量检测被引量：1

参考文献4

二级参考文献8

共引文献47

同被引文献1

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于多粒度表征学习的加密恶意流量检测 被引量：1

参考文献4

二级参考文献8

共引文献47

同被引文献1

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于多粒度表征学习的加密恶意流量检测被引量：1