一种基于QBC不一致性的恶意加密流量识别方法被引量：1

Method for identifying malicious encrypted traffic based on QBC inconsistency

下载PDF

导出

摘要当前基于机器学习的恶意加密流量识别主要采用有监督学习,依赖大量标注样本,但在真实环境中恶意流量不仅稀缺而且标注依赖专家经验,标注成本较高,而主动学习通过迭代训练选择困难样本(hardsample)进行训练,一定程度上减少了训练样本量,但当前基于委员会投票的hardsample选择策略粒度较粗,所选样本质量不佳。针对该问题,提出一种改进委员会投票(QBC)的恶意加密流量识别方法CBU,设计了委员会对样本不一致性的计算方法,并结合已标注与未标注样本相似性分析,有效度量样本不确定性,从而选择高质量hardsample,以减少样本标记和训练量。实验使用业界标准数据集CTU以及真实恶意数据集进行测试,结果表明,相比传统委员会投票策略,CBU样本标记量减少1倍,只采用15%数据的情况下识别准确率达到96%,有效减少样本标注和训练量,具有较强实用性。 At present,the identification of malicious encrypted traffic based on machine learning mainly uses supervised learning and relies on a large number of labeled samples.However,in the real environment,malicious traffic is not only scarce but also depends on expert experience,and the labeling cost is high.Active learning selects difficult samples through iterative for training,which reduces the amount of training samples to a certain extent,but the current hardsample selection strategy based on committee votes has a coarser granularity,and the quality of the selected samples is not good.In response to this problem,a CBU is proposed to improve the query by committee(QBC)method for identifying malicious encrypted traffic.Labeling sample similarity analysis,effectively measuring sample uncertainty,and selecting high-quality hardsamples to reduce sample labeling and training volume.The experiment uses the industry standard data set CTU and real malicious data sets for testing.The results show that compared with the traditional committee voting strategy,the amount of CBU sample labeling is doubled,and the recognition accuracy rate of only 15% of the data amount is 96%,which effectively reduces the sample labeling.And training volume,and it has strong practicability.

作者张荣华刘智罗琴 Zhang Ronghua;Liu Zhi;Luo Qin(School of Computer Science,Southwest Petroleum University.Chengdu 610500,China)

机构地区西南石油大学计算机科学学院

出处《电子测量技术》北大核心 2022年第1期28-34,共7页 Electronic Measurement Technology

基金国家自然科学基金(61902328)项目资助。

关键词加密流量主动学习样本选择恶意识别 encrypted traffic active learning sample selection malicious identification

分类号 TP393.08 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献12

1何晓梅.基于条件随机场的音乐共同语义标注[J].电子测量技术,2016,39(8):70-74. 被引量：3
2张胜男,苑玮琦.圆阵列平面靶标特征点的自动标记[J].计算机工程与应用,2016,52(5):169-172. 被引量：1
3陈利琴,金聪.基于异构描述子的新型高斯混合模型图像自动标注方法[J].电子测量技术,2015,38(11):60-65. 被引量：2
4李翼宏,刘方正,杜镇宇.一种改进主动学习的恶意代码检测算法[J].计算机科学,2019,46(5):92-99. 被引量：7
5毛蔚轩,蔡忠闽,童力.一种基于主动学习的恶意代码检测方法[J].软件学报,2017,28(2):384-397. 被引量：27
6胡峰,张苗,于洪.基于三支决策的主动学习方法[J].控制与决策,2019,34(4):718-726. 被引量：8
7徐海龙,别晓峰,冯卉,吴天爱.一种基于QBC的SVM主动学习算法[J].系统工程与电子技术,2015,37(12):2865-2871. 被引量：8
8张琳.基于a-BvSBEM主动学习的高光谱图像分类[J].国外电子测量技术,2017,36(4):17-20. 被引量：5
9骆子铭,许书彬,刘晓东.基于机器学习的TLS恶意加密流量检测方案[J].网络与信息安全学报,2020,6(1):77-83. 被引量：16
10饶亲苗,彭艳兵.基于DPI的应用指纹自动提取方法研究[J].计算机应用与软件,2021,38(4):328-333. 被引量：3

二级参考文献88

1张弛,李中伟,史玉升,王从军.标定板圆心序列化自动编码算法的研究[J].计算机工程,2011,37(S1):365-367. 被引量：1
2于莉娜,胡正平,练秋生.基于改进随机Hough变换的混合圆/椭圆快速检测方法[J].电子测量与仪器学报,2004,18(2):92-97. 被引量：18
3徐杰,施鹏飞.图像检索中基于标记与未标记样本的主动学习算法[J].上海交通大学学报,2004,38(12):2068-2072. 被引量：7
4张翔,肖小玲,徐光祐.基于最大熵估计的支持向量机概率建模[J].控制与决策,2006,21(7):767-770. 被引量：12
5赵悦,穆志纯,董洁,付冬梅,何伟.基于QBC主动学习方法建立电信客户信用风险等级评估模型[J].北京科技大学学报,2007,29(4):442-446. 被引量：2
6王忠石,徐心和.棋盘格模板角点的自动识别与定位[J].中国图象图形学报,2007,12(4):618-622. 被引量：13
7Cohn D A, Ghahramani Z, Jordan M I. Active learning with sta- tistical madels[J]. Journal of Artificial Intelligence Research, 1996, 4:129-145.
8Roy N, McCallum A K. Toward optimal active learning through sampling estimation of error reductionEC]//Proc, of the 18th International Conference on Machine Learning, 2001 : 441 ~ 448.
9Lewis D D,Gale W. A sequential algorithm for training text clas- sifiers[C]//Proc, of the 17th Annual International ACM S IG IR Conference on Research and Development in Information Re trieval,1994:3 - 12.
10Seung H S, Opper M, Sompolinsky H. Query by committee. EC~// Proc. of the 15th Annual ACM Workshop on Computational Learn- ing Theory, 1992 ~287 - 294.

共引文献95

1刘振宇,李钦富,杨硕,邓应强,刘芬,赖新明,白雪珂.一种基于主动学习和多种监督学习的情感分析模型[J].中国电子科学研究院学报,2020,15(2):171-176. 被引量：2
2杨滔,孙博,杨晓君.基于超像素锚层收敛选点的高光谱图像聚类算法[J].电子测量技术,2023,46(6):77-83. 被引量：1
3贾立鹏,王凤英,姜倩玉.基于多特征融合和集成学习的恶意代码检测研究[J].中国科技论文在线精品论文,2021(2):168-176. 被引量：1
4朱东阳,沈静逸,黄炜平,梁军.基于主动学习和加权支持向量机的工业故障识别[J].浙江大学学报（工学版）,2017,51(4):697-705. 被引量：3
5王玉娇,耿思,李宁.东巴古籍资源的数字化及数据管理[J].电子测量与仪器学报,2017,31(4):636-643. 被引量：6
6徐国天.基于DGA的恶意程序域名生成算法破解[J].信息网络安全,2017(9):26-29. 被引量：6
7孟博,鲁金钿,王德军,何旭东.安全协议实施安全性分析综述[J].山东大学学报（理学版）,2018,53(1):1-18. 被引量：4
8陈涛,张华飞,衣传宝,孙成勋,高阳,徐华雷.改进的Adaboost方法及其在水电站设备故障检测中的应用[J].水力发电,2018,44(3):62-65. 被引量：3
9尹捷,崔翔,方滨兴,衣龙浩,张方娇.一种抗污染的混合P2P僵尸网络[J].信息安全学报,2018,3(1):68-82. 被引量：1
10余卿,张学典,崔长彩.色散聚焦分离式彩色共聚焦测量系统研究[J].仪器仪表学报,2018,39(3):100-107. 被引量：3

同被引文献8

1邹源,张甲,江滨.基于LSTM循环神经网络的恶意加密流量检测[J].计算机应用与软件,2020,37(2):308-312. 被引量：15
2韦佶宏,郑荣锋,刘嘉勇.基于混合神经网络的恶意TLS流量识别研究[J].计算机工程与应用,2021,57(7):107-114. 被引量：14
3曾勇,吴正远,董丽华,刘志宏,马建峰,李赞.加密流量中的恶意流量识别技术[J].西安电子科技大学学报,2021,48(3):170-187. 被引量：21
4蒋彤彤,尹魏昕,蔡冰,张琨.基于层次时空特征与多头注意力的恶意加密流量识别[J].计算机工程,2021,47(7):101-108. 被引量：23
5李小剑,谢晓尧,徐洋,张思聪.基于CNN⁃SIndRNN的恶意TLS流量快速识别方法[J].计算机工程,2022,48(4):148-157. 被引量：7
6丁要军,王安宙.基于CWGAN-GP平衡化的网络恶意流量识别方法[J].电子科技大学学报,2022,51(5):760-765. 被引量：2
7王一丰,郭渊博,陈庆礼,方晨,林韧昊,周永良,马佳利.基于对比增量学习的细粒度恶意流量分类方法[J].通信学报,2023,44(3):1-11. 被引量：2
8邓昕,刘朝晖,欧阳燕,陈建华.基于CNN CBAM-BiGRU Attention的加密恶意流量识别[J].计算机工程,2023,49(11):178-186. 被引量：2

引证文献1

1常志华,许国辉.网络攻击检测中基于深度学习的恶意流量识别[J].网络安全技术与应用,2024(6):43-45.

1我国科学家发现两种新矿物[J].中国非金属矿工业导刊,2021(3):21-21.
2彭浩,吴俊.江苏:培植人才成长沃土[J].国家电网,2021(9):54-55.
3黄涛,王飞,杨晔.基于优化插值与差值神经网络算法的硅片刻蚀深度预测模型[J].计算机应用,2021,41(S02):108-112. 被引量：1
4冯传诚,周彤,王志强.对比式训练对下肢爆发力提升效果的Meta分析[J].武汉体育学院学报,2021,55(11):85-91. 被引量：6
5柳永春,李娟.基于主动学习的图像分类协同训练模型研究[J].赤峰学院学报（自然科学版）,2021,37(11):3-6. 被引量：3
6易灿,刘彦姝.行为特征中大数据海量Web流量识别与研究[J].电子测试,2022(4):63-65.
7吴登富.高中体育田径教学的训练强度及训练量研究[J].世纪之星—交流版,2021(20):79-80.
8丁克,叶忠康,刘平清.线上线下混合教学模式研究脉络与趋势探析——基于citespace知识图谱分析[J].六盘水师范学院学报,2022,34(1):82-90. 被引量：13
9郭秀丽.中西医结合治疗老年型慢性糜烂性胃炎的临床研究[J].益寿宝典,2021(32):14-16. 被引量：1
10刘荣恒.井下工具的选择对采油工艺的价值[J].化工管理,2022(9):122-124. 被引量：3

电子测量技术

2022年第1期

浏览历史

内容加载中请稍等...

一种基于QBC不一致性的恶意加密流量识别方法被引量：1

参考文献12

二级参考文献88

共引文献95

同被引文献8

引证文献1

相关作者

相关机构

相关主题

浏览历史

一种基于QBC不一致性的恶意加密流量识别方法 被引量：1

参考文献12

二级参考文献88

共引文献95

同被引文献8

引证文献1

相关作者

相关机构

相关主题

浏览历史

一种基于QBC不一致性的恶意加密流量识别方法被引量：1