基于半监督生成对抗网络的恶意代码家族分类实现被引量：3

Realization of malicious code family classification based on semi-supervised generative adversarial network

下载PDF

导出

摘要随着互联网的发展,恶意代码呈现海量化与多态化的趋势,恶意代码家族分类是网络空间安全面临的挑战之一。将半监督生成对抗网络与深度卷积学习网络相结合,构建半监督深度卷积生成对抗网络,提出了一种恶意代码家族分类模型,通过恶意代码家族特征分析,对恶意代码进行特征提取,转化为一维灰度图像;然后基于一维卷积神经网络1D-CNN,构建半监督生成对抗网络SGAN,形成恶意代码家族分类模型SGAN-CNN。从特征提取优化、半监督生成对抗训练算法优化等方面进行恶意代码家族分类能力提升。为了验证SGAN-CNN模型的分类效果,在Microsoft Malware Classification Challenge数据集上进行实验。5折交叉验证测试显示,本文提出的模型在样本标注标签占80%的情况下,分类的平均准确率达到98.81%;在样本标注标签仅有20%的情况下,分类的平均准确率达到98.01%,取得了较好的分类效果。在小样本数量情况下,也能取得不错的分类准确率。 With the development of Internet,malicious code tend to be massive and polymorphic.The classification of malicious code family is one of the challenges of cyber security.Combining the semi supervised generation network with the deep convolutional neural network,a multi-family malicious code classification model is proposed.Taking the gray image of malicious codes as the feature,based on the efficient one-dimensional convolutional neural network(1 D-CNN),using the semi-supervised generative adversarial network(SGAN),an efficient and accurate malicious code family classification model is constructed as SGAN-CNN,which can improve the malicious code classification ability from aspects of efficient feature extraction and SGAN optimization.In order to verify the classification ability of the model,experiments are carried out on the Microsoft malware classification challenge data set.5-fold cross-validation shows that the proposed model achieves 98.81% of the average accuracy of the test set with 80% of the tag rate,98.01% of the average accuracy of the test set with 20% of the tag rate,and achieves better experimental results.In the case of small samples,it can also achieve good classification accuracy.

作者王栋杨珂玄佳兴韩雨桐赵丽花王旭仁 WANG Dong;YANG Ke;XUAN Jia-xing;HAN Yu-tong;ZHAO Li-hua;WANG Xu-ren(State Grid Electronic Commerce Co.,Ltd.(State Grid Xiong’an Financial Technology Group Co.,Ltd.),Beijing 100053;Blockchain Technology Laboratory,State Grid Corporation of China,Beijing 100053;Institute of Information Engineering,Chinese Academy of Sciences,Beijing 100093;College of Information Engineering,Capital Normal University,Beijing 100048,China)

机构地区国网电子商务有限公司(国网雄安金融科技集团有限公司) 国家电网有限公司区块链技术实验室中国科学院信息工程研究所首都师范大学信息工程学院

出处《计算机工程与科学》 CSCD 北大核心 2022年第5期826-833,共8页 Computer Engineering & Science

基金国家自然科学基金(61872252) 国家重点研发计划项目(2018YFB0805005) 国网电商公司科技项目(2500/2020-72001B)。

关键词深度学习一维卷积神经网络半监督学习生成对抗网络恶意代码分类 deep learning one-dimensional convolutional neural network semi-supervised learning generative adversarial network malicious code classification

分类号 TP393 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1孙博文,张鹏,成茗宇,李新童,李祺.基于代码图像增强的恶意代码检测方法[J].清华大学学报（自然科学版）,2020,60(5):386-392. 被引量：9
2张景莲,彭艳兵.基于特征融合的恶意代码分类研究[J].计算机工程,2019,45(8):281-286. 被引量：14
3王栋,杨珂,玄佳兴,韩雨桐,廖会敏,魏博垚.基于一维卷积神经网络的恶意代码家族多分类方法研究[J].计算机应用与软件,2021,38(12):332-336. 被引量：8

二级参考文献10

1王蕊,冯登国,杨轶,苏璞睿.基于语义的恶意代码行为特征提取及检测方法[J].软件学报,2012,23(2):378-393. 被引量：74
2朱克楠,尹宝林,冒亚明,胡英男.基于有效窗口和朴素贝叶斯的恶意代码分类[J].计算机研究与发展,2014,51(2):373-381. 被引量：13
3韩晓光,曲武,姚宣霞,郭长友,周芳.基于纹理指纹的恶意代码变种检测方法研究[J].通信学报,2014,35(8):125-136. 被引量：56
4李盟,贾晓启,王蕊,林东岱.一种恶意代码特征选取和建模方法[J].计算机应用与软件,2015,32(8):266-271. 被引量：13
5张东,张尧,刘刚,宋桂香.基于机器学习算法的主机恶意代码检测技术研究[J].网络与信息安全学报,2017,3(7):25-32. 被引量：8
6任卓君,陈光.熵可视化方法在恶意代码分类中的应用[J].计算机工程,2017,43(9):167-171. 被引量：9
7王卫红,朱雨辰.基于N-Gram与加权分类器集成的恶意代码检测[J].浙江工业大学学报,2017,45(6):604-609. 被引量：9
8崔鸿雁,徐帅,张利锋,Roy E.Welsch,Berthold K.P.Horn.机器学习中的特征选择方法研究及展望[J].北京邮电大学学报,2018,41(1):1-12. 被引量：42
9张晨斌,张云春,郑杨,张鹏程,林森.基于灰度图纹理指纹的恶意软件分类[J].计算机科学,2018,45(B06):383-386. 被引量：16
10乔延臣,姜青山,古亮,吴晓明.基于汇编指令词向量与卷积神经网络的恶意代码分类方法研究[J].信息网络安全,2019(4):20-28. 被引量：14

共引文献28

1张正欣.计算机恶意代码的检测与查杀[J].产业科技创新,2020(36):67-69.
2钟红月,彭元康,刘浩因.基于Skip-Gram的恶意软件家族检测方法[J].办公自动化,2021,26(9):51-53. 被引量：1
3曾娅琴,张琳琳,张若楠,杨波.基于MobileNet的恶意软件家族分类模型[J].计算机工程,2020,46(4):162-168. 被引量：10
4贾立鹏,王凤英,姜倩玉.基于DQN的恶意代码检测研究[J].网络安全技术与应用,2020(6):57-60. 被引量：1
5范志鹏,李军,刘宇强,钮焱.基于灰度纹理指纹的恶意代码分类[J].科学技术与工程,2020,20(29):12014-12020. 被引量：6
6王润正,高见,黄淑华,仝鑫.基于知识蒸馏的恶意代码家族检测方法[J].计算机科学,2021,48(1):280-286. 被引量：3
7姜倩玉,王凤英,贾立鹏.基于感知哈希算法和特征融合的恶意代码检测方法[J].计算机应用,2021,41(3):780-785. 被引量：3
8陈佳捷,彭伯庄,吴佩泽.基于动态行为和机器学习的恶意代码检测方法[J].计算机工程,2021,47(3):166-173. 被引量：8
9杨春雨,徐洋,张思聪,李小剑.基于静态特征融合的恶意软件分类方法[J].计算机工程与应用,2021,57(15):147-155. 被引量：2
10王慧.恶意代码同源性特征的粒子群关联分析[J].中国人民公安大学学报（自然科学版）,2021,27(3):61-65.

同被引文献49

1刘强,邓亚平,徐震,董世蓉,殷科.隐藏木马检测技术的研究[J].计算机工程,2006,32(1):180-182. 被引量：9
2赵晓君,王小英,张咏梅,沈焱萍.基于恶意代码行为分析的入侵检测技术研究[J].计算机仿真,2015,32(4):277-280. 被引量：6
3王林,张鹤鹤.Faster R-CNN模型在车辆检测中的应用[J].计算机应用,2018,38(3):666-670. 被引量：63
4邵思豪,高庆,马森,段富尧,马骁,张世琨,胡津华.缓冲区溢出漏洞分析技术研究进展[J].软件学报,2018,29(5):1179-1198. 被引量：22
5戴超,庞建民,张一弛,孙笛,岳峰.基于语义特征的恶意代码检测综述[J].信息工程大学学报,2018,19(1):106-113. 被引量：2
6杨宏宇,那玉琢.一种Android恶意软件检测模型[J].西安电子科技大学学报,2019,46(3):45-51. 被引量：5
7马博林,张铮,陈源,邬江兴.基于指令集随机化的抗代码注入攻击方法[J].信息安全学报,2020,5(4):30-43. 被引量：8
8刘宇韬,盛文娟.基于AdaBoost-LSSVM的纤维复合材料损伤识别[J].中国测试,2020,46(9):148-153. 被引量：5
9李海涛,袁森.基于遗传算法和BP神经网络的海洋工程材料腐蚀预测研究[J].海洋科学,2020,44(10):33-38. 被引量：16
10刘岳,刘宝旭,赵子豪,刘潮歌,王晓茜,吴贤达.基于特征组合的Powershell恶意代码检测方法[J].信息安全学报,2021,6(1):40-53. 被引量：3

引证文献3

1黄玮,王坚,吴暄,李思聪.基于BiTCN-SA的恶意代码分类方法[J].空军工程大学学报,2023,24(4):77-84. 被引量：1
2黄富幸,韩文花.基于Voting机制的IMA-BP不平衡数据分类算法[J].科学技术与工程,2023,23(27):11698-11705. 被引量：2
3宋亚飞,张丹丹,王坚,王亚男,郭新鹏.基于深度学习的恶意代码检测综述[J].空军工程大学学报,2024,25(4):94-106.

二级引证文献3

1李思聪,王坚,宋亚飞,黄玮.基于BiTCN-DLP的恶意代码分类方法[J].信息网络安全,2023(11):104-117. 被引量：1
2徐天培,罗永胜.基于集成学习的信用卡欺诈检测模型[J].信息系统工程,2024(1):129-132. 被引量：1
3李福民,杨柳,刘小杰,孟令茹,李宏扬,吕庆.基于递归特征消除-梯度提升决策树的高炉悬料智能诊断模型[J].冶金自动化,2024,48(4):90-100.

1苏林贺,黄东,曾伟民,张彦龙.黑木耳凝集素的提取优化及体外抗肿瘤活性的研究[J].中国农学通报,2022,38(9):143-150. 被引量：3
2Dong-Wook Kim,Gun-Yoon Shin,Myung-Mook Han.Analysis of Feature Importance and Interpretation for Malware Classification[J].Computers, Materials & Continua,2020(12):1891-1904. 被引量：2
3张冬雯,张少华,陈振国,张光华,于乃文.基于多特征融合的恶意软件分类方案[J].微电子学与计算机,2022,39(5):87-95.
4Xiong Luo,Jianyuan Li,Weiping Wang,Yang Gao,Wenbing Zhao.Towards improving detection performance for malware with a correntropy-based deep learning method[J].Digital Communications and Networks,2021,7(4):570-579. 被引量：2
5邓兵.同步以太网在5G网络设备中的应用[J].科技创新与应用,2022,12(14):167-171. 被引量：2
6Chong Guo,Chaoying Song,Jiali Zhang,Yisong Gao,Yuying Qi,Zongyao Zhao,Chengfu Yuan.Revisiting chemoresistance in ovarian cancer:Mechanism,biomarkers,and precision medicine[J].Genes & Diseases,2022,9(3):668-681.
7Lunzhi Yuan,Ming Zhou,Jian Ma,Xuan Liu,Peiwen Chen,Huachen Zhu,Qiyi Tang,Tong Cheng,Yi Guan,Ningshao Xia.Dexamethasone ameliorates severe pneumonia but slightly enhances viral replication in the lungs of SARS-CoV-2-infected Syrian hamsters[J].Cellular & Molecular Immunology,2022,19(2):290-292. 被引量：3
8Shuaishuai Wei,Bo Song,Yuanjie Zhang,Lei Zhang,Yusheng Shi.Mechanical Response of Triply Periodic Minimal Surface Structures Manufactured by Selective Laser Melting with Composite Materials[J].Acta Metallurgica Sinica(English Letters),2022,35(3):397-410. 被引量：1
9Qing Li,Ming Dai,Xueren Qian,Tian Liu,Zhenbo Liu,Yu Liu,Ming Chen,Wang He,Suqing Zeng,Yu Meng,Chenchen Dai,Jing Shen,Yingtao Liu,Wenshuai Chen,Wenbo Liu,Ping Lu.Flexible Nanopaper Composed of Wood-Derived Nanofibrillated Cellulose and Graphene Building Blocks[J].Journal of Renewable Materials,2021,9(3):451-461.
10Xiaonan Zheng,Yang Liu,Yu Yan,Xiaoxiao Li,Yuan Yao.Modulation effect in adjacent dual metal single atom catalysts for electrochemical nitrogen reduction reaction[J].Chinese Chemical Letters,2022,33(3):1455-1458.

计算机工程与科学

2022年第5期

浏览历史

内容加载中请稍等...

基于半监督生成对抗网络的恶意代码家族分类实现被引量：3

参考文献3

二级参考文献10

共引文献28

同被引文献49

引证文献3

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于半监督生成对抗网络的恶意代码家族分类实现 被引量：3

参考文献3

二级参考文献10

共引文献28

同被引文献49

引证文献3

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于半监督生成对抗网络的恶意代码家族分类实现被引量：3