一种基于多特征的恶意代码家族静态标注方法被引量：4

A Static Tagging Method of Malicious Code Family Based on Multi-Feature

下载PDF

导出

摘要描述了一种基于多特征的恶意代码家族静态标注方法,该方法针对现有技术提取特征单一的缺点,采用恶意代码可视化技术绘制恶意代码图像,并从图像源和文本源、字节码层和操作码层进行特征的提取,多来源多层次地提取特征.为了更好地利用提取自多个层次的特征,设计了3层多分类器联合框架来进行特征的学习,3层多分类器联合框架分为特征组合层、分类层和联合层.最后利用学习到的模型便可以自动进行恶意代码的标注.为了验证方法的有效性,对Microsoft提供的9类恶意代码进行恶意代码家族标注测试实验,实验结果表明,该方法在除了Simda恶意样本家族外,在其他样本家族中的准确率、精确率、召回率和F1-score均高于90%.通过实验证明了该方法的有效性和可靠性. This paper describes a method of static tagging of malicious code family based on multiple features,it uses malicious code visualization technology to draw malicious code image, extracts feature from image source and text source,byte code layer and operation code layer,it extract features from multiple sources'and multi-level which aims at overcoming defects that only extract features from one source.In order to make better use of the features extracted from multiple levels,this paper designs a 3-ldyer multi-classifier joint framework for feature learning, and the 3-layer multi-classifier joint framework is divided into three parts,which are feature combination layer;classification lancer'and union layer.Finally,we can use the learning model to tag the malicious code automatically.In order to verify the validity of the method,we made the malicious code family tagging test experiment with 9 kinds of malicious code in Microsoft's data set, and the experimental results show that our method has higher accuracy,precision,recall and Fl-score which are more than 90% in other sample families except Simda malicious code family. The validity and reliability of the method are proved by experiments.

作者刘亮刘露平何帅刘嘉勇 Liu Liang;Liu Luping;He Shuai;Liu Jiayong(College of Cybersecurity,Sichuan University,Chengdu 610065;College of Electronics and Information Engineering,Sichuan University,Chengdu 610065)

机构地区四川大学网络空间安全学院四川大学电子信息学院

出处《信息安全研究》 2018年第4期322-328,共7页 Journal of Information Security Research

基金 CCF-启明星辰鸿雁科研计划基金项目(CCF-VenustechR2017002)

关键词恶意代码家族多特征恶意代码图像机器学习多分类器联合框架 malicious code family malicious code image machine learning multi-feature multiclassifier joint framework

分类号 TP393 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1杨轶,苏璞睿,应凌云,冯登国.基于行为依赖特征的恶意代码相似性比较方法[J].软件学报,2011,22(10):2438-2453. 被引量：21
2徐小琳,云晓春,周勇林,康学斌.基于特征聚类的海量恶意代码在线自动分析模型[J].通信学报,2013,34(8):146-153. 被引量：12
3韩晓光,姚宣霞,曲武,郭长友.基于图像纹理聚类的恶意代码家族标注方法[J].解放军理工大学学报（自然科学版）,2014,15(5):440-449. 被引量：6

二级参考文献66

1Microsoft security intelligence report. 2007. http://www.microsoft.com/downloads/details.aspx?FamilylD=4EDE2572-1D39-46EA- 94C6-4851750A2CB0.
2Wang Z, Pierce K, McFarling S. BMAT--A binary matching tool for stale profile propagation. The Journal of Instruction-Level Parallelism, 2000,2:23-43.
3Bayer U, Comparetti PM, Hlauscheck C, Kruegel C, Kirda E. Scalable, behavior-based malware clustering. In: Proc. of the Network and Distributed System Security Symp. (NDSS). San Diego, 2009. http://www.isoc.org/isoc/conferences/ndss/09/ proceedings.shtml.
4Flake H. Structural comparison of executable objects. In: Proc. of the Detection of Intrusions and Malware & Vulnerability Assessment (DIMVA 2004). 2004.83-97.
5Dullien T, Rolles R. Graph-Based comparison of executable objects (English version). In: Proc. of the SSTIC 2005. 2005. http://www.sstic.org/2005/programme/.
6Rabek JC, Khazan RI, Lewandowski SM, Cunningham RK. Detection of injected, dynamically generated, and obfuscated malicious code. In: Staniford S, Savage S, eds. Proc. of the 2003 ACM Workshop on Rapid Malcode. New York: Association for Computing Machinery, 2003.76-82. [doi: 10.1145/948187.948201].
7Gao DB, Reiter MK, Song D. Binhunt: Automatically finding semantic differences in binary programs. In: Proc. of the Int'l Conf. on Information and Communications Security. Berlin, Heidelberg: Springer-Verlag, 2008. 238-255. [doi: 10.1007/978-3-540- 88625-9].
8Bayer U, Moser A, Kruegel C, Kirda E. Dynamic analysis of malicious code. Journal in Computer Virology, 2006,2(1):67 77. [doi: 10.1007/s11416-006-0012-2].
9Yin H, Song D, Egele M, Kruegel C, Kirda E. Panorama: Capturing system-wide information flow for malware detection and analysis. In: Ning P, ed. Proc. of the 14th ACM Conf. on Computer and Communications Security. New York: Association for Computing Machinery, 2007. 116 -127. [doi: 10.1145/1315245.1315261].
10Bailey M, Oberheide J, Andersen J, Mao ZM, Jahanian F, Nazario J. Automated classification and analysis of internet malware. In: Kruegel C, Lippmann R, Clark A, eds. Proc. of the 10th Int'l Conf. on Recent Advances in Intrusion Detection. Berlin, Heidelberg: Springer-Verlag, 2007. 178-197. [doi: 10.1007/978-3-540-74320-0 10].

共引文献35

1姚新磊,庞建民,岳峰,余勇.基于API依赖关系的代码相似度分析[J].计算机工程,2013,39(1):80-84. 被引量：2
2王克朝,王甜甜,苏小红,马培军,童志祥.面向程序理解的系统依赖图构建算法[J].哈尔滨工业大学学报,2013,45(1):78-84. 被引量：6
3曹莹,刘家辰,苗启广,高琳.AdaBoost恶意程序行为检测新算法[J].西安电子科技大学学报,2013,40(6):116-124. 被引量：5
4唐秋杭,孙歆.一种网络终端恶意程序攻击诱捕系统的设计和实现[J].计算机安全,2013(11):27-35. 被引量：1
5韩晓光,姚宣霞,曲武,郭长友.基于图像纹理聚类的恶意代码家族标注方法[J].解放军理工大学学报（自然科学版）,2014,15(5):440-449. 被引量：6
6张伟,刘清.基于传输层会话行为统计特征的恶意流量识别[J].小型微型计算机系统,2015,36(5):959-963. 被引量：2
7钱雨村,彭国军,王滢,梁玉.恶意代码同源性分析及家族聚类[J].计算机工程与应用,2015,51(18):76-81. 被引量：18
8付钰,李洪成,吴晓平,王甲生.基于大数据分析的APT攻击检测研究综述[J].通信学报,2015,36(11):1-14. 被引量：84
9徐东,狄效国,孟宇龙,冯晓宁.基于依赖图等价代换的SSDG构建算法[J].计算机工程,2015,41(12):91-95. 被引量：1
10姜冲,李宁,刘渊,董碧丹.基于运行时行为序列分析的恶意行为检测系统[J].计算机工程与设计,2016,37(3):602-608. 被引量：2

同被引文献31

1韩晓光,曲武,姚宣霞,郭长友,周芳.基于纹理指纹的恶意代码变种检测方法研究[J].通信学报,2014,35(8):125-136. 被引量：56
2钱雨村,彭国军,王滢,梁玉.恶意代码同源性分析及家族聚类[J].计算机工程与应用,2015,51(18):76-81. 被引量：18
3陈志锋,李清宝,张平,丁文博.基于数据特征的内核恶意软件检测[J].软件学报,2016,27(12):3172-3191. 被引量：9
4何帅,刘嘉勇.基于恶意代码图像指纹的恶意代码家族标注方法[J].通信技术,2017,50(3):545-549. 被引量：3
5Liu LIU,Bao-sheng WANG,Bo YU,Qiu-xi ZHONG.Automatic malware classification and new malware detection using machine learning[J].Frontiers of Information Technology & Electronic Engineering,2017,18(9):1336-1347. 被引量：10
6张晨斌,张云春,郑杨,张鹏程,林森.基于灰度图纹理指纹的恶意软件分类[J].计算机科学,2018,45(B06):383-386. 被引量：17
7戴超,庞建民,张一弛,孙笛,岳峰.基于语义特征的恶意代码检测综述[J].信息工程大学学报,2018,19(1):106-113. 被引量：2
8刘亚姝,王志海,严寒冰,侯跃然,来煜坤.抗混淆的恶意代码图像纹理特征描述方法[J].通信学报,2018,39(11):44-53. 被引量：8
9陈琪,蒋国平,夏玲玲.基于静态结构的恶意代码同源性分析[J].计算机工程与应用,2017,53(14):93-98. 被引量：7
10蒋永康,吴越,邹福泰.基于图像矢量的恶意代码分类模型[J].通信技术,2018,51(12):2953-2959. 被引量：7

引证文献4

1李豪,钱丽萍.恶意代码可视化检测技术研究综述[J].软件导刊,2022,21(5):9-16. 被引量：5
2刘紫煊,王晨.基于多特征融合的BiLSTM恶意代码分类[J].电子设计工程,2022,30(18):67-72. 被引量：4
3刘亚倩.基于开集识别的恶意代码家族同源性分析[J].信息安全研究,2023,9(8):762-770. 被引量：1
4王金伟,陈正嘉,谢雪,罗向阳,马宾.恶意软件检测和分类可视化技术综述[J].网络与信息安全学报,2023,9(5):1-20. 被引量：4

二级引证文献13

1林茂新,王太愚,王晶.静态代码安全检测技术发展研究与前沿技术实践[J].保密科学技术,2023(5):43-50.
2郭沁怡.恶意代码检测技术研究综述[J].电脑知识与技术,2023,19(13):79-81. 被引量：2
3李思聪,王坚,宋亚飞,黄玮.基于BiTCN-DLP的恶意代码分类方法[J].信息网络安全,2023(11):104-117. 被引量：2
4周桥,翟江涛,荚东升,孙浩翔.基于卷积门控循环神经网络的Web攻击检测方法[J].广西师范大学学报（自然科学版）,2023,41(6):51-61. 被引量：5
5农博文,陈钰军,黄苦甘.基于BiLSTM神经网络与TF-IDF算法的OBD位置校准[J].数字技术与应用,2024,42(1):66-68. 被引量：3
6宋亚飞,张丹丹,王坚,王亚男,郭新鹏.基于深度学习的恶意代码检测综述[J].空军工程大学学报,2024,25(4):94-106.
7Li Li,Qing Zhang,Youran Kong.A GAN-EfficientNet-Based Traceability Method for Malicious Code Variant Families[J].Computers, Materials & Continua,2024,80(7):801-818.
8孙世淼,刘亚姝,严寒冰.基于多字节频率域可视化和深度学习的恶意软件检测[J].计算机工程与设计,2024,45(8):2272-2280.
9张雅勤,陈慧,马升.基于系统调用监控的主动反勒索技术研究[J].工业信息安全,2024(4):19-31.
10王琪,任建国,王磊.基于移动众包网络动态激励机制的恶意代码传播模型[J].软件导刊,2024,23(10):161-167.

1张友星,王寅吉.塔里木油田塔类联合框架整体嵌套安装技术[J].石油工程建设,2018,44(B09):86-88.
2王锦毓,杨永挺,金玲芳,胡欣.介入操作编码对DRGs评价指标的影响[J].中国病案,2018,19(11):15-16. 被引量：6
3戚小玉,李平,岳应宁,刘宁宁,杨连报,刘彦军.铁路大数据可视化技术研究及应用[J].铁路计算机应用,2018,27(12):36-41. 被引量：16
4刘鑫,李向均,李淑滢,周邓,李敏,汪鑫.智能车库[J].电子世界,2018,0(23):109-109. 被引量：2
5于鹏,李刚,张恒.城乡规划数据统计分析系统的建设与应用[J].规划师,2018,34(12):84-89. 被引量：3
6成凌飞,贺扬,张培玲,李艳.压缩深层神经网络隐藏层维度对其分类性能的影响[J].电子科技,2019,32(1):72-75. 被引量：8
7程梦瑶.久其分析机器人:AI激活最强大脑[J].软件和集成电路,2018,0(12):24-27.
8杨文豪,倪文龙,付强,孙舟,郭奇,钱宏文.基于FPGA与DDR3缓存的PAL制式图像源产生模块设计与实现[J].实验室研究与探索,2018,37(11):96-99. 被引量：4
9胡瑛,杨蕾颖.基于BIM技术的工程进度可视化管理研究[J].价值工程,2018,37(34):98-99. 被引量：5
10何杭松.基于Xgboost算法的Shadowsocks流量识别研究[J].软件导刊,2018,17(12):200-203. 被引量：7

信息安全研究

2018年第4期

浏览历史

内容加载中请稍等...

一种基于多特征的恶意代码家族静态标注方法被引量：4

参考文献3

二级参考文献66

共引文献35

同被引文献31

引证文献4

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

一种基于多特征的恶意代码家族静态标注方法 被引量：4

参考文献3

二级参考文献66

共引文献35

同被引文献31

引证文献4

二级引证文献13

相关作者

相关机构

相关主题

浏览历史

一种基于多特征的恶意代码家族静态标注方法被引量：4