基于特征聚类的海量恶意代码在线自动分析模型被引量：12

Online analytical model of massive malware based on feature clusting

下载PDF

导出

摘要针对传统海量恶意代码分析方法中自动特征提取能力不足以及家族判定时效性差等问题,通过动静态方法对大量样本行为构成和代码片段分布规律的研究,提出了基于特征聚类的海量恶意代码在线自动分析模型,包括基于API行为和代码片段的特征空间构建方法、自动特征提取算法和基于LSH的近邻聚类算法。实验结果表明该模型具有大规模样本自动特征提取、支持在线数据聚类、家族判定准确率高等优势,依据该模型设计的原型系统实用性较强。 In order to improve the effectiveness and efficiency of mass malicious code analysis, an online analytical model was proposed including feature space construction, automatic feature extraction and fast clustering. Our research focused on the law of malware behavior and code string distribution by dynamic and static techniques. In this model, a sample was described with its API and key code fragment. This model proposed a fast clustering approach to identify group samples that exhibit similar feature when applied this model to real-world malware collections. The result demon- strates that the proposed model is able to extract feature automatically, support streaming data clustering on large-scale, and achieve better precision.

作者徐小琳云晓春周勇林康学斌

机构地区中国科学院计算技术研究所中国科学院大学中国科学院信息工程研究所国家计算机网络应急技术处理协调中心安天实验室

出处《通信学报》 EI CSCD 北大核心 2013年第8期146-153,共8页 Journal on Communications

基金国家高技术研究发展计划("863"计划)基金资助项目(2013AA014700) 国家科技支撑计划基金资助项目(2012BAH46B02) 中国科学院战略性科技先导专项基金资助项目(XDA06030200)~~

关键词恶意代码在线自动分析快速聚类特征提取 malware on-line analytical fast clustering feature extraction

分类号 TP393.08 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献22

1EGELE M, SCHOLTE T, KIRDA E, et al. A survey on automated dynamic malware-analysis techniques and tools[J]. ACM Computing Surveys (CSUR), 2012, 44(2): 1-42.
2KEPHART J O, ARNOLD W C. Automatic extraction of computer virus signatures[A]. Proceedings of the 4th Virus Bulletin Intemational Conference[C] 1994.178-184.
3SATHYANARAYAN V S, KOHLI P, BRUHADESHWAR B. Signa- ture generation and detection of malware families[A]. Information Security and Privacy[C]. Springer Berlin Heidelberg, 2008. 336-349.
4SATISH S, PEREIRA S. Behavioral Signature Generation Using Clustering: WIPO Patent 2011137083[P]. 2011.
5KOLBITSCH C, COMPARETTI P M, KRUEGEL C, et al. Effective and efficient malware detection at the end host[A]. Proceedings of the 18th Conference on USENIX Security Symposium USENIX Association[C]. 2009.351-366.
6RAMACHANDRAN A, FEAMSTER N. Understanding the network-level behavior of spammers[J]. ACM Sigcomm Computer Communication Review, 2006, 36(4):291-302.
7INOUE D, YOSHIOKA K, ETO M, et al. Malware behavior analysis in isolated miniature network for revealing malware's network activity[A]. IEEE International Conference on Communications[C]. 2008. 1715-1721.
8MORALES J A, AL-BATAINEH A, XU S, et al. Analyzing and exploiting network Communication 20-34. behaviors of malware[A]. Security and Privacy in Networks[C]. Springer Berlin Heidelberg, 2010.
9PERDISCI R, LEE W, FEAMSTER N. Behavioral clustering of HTTP-based malware and signature generation using malicious net- work traces[A]. Proceedings of the 7th USENIX Conference on Net- worked Systems Design and Implementation USENIX Association[C]. 2010.26-26.
10RIECK K, HOLZ T, WILLEMS C, et al. Learning and classification of malware behavior[A]. Detection of Intrusions and Malware, and Vulnerability Assessment[C]. Springer Berlin Heidelberg, 2008. 108-125.

同被引文献196

1李跃,翟立东,王宏霞,时金桥.一种基于社交网络的移动僵尸网络研究[J].计算机研究与发展,2012,49(S2):1-8. 被引量：10
2李阳,王晓岩,王昆,沙瀛.基于社交网络的安全关系研究[J].计算机研究与发展,2012,49(S2):124-130. 被引量：10
3杨欢,张玉清,胡予濮,刘奇旭.基于权限频繁模式挖掘算法的Android恶意应用检测方法[J].通信学报,2013,34(S1):106-115. 被引量：47
4穆祥昆,王劲松,薛羽丰,黄玮.基于活跃熵的网络异常流量检测方法[J].通信学报,2013,34(S2):51-57. 被引量：20
5穆成坡,黄厚宽,田盛丰,林友芳,秦远辉.基于模糊综合评判的入侵检测报警信息处理[J].计算机研究与发展,2005,42(10):1679-1685. 被引量：49
6张华伟,王明文,甘丽新.基于随机森林的文本分类模型研究[J].山东大学学报（理学版）,2006,41(3):5-9. 被引量：57
7李勇,左志宏.目标代码混淆技术综述[J].计算机技术与发展,2007,17(4):125-127. 被引量：10
8HU X,SHIN K G,BHATKAR S,et al.MutantX-S: scalable malware clustering based on static features[C]//San Jose,California:Presented as part of the 2013 USENIX Annual Technical Conference,2013.
9HU X,SHIN K G.DUET:Integration of dynamic and static analyses for malware clustering with cluster ensembles[C]//New Orleans,Louisiana:Proceedings of the 29th Annual Computer Security Applications Conference,2013.
10RAFIQUE M Z,FIRMA C J.Malware clustering and network signature generation with mixed network behaviors [M].Springer Berlin Heidelberg:Research in Attacks,Intrusions and Defenses,2013.

引证文献12

1刘亮,刘露平,何帅,刘嘉勇.一种基于多特征的恶意代码家族静态标注方法[J].信息安全研究,2018,4(4):322-328. 被引量：4
2韩晓光,姚宣霞,曲武,郭长友.基于图像纹理聚类的恶意代码家族标注方法[J].解放军理工大学学报（自然科学版）,2014,15(5):440-449. 被引量：6
3张伟,刘清.基于传输层会话行为统计特征的恶意流量识别[J].小型微型计算机系统,2015,36(5):959-963. 被引量：2
4付钰,李洪成,吴晓平,王甲生.基于大数据分析的APT攻击检测研究综述[J].通信学报,2015,36(11):1-14. 被引量：78
5徐文韬,王轶骏,薛质.面向威胁情报的攻击指示器自动生成[J].通信技术,2017,50(1):116-123. 被引量：8
6崔弘,喻波,方莹.恶意代码分类的一种高维特征融合分析方法[J].计算机应用研究,2017,34(4):1120-1123. 被引量：5
7王丽娜,谈诚,余荣威,尹正光.针对数据泄漏行为的恶意软件检测[J].计算机研究与发展,2017,54(7):1537-1548. 被引量：16
8张长胜,周洌,任小波,李川.基于粗糙集理论的恶意代码特征分析[J].电子科技,2018,31(6):52-55. 被引量：1
9褚智广,赵廉斌,王斌,于普漪,高毅夫.基于沙箱分析的僵尸控制端探测方法研究[J].信息系统工程,2018,31(9):106-108.
10韩晓光,姚宣霞,曲武,郭长友.基于图像纹理聚类的恶意代码家族标注方法[J].电子工程学院学报,2019,8(4):42-51.

二级引证文献140

1张玮康,胡建伟.基于WMI的隐蔽启动方法与检测研究[J].军民两用技术与产品,2018,0(14):68-68.
2王助尧.论邓小平哲学思想的核心和实质[J].探索,2000(2):4-7. 被引量：5
3刘亮,刘露平,何帅,刘嘉勇.一种基于多特征的恶意代码家族静态标注方法[J].信息安全研究,2018,4(4):322-328. 被引量：4
4肖鸣.一种多层次融合的APT防御模型研究与构建[J].中国新通信,2016,18(14):87-87.
5俞艺涵,付钰,吴晓平.基于改进正则表达式规则分组的内网行为审计方案[J].计算机应用,2016,36(8):2241-2245.
6董娜,张君艳,刘伟娜,常杰.电网企业APT攻击防御存在的问题及防御措施[J].河北电力技术,2016,35(4):25-27. 被引量：3
7雷程,马多贺,张红旗,杨英杰,王淼.基于变点检测的网络移动目标防御效能评估方法[J].通信学报,2017,38(1):126-140. 被引量：12
8戴玲,杨玉龙.人事档案资源共享的风险及对策[J].兰台世界,2017,0(1):54-57. 被引量：2
9姜海涛,王黎明,周超,郭静.智能变电站网络异常分析方法[J].电力信息与通信技术,2017,15(2):54-58. 被引量：4
10何帅,刘嘉勇.基于恶意代码图像指纹的恶意代码家族标注方法[J].通信技术,2017,50(3):545-549. 被引量：3

1肖斐,朱崇湘,孙永学,赵文耘.协议软件实现的面向对象的方法[J].计算机工程与设计,1998,19(6):19-25. 被引量：3
2陈硒.面向大数据处理的划分聚类新方法[J].数码世界,2017,0(1):107-107. 被引量：2
3崔红艳,曹建芳,史昊.一种基于MapReduce的并行PSO-BP神经网络算法[J].科技通报,2017,33(4):110-115. 被引量：4
4竺建敏.快速部署多变量控制器策略以适应经济目标不断变化[J].自动化博览,2015,32(12):86-87.
5赵文,李晓玲.基于LSSVM和RFID的智能门禁身份认证系统设计[J].计算机测量与控制,2015,23(3):998-1001. 被引量：5
6李飞,李红莲.支持向量机大规模样本快速训练算法[J].北京信息科技大学学报（自然科学版）,2012,27(2):83-87. 被引量：2
7杨路明,李丽.一种加速大规模SVM训练的新思路[J].微机发展,2004,14(12):136-138. 被引量：6
8韩水华,陈传波,卢正鼎.基于类命名匹配的自动特征提取方法研究[J].计算机应用,2000,20(12):25-27.
9王平,方滨兴,云晓春.基于自动特征提取的大规模网络蠕虫检测[J].通信学报,2006,27(6):87-93. 被引量：9
10雷赟,龚葵花.基于线性矩和小波变换的医学图像特征提取[J].科技信息,2010(3):45-46. 被引量：2

通信学报

2013年第8期

浏览历史

内容加载中请稍等...

基于特征聚类的海量恶意代码在线自动分析模型被引量：12

参考文献22

同被引文献196

引证文献12

二级引证文献140

相关作者

相关机构

相关主题

浏览历史

基于特征聚类的海量恶意代码在线自动分析模型 被引量：12

参考文献22

同被引文献196

引证文献12

二级引证文献140

相关作者

相关机构

相关主题

浏览历史

基于特征聚类的海量恶意代码在线自动分析模型被引量：12