基于特征组合的Powershell恶意代码检测方法被引量：3

Powershell malware detection method based on features combination

下载PDF

导出

摘要近年来,Powershell由于其易用性强、隐蔽性高的特点被广泛应用于APT攻击中,传统的基于人工特征提取和机器学习方法的恶意代码检测技术在Powershell恶意代码检测中越来越难以有效。本文提出了一种基于随机森林特征组合和深度学习的Powershell恶意代码检测方法。该方法使用随机森林生成更好表征原始数据的新特征组合,随后使用深度学习神经网络训练并进行分类识别。该方法可以弥补人工特征工程经验不足的问题,更好表征原始数据从而提高检测效果。本文实验结果显示,利用本文提出方法构建的Powershell恶意代码检测系统性能良好,在真实数据集中的召回率、准确率均在99%以上,可以对Powershell恶意代码进行有效的检测识别。 In recent years,powershell is widely used in APT attack due to its ease of use and high concealment.Traditional malicious code detection technology based on artificial feature extraction and machine learning method is more and more difficult to be effective in the detection of malicious code in PowerShell.For this reason,this paper proposes a malicious Powershell code detection method based on random forest features combination and deep learning.This method uses random forest to generate new features which better characterize the original data,and uses deep neural network to build classifiers for classification and recognition.This method can make up for the lack of experience in artificial feature engineering,and characterize the original data better,so as to improve the detection effect.The experimental results in this article show that this method has a good performance,high recall rate and accuracy rate,which can effectively detect and identify malicious Powershell code.

作者刘岳刘宝旭赵子豪刘潮歌王晓茜吴贤达 LIU Yue;LIU Baoxu;ZHAO Zihao;LIU Chaoge;WANG Xiaoxi;WU Xianda(Institute of Information Engineering,Chinese Academy of Sciences,Beijing 100093,China;School of Cyber Security,University of Chinese Academy of Sciences,Beijing 100049,China)

机构地区中国科学院信息工程研究所中国科学院大学网络空间安全学院

出处《信息安全学报》 CSCD 2021年第1期40-53,共14页 Journal of Cyber Security

基金国家自然科学基金项目(No.61902396) 中国科学院战略性先导科技专项项目(No.XDC02040100) 中国科学院网络测评技术重点实验室和网络安全防护技术北京市重点实验室资助。

关键词 POWERSHELL 恶意代码 APT 深度学习随机森林 Powershell malicious code APT deep learning random forest

分类号 TP393.08 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1彭佳红,沈岳,张林峰.数据挖掘中的特征选择及其算法研究[J].计算机工程与设计,2005,26(5):1176-1178. 被引量：15
2邢彬,吴越.浅析PowerShell攻击的检测与防御[J].保密科学技术,2020(2):39-44. 被引量：1
3刘恒讯,艾中良.一种基于词向量的恶意代码分类模型[J].电子设计工程,2020,28(6):10-16. 被引量：4
4陈涵泊,吴越,邹福泰.基于Asm2Vec的恶意代码同源判定方法[J].通信技术,2019,52(12):3010-3015. 被引量：4
5蒋晓晶.“无文件”恶意软件的攻击与防护[J].信息安全与通信保密,2017,15(9):40-47. 被引量：5

二级参考文献11

1LIU Huan, Setiono R. A probabilistic approach to feature selection[C]. Morgan Kaufmann publishers, A filter solution. Proceedings of Internatinoal Conference on MachineLearning,1996.319-327.
2Qumlan, J. Decision trees and multi-values attribute[A].In J.E,H, Michie, D. Machine intelligence[C]. Oxford University Press,1998.
3Kohavi R. Wrappers for performance enhancement and oblivious decision graphs[M]. PhD thesis,Stanford University, 1995.
4LIU Huan, Hiroshi Motoda. Feature selection for knowledge[M]. Discovery And Data Mining, Kluwer Academic Publishers,1998.
5Liu Huan, Setiono R. Scalable feature selection for large size database[C]. Morgan Kaufmann Publishers, Proceedings of the Fourth World Congress on Expert Systems, 1998.
6Kira K, Rendell L. A practical approach to feature selection[C].Proceedings of the Ninth International Conference on Maching Learning, 249-256.
7Kononenko Ⅰ. Estimating attributes: Analysis and extension of RELIEF[C]. Proceedings of the European Conference on Machine Learning, 1994, 171-182.
8Liu Huan, Setiono R. Feature selection and classfication-a probabilistic wrapper approach[C]. Proceedings of the Ninth International Conference on Industrial and Engineering Applications of AI and ES.
9蒋永康,吴越,邹福泰.基于图像矢量的恶意代码分类模型[J].通信技术,2018,51(12):2953-2959. 被引量：7
10乔延臣,姜青山,古亮,吴晓明.基于汇编指令词向量与卷积神经网络的恶意代码分类方法研究[J].信息网络安全,2019(4):20-28. 被引量：14

共引文献24

1吴新玲.数据维数消减方法研究[J].计算机工程与设计,2006,27(16):3000-3002. 被引量：2
2李晓丽,杜振龙,张亚芬.基于VPRSM的音频特征选择[J].计算机工程与设计,2007,28(1):214-216. 被引量：1
3夏卓群,邓广慧,古华茂,程昱.多粒度时间部分周期模型[J].计算机工程与设计,2007,28(5):1002-1004. 被引量：1
4周志忠,张人千.分析型CRM在保险行业的应用[J].计算机工程与设计,2007,28(5):1169-1172. 被引量：2
5李双虎,张风海.一个新的聚类有效性分析指标[J].计算机工程与设计,2007,28(8):1772-1774. 被引量：14
6鲁江.试论数据仓库在客户关系管理中的应用[J].当代经济,2007,24(07X):130-131.
7倪丽萍,倪志伟,吴昊,叶红云.基于分形维数的数据挖掘技术研究综述[J].计算机科学,2008,35(1):187-189. 被引量：7
8叶菲,罗景青.基于信息增益和相关性的判定树特征选择算法[J].现代防御技术,2009,37(1):87-89. 被引量：1
9孟洋,赵方.基于信息熵理论的动态规划特征选取算法[J].计算机工程与设计,2010,31(17):3879-3881. 被引量：6
10张波.某保险公司分析性CRM的设计与实施[J].数字技术与应用,2012,30(1):98-101.

同被引文献45

1刘强,邓亚平,徐震,董世蓉,殷科.隐藏木马检测技术的研究[J].计算机工程,2006,32(1):180-182. 被引量：9
2何鑫.基于计划任务和脚本的数据备份方法[J].计算机系统应用,2014,23(5):245-247. 被引量：3
3赵晓君,王小英,张咏梅,沈焱萍.基于恶意代码行为分析的入侵检测技术研究[J].计算机仿真,2015,32(4):277-280. 被引量：6
4庄池杰,张斌,胡军,李秋硕,曾嵘.基于无监督学习的电力用户异常用电模式检测[J].中国电机工程学报,2016,36(2):379-387. 被引量：144
5邵思豪,高庆,马森,段富尧,马骁,张世琨,胡津华.缓冲区溢出漏洞分析技术研究进展[J].软件学报,2018,29(5):1179-1198. 被引量：22
6戴超,庞建民,张一弛,孙笛,岳峰.基于语义特征的恶意代码检测综述[J].信息工程大学学报,2018,19(1):106-113. 被引量：2
7邢瑞康,李成海.改进的聚类算法在入侵检测系统中的应用[J].火力与指挥控制,2019,44(2):124-128. 被引量：8
8杨宏宇,那玉琢.一种Android恶意软件检测模型[J].西安电子科技大学学报,2019,46(3):45-51. 被引量：5
9解滨,董新玉,梁皓伟.基于三支动态阈值K-means聚类的入侵检测算法[J].郑州大学学报（理学版）,2020,52(2):64-70. 被引量：21
10马博林,张铮,陈源,邬江兴.基于指令集随机化的抗代码注入攻击方法[J].信息安全学报,2020,5(4):30-43. 被引量：8

引证文献3

1韩隆隆,汪小雨.一种新型Windows恶意计划任务的隐藏及排查方法[J].信息与电脑,2022,34(11):225-228.
2吕广旭,卢加奇,魏先燕,王小英.基于随机森林-聚类混合方法的多分类入侵检测研究[J].现代信息科技,2022,6(16):165-167. 被引量：1
3宋亚飞,张丹丹,王坚,王亚男,郭新鹏.基于深度学习的恶意代码检测综述[J].空军工程大学学报,2024,25(4):94-106.

二级引证文献1

1刘泊志,李田丰,吕珊珊,刘姝邑.古代玻璃制品的成分分析与鉴别的模型研究[J].建模与仿真,2023,12(2):1185-1198.

1田志宏.网络空间高隐蔽未知威胁检测与溯源[J].信息通信技术,2020,14(6):4-7. 被引量：3
2迟国靖.网络运行维护中防范高级持续性攻击设计研究[J].科技创新导报,2020,17(24):117-118.
3冯林,崔翔,王忠儒,甘蕊灵,刁嘉文,韩冬旭,姜海.面向AI模型训练的DNS窃密数据自动生成[J].信息安全学报,2021,6(1):1-16. 被引量：1

信息安全学报

2021年第1期

浏览历史

内容加载中请稍等...

基于特征组合的Powershell恶意代码检测方法被引量：3

参考文献5

二级参考文献11

共引文献24

同被引文献45

引证文献3

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于特征组合的Powershell恶意代码检测方法 被引量：3

参考文献5

二级参考文献11

共引文献24

同被引文献45

引证文献3

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于特征组合的Powershell恶意代码检测方法被引量：3