基于CNN的Webshell文件检测被引量：13

Webshell Detection Based on Convolutional Neural Network

下载PDF

导出

摘要 Webshell是一种以ASP、PHP和JSP等网页文件形式存在的命令执行环境,可以用于Web服务器的远程访问控制.Webshell采用混淆和加密,增加了分析难度和检测难度.基于特征值匹配的Webshell检测方法难以有效对抗混淆加密,且无法检测未知的Webshell,为此提出了一种基于CNN的Webshell检测方法.该方法首先编译PHP文件获取opcode,再利用词汇表模型提取词序特征,最后训练得到CNN检测模型.实验结果表明,该方法在精确率、召回率、F1值都优于传统的机器学习算法,且检测率也高于现有的安全工具,证明了该方法的有效性. Webshell was a command execution environment in the form of Web file such as ASP,PHP,and JSP,which was used for remote access control of Web servers. It often disguised itself through obfuscation and encryption,which increased the difficulty of analysis and detection. Based on the feature value matching,the existing Webshell detection methods couldn’t effectively prevent obfuscation and encryption,and couldn ’t detect unknown Webshell neither. Therefore,a novel Webshell detection method based on CNN was proposed. Firstly,this method compiled PHP files to obtain opcodes,then vocabulary model was used to extract word order features,and finally the CNN detection model was established based on the extracted feature vectors. Experiment results showed that the accuracy,recall rate and F1 score of this method were better than the traditional machine learning algorithms,and the detection rate was higher than the existing security tools,which proved the effectiveness of the proposed method.

作者傅建明黎琳王应军 FU Jianming;LI Lin;WANG Yingjun(School of Cyber Science and Engineering,Wuhan University,Wuhan 430072,China;Key Laboratory of Aerospace Information Security and Trusted Computing,Wuhan University,Wuhan 430072,China)

机构地区武汉大学国家网络安全学院武汉大学空天信息安全与可信计算教育部重点实验室

出处《郑州大学学报（理学版）》 CAS 北大核心 2019年第2期1-8,共8页 Journal of Zhengzhou University:Natural Science Edition

基金国家自然科学基金项目(61373168 U1636107) 中国科学院信息工程研究所中国科学院网络测评技术重点实验室开放课题

关键词 WEBSHELL opcode 词汇表模型深度学习 Webshell opcode vocabulary model deep learning

分类号 TP393.08 [自动化与计算机技术—计算机应用技术] TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献7

1石刘洋,方勇.基于Web日志的Webshell检测方法研究[J].信息安全研究,2016,2(1):66-73. 被引量：33
2彭玉青,刘帆,高晴晴,张媛媛,闫倩.基于微调优化的深度学习在语音识别中的应用[J].郑州大学学报（理学版）,2016,48(4):30-35. 被引量：8
3廖健,王素格,李德玉,王杰.基于增强字向量的微博观点句情感极性分类方法[J].郑州大学学报（理学版）,2017,49(1):39-44. 被引量：5
4毛晓波,程志远,周晓东.基于特征图叠加的脱机手写体汉字识别[J].郑州大学学报（理学版）,2018,50(3):78-82. 被引量：5
5胡建康,徐震,马多贺,杨婧.基于决策树的Webshell检测方法研究[J].网络新媒体技术,2012,1(6):15-19. 被引量：28
6孟正,梅瑞,张涛,文伟平.Linux下基于SVM分类器的WebShell检测方法研究[J].信息网络安全,2014(5):5-9. 被引量：21
7朱魏魏,胡勇.基于NN-SVM的Webshell检测方法[J].通信与信息技术,2015(2):55-58. 被引量：11

二级参考文献53

1李万新.Web日志数据挖掘在服务器安全方面的应用[J].中山大学学报论丛,2007,27(5):116-118. 被引量：5
2刘冰.多类SVM分类算法的研究和改进.电脑知识与技术,2007,(6):1590-1593.
3Xiao Yao. Large and Medium-sized Network Intrusions Cases Research[J]. Publishing House Of Electronics Industry, 2010,(10):301-310.
4J. Ross Quinlan. C4. 5: programs for machine learning[M]. San Francisco: Morgan Kaufmann, 1993.
5Yung-Tsung Hou, Yimeng Chang, Tsuhan Chen.Malicious web content detection by machine learning[J]. Expert Systems with Applications,2010,37(1):55-60.
6Osuna E, Freund R, Girosi F. An improved training algorithm for support vector machines[C]//Proceedings of IEEE Workshop on Neural Networks for Signal Processing. Amelia Island, USA: IEEE Press, 1997: 276-285.
7Lin H T, Lin C J, Weng R C. A note on Plat tps probabilistic outputs for support vector machines[J]. Machine Learning, 2007, 68 (3): 267-276.
8Brinker K. On multiclass active learning with support vector machines[C]//Proceedings of European Conference on Artificial Intelligence. 2004: 969-970.
9Yuan X, Lai W, Mei T , et al. Automatic video genre categorization using hierarchical SVM[C]//IEEE International Conference on Image Processing. Atlanta: IEEE Press, 2006: 2905-2908.
10Tong S , Chang. E Support vector machine active learning for image ret rieval[C]//Proceedings of the 9th ACM International Conference on Multimedia. Ottawa, Canada: ACM Press, 2001, 9: 107-118.

共引文献66

1张红瑞.WebShell原理分析与防范实践[J].现代企业教育,2013(20):254-255. 被引量：5
2孟正,梅瑞,张涛,文伟平.Linux下基于SVM分类器的WebShell检测方法研究[J].信息网络安全,2014(5):5-9. 被引量：21
3张庭秀,程光,郭晓军,潘吴斌.Evil-hunter: a novel web shell detection system based on scoring scheme[J].Journal of Southeast University(English Edition),2014,30(3):278-284. 被引量：1
4杜海章,方勇.PHP webshell实时动态检测[J].网络安全技术与应用,2014(12):120-121. 被引量：11
5朱魏魏,胡勇.基于NN-SVM的Webshell检测方法[J].通信与信息技术,2015(2):55-58. 被引量：11
6韦鲲鹏,葛志辉,杨波.PHP Web应用程序上传漏洞的攻防研究[J].信息网络安全,2015(10):53-60. 被引量：12
7叶飞,龚俭,杨望.基于支持向量机的Webshell黑盒检测[J].南京航空航天大学学报,2015,47(6):924-930. 被引量：16
8胡必伟.基于贝叶斯理论的Webshell检测方法研究[J].科技广场,2016(6):66-70. 被引量：7
9石刘洋,方勇.基于Web日志的Webshell检测方法研究[J].信息安全研究,2016,2(1):66-73. 被引量：33
10易楠,方勇,黄诚,刘亮.基于语义分析的Webshell检测技术研究[J].信息安全研究,2017,3(2):145-150. 被引量：9

同被引文献58

1王伟,姚振强,包起帆.自动化堆场集装箱先进装卸工艺的探讨[J].机械设计与研究,2007,23(2):84-87. 被引量：11
2谢云,包起帆,姚振强,葛中雄.中国首个集装箱无人堆场装卸工艺方案研究[J].水运工程,2007(5):31-34. 被引量：5
3王泳,胡包钢.应用统计方法综合评估核函数分类能力的研究[J].计算机学报,2008,31(6):942-952. 被引量：22
4杨瑞,谢文宁.自动化集装箱码头的装卸工艺及设备[J].集装箱化,2010,21(3):2-4. 被引量：11
5孙义,胡雨霁,黄皓.基于序列比对的SQL注入攻击检测方法[J].计算机应用研究,2010,27(9):3525-3528. 被引量：10
6王凯,侯著荣,王聪丽.基于交叉验证SVM的网络入侵检测[J].测试技术学报,2010,24(5):419-423. 被引量：16
7胡建康,徐震,马多贺,杨婧.基于决策树的Webshell检测方法研究[J].网络新媒体技术,2012,1(6):15-19. 被引量：28
8孙歆,韩嘉佳,唐秋杭.自动化Web安全测试的局限及手工测试方法[J].信息网络安全,2013(1):79-81. 被引量：2
9刘楠,韩丽芳,夏坤峰,曲通.一种改进的基于抽象语法树的软件源代码比对算法[J].信息网络安全,2014(1):38-42. 被引量：9
10李艳芳,王钰,李济洪.几种交叉验证检验的可重复性[J].太原师范学院学报（自然科学版）,2013,12(4):46-49. 被引量：8

引证文献13

1何树果,张福,朱震,程度.Webshell检测方案探索与实践[J].信息网络安全,2020(S01):141-144. 被引量：3
2马泽辉.基于逻辑回归算法的Webshell检测方法研究[J].信息安全研究,2019,5(4):298-302. 被引量：3
3姜天.基于卷积神经网络的Webshell检测方法研究[J].信息技术与网络安全,2019,38(7):27-31. 被引量：5
4吴玉强,吴育宝.电子数据检验中常见Webshell有效性的检验鉴定[J].网络安全技术与应用,2019(8):46-48. 被引量：1
5邹鲁,赵永新,王西超,焦斌(指导).基于深度卷积神经网络的集装箱锁销识别研究[J].上海电机学院学报,2019,22(4):193-197. 被引量：3
6李铭,邢光升,王芝辉,王晓东.SQL注入行为实时在线智能检测技术研究[J].湖南大学学报（自然科学版）,2020,47(8):31-41. 被引量：5
7赵瑞杰,施勇,张涵,龙军,薛质.基于TF-IDF的Webshell文件检测[J].计算机科学,2020,47(S02):363-367. 被引量：8
8巩思越,张英韬,王宝会.基于CNN的JSP类型Webshell检测[J].新型工业化,2021,11(10):97-100.
9胡鹤还,孟军,赵思远,纪腾其.结合多尺度卷积胶囊网络的植物lncRNA编码小肽预测[J].郑州大学学报（理学版）,2022,54(1):12-18.
10陶传志,胡珂珂,葛新同,舒慧敏,王丽丽.基于MLP算法的Webshell检测方法[J].信息与电脑,2021,33(24):53-56.

二级引证文献26

1王正存,肖中俊,严志国.逻辑回归分类识别优化研究[J].齐鲁工业大学学报,2019,33(5):47-51. 被引量：11
2田启川,王满丽.深度学习算法研究进展[J].计算机工程与应用,2019,55(22):25-33. 被引量：57
3王跃达,黄潘,荆涛,宋雅稀.一种基于高速网络的WebShell综合检测溯源技术研究与实现[J].信息网络安全,2021(1):65-71. 被引量：6
4郭春,蔡文艳,申国伟,周雪梅.基于关键载荷截取的SQL注入攻击检测方法[J].信息网络安全,2021(7):43-53. 被引量：3
5李帅刚,王全民.基于Bi-GRU的Webshell检测[J].计算机系统应用,2021,30(7):259-264. 被引量：6
6张冬,魏俊斌.情感驱动下主流媒体疫情信息数据分析与话语引导策略[J].图书情报工作,2021,65(14):101-108. 被引量：31
7巩思越,张英韬,王宝会.基于CNN的JSP类型Webshell检测[J].新型工业化,2021,11(10):97-100.
8常昊,陈岑,张铮,李鸣岩.基于文本特征和日志分析的Webshell检测[J].网络安全技术与应用,2022(2):10-12. 被引量：3
9汪兆冉,李保江,王西超,陈国初,赵永新.基于深度学习的集装箱锁销识别系统[J].机械设计与研究,2022,38(1):186-190. 被引量：1
10车生兵,张光琳.基于深度学习的Webshell检测[J].计算机工程与科学,2022,44(6):994-1002. 被引量：2

1周晨琦,张振鹏,王威.基于JSP的众筹平台设计与实现分析[J].信息周刊,2018,0(26):156-156.
2丁世锋.文件检验技术使用现状及其未来发展研究[J].法制博览,2019(2):169-169.
3简敏.渝水:严控外包施工作业现场“安全关”[J].中国电力企业管理,2018(33):73-73.
4陈文周,代守群.基于SSH的安全通讯研究与应用[J].数据通信,2018(2):5-9. 被引量：3
5玉志清.甲氧明小剂量静脉预注预防老年冠心病患者全身麻醉诱导期低血压的应用研究[J].中外医疗,2019,38(4):4-6. 被引量：3
6刘天鹏,魏玺章,刘振,丁锦灿.交叉眼干扰研究综述[J].雷达学报（中英文）,2019,8(1):140-153. 被引量：21
7梁波,田智雁,王锋,邓辉,卫守林.一种基于微信小程序在RTS2的控制框架扩展[J].天文研究与技术,2018,15(2):202-207. 被引量：3
8刘景云(文/图).轻松创建视频播客网站[J].电脑知识与技术（经验技巧）,2018(12):26-29.
9周勇生.用虚拟沙盒筑牢安全防线[J].网络安全和信息化,2019,0(3):120-123.
10龚龙.基于JavaWeb的高校学生考勤管理系统设计与实现[J].明日风尚,2019,0(1):65-65. 被引量：4

郑州大学学报（理学版）

2019年第2期

浏览历史

内容加载中请稍等...

基于CNN的Webshell文件检测被引量：13

参考文献7

二级参考文献53

共引文献66

同被引文献58

引证文献13

二级引证文献26

相关作者

相关机构

相关主题

浏览历史

基于CNN的Webshell文件检测 被引量：13

参考文献7

二级参考文献53

共引文献66

同被引文献58

引证文献13

二级引证文献26

相关作者

相关机构

相关主题

浏览历史

基于CNN的Webshell文件检测被引量：13