基于多层卷积模型的恶意URL特征自动提取被引量：3

Automatic extraction of malicious URL features based on multilayer convolution model

下载PDF

导出

摘要针对恶意仿冒URL的有效识别问题,提出一种基于skip-gram和连续多层卷积层的模型相结合的网络模型完成对恶意仿冒URL进行特征提取并检测。根据URL结构特性将其切分为5个部分,使用skip-gram对字符进行稠密编码将URL数据信息进行转化;使用连续多个卷积层的CNN模型针对URL的每个部分完成独立特征提取,将特征提取结果进行整合;使用贝叶斯、随机森林等多种分类器对模型提取特征空间进行评估。实验结果表明,该方法能够快速有效地对恶意仿冒URL进行检测,检测准确率可达97%,效果优于典型的eXpose多核卷积模型。 To effectively identify malicious counterfeit URLs,a network model based on skip-gram and continuous multi-layer convolution layer was proposed to extract and detect malicious counterfeit URLs.The URL was divided into five parts according to its structural characteristics,and skip-gram was used to densely encode the characters to transform the URL data information.The CNN model of successive convolution layers was used to extract independent features for each part of the URL,and the results of feature extraction were integrated.Bayesian and random forest classifiers were used to evaluate the feature space extracted from the model.Experimental results show that the proposed method can detect malicious counterfeit URLs quickly and effectively,and the detection accuracy can reach 97%,which is better than the typical eXpose multi-core convolution model.

作者张婷钱丽萍汪立东张慧 ZHANG Ting;QIAN Li-ping;WANG Li-dong;ZHANG Hui(College of Electrical and Information Engineering,Beijing University of Civil Engineering and Architecture,Beijing 100044,China;National Computer Network Emergency Response Technical Team/Coordination Center of China,Beijing 100029,China)

机构地区北京建筑大学电气与信息工程学院国家计算机网络应急技术处理协调中心

出处《计算机工程与设计》北大核心 2020年第7期1821-1828,共8页 Computer Engineering and Design

基金国家自然科学基金项目(61571144) 北京建筑大学博士基金项目(00331616014) 北京建筑大学研究生创新基金项目(PG2019069)。

关键词恶意仿冒URL 卷积神经网络字符嵌入特征提取深度学习 malicious counterfeit URLs convolutional neural network character embedding feature extraction deep learning

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1潘司晨,薛质,施勇.基于卷积神经网络的恶意URL检测[J].通信技术,2018,51(8):1918-1923. 被引量：5
2杨家慧,刘方爱.基于巴氏系数和Jaccard系数的协同过滤算法[J].计算机应用,2016,36(7):2006-2010. 被引量：16
3沙泓州,刘庆云,柳厅文,周舟,郭莉,方滨兴.恶意网页识别研究综述[J].计算机学报,2016,39(3):529-542. 被引量：40
4甘宏,潘丹.基于SVM和TF-IDF的恶意URL识别分析与研究[J].计算机与现代化,2016(7):95-97. 被引量：4
5陈旭,张军,陈文伟,李硕豪.卷积网络深度学习算法与实例[J].广东工业大学学报,2017,34(6):20-26. 被引量：19

二级参考文献99

1Mahmoud K, Youssef I, Andrew J. Phishing detection: A literature survey. IEEE Communications Surveys & Tutorials, 2013, 15(4): 2091-2121.
2Paul K, Georgia K, Hector G M. Fighting spam on social Web sites a survey of approaches and future challenges. IEEE Internet Computing, 2007, 11(6): 36-45.
3Priya M, Sandhya L, Ciza T. A static approach to detect drive-by-download attacks on Webpages//Proceedings of the International Conference on Control Communication and Computing. Xi'an, China, 2013:298-303.
4Mavrommatis N P P, Monrose M A R F. All your iframes point to us//Proceedings of the 17th USENIX Security Symposium. San Jose, USA, 2008:1-22.
5Ma J, Saul L K, Savage S, Voetker G M. Beyond blacklists: Learning to detect malicious Web sites from suspicious URLs//Proceedings of the 15th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York, USA, 2009: 1245-1253.
6Ma J, Saul L K, Savage S, Voelker G M. Identifying suspi- cious URLs: An application of large-scale online learning// Proceedings of the 26th Annual International Conference on Machine Learning. Montreal, Canada, 2009:681-688.
7Ma J, Saul L K, Savage S, Voelker G M. Learning to detect malicious URLs. ACM Transactions on Intelligent Systems and Technology, 2011, 2(3): 1-24.
8Canali D, et al. Prophiler: A fast filter for the large-scale detection of malicious Web pages//Proceedings of the 20th International Conference on World Wide Web. Hyderabad, India, 2011:197-206.
9Thomas K, et al. Design and evaluation of a real-time URL spam filtering service//Proceedings of the IEEE Symposium on Security and Privacy. Oakland, USA, 2011:447-462.
10Yadav S, Reddy A K K, Reddy A L, et al. Detecting algorithmic.ally generated malicious domain names//Proeeedings of the 10th ACM SIGCOMM Conference on Internet Measurement. New York, USA, 2010:48-61.

共引文献79

1东野升鹍,朱大明,姚杰,付志涛,杜思雨.基于多回波Jaccard系数的近地点滤波算法[J].中国水运（下半月）,2023(2):22-24. 被引量：1
2麻瓯勃,刘雪娇,唐旭栋,周宇轩,胡亦承.基于半监督学习的恶意URL检测方法[J].计算机系统应用,2020(11):11-20. 被引量：4
3李雪松,张骁,管震,陈硕,王建华.基于图像识别技术的钻井井漏溢流智能报警系统开发[J].世界石油工业,2021,28(1):48-54. 被引量：3
4安丽娜.基于深度卷积神经网络的图像分类识别方法[J].信息通信,2019,0(12):72-73. 被引量：2
5陈星铭,赵胜祥.二次曲面截交线投影成圆的条件及应用[J].上海工程技术大学学报,2000,14(1):50-55. 被引量：1
6马力,王致,张丹,洪永健,王天安.基于深度学习的人脸识别技术在电力巡检机器人中的应用研究[J].自动化与仪器仪表,2019(2):36-38. 被引量：3
7杨洪娇.基于机器学习的校园网恶意网页检测方法[J].信息与电脑,2016,28(11):175-176. 被引量：2
8张莉,孙丽娜,郭峰.在线社会网络中近似网页识别方法研究[J].微电子学与计算机,2017,34(2):141-144.
9胡向东,刘可,张峰,林家富,付俊,郭智慧.基于页面敏感特征的金融类钓鱼网页检测方法[J].网络与信息安全学报,2017,3(2):31-38. 被引量：8
10周朝阳.杰卡德相似度在图书推荐中的应用研究[J].情报探索,2017(7):43-46. 被引量：4

同被引文献82

1张金艺,秦政,林羽晨,姜玉稀.面向伴随型机器人同步运动的递进式步态时相检测算法[J].仪器仪表学报,2020,41(1):113-120. 被引量：4
2李蓓,郭剑波,陈继忠,惠东.液流储能电池系统支路电流的建模与仿真分析[J].中国电机工程学报,2011,31(27):1-7. 被引量：33
3熊瑞,何洪文,许永莉,何银.电动汽车用动力电池组建模和参数辨识方法[J].吉林大学学报（工学版）,2012,42(4):809-815. 被引量：11
4丁明,吴建锋,朱承治,赵波,陈自年,罗亚桥.具备荷电状态调节功能的储能系统实时平滑控制策略[J].中国电机工程学报,2013,33(1):22-29. 被引量：100
5刘念,唐霄,段帅,张建华.考虑动力电池梯次利用的光伏换电站容量优化配置方法[J].中国电机工程学报,2013,33(4):34-44. 被引量：57
6彭宇,刘大同.数据驱动故障预测和健康管理综述[J].仪器仪表学报,2014,35(3):481-495. 被引量：188
7彭昱,郭明明,应迪文.48 V软包锰酸锂电动车动力电池的梯次利用[J].环境工程学报,2018,12(12):3498-3504. 被引量：3
8严媛,顾正建,黄惠,卢存.梯次利用动力锂离子电池筛选方法[J].电池,2018,48(6):414-416. 被引量：21
9李建林,修晓青,刘道坦,惠东.计及政策激励的退役动力电池储能系统梯次应用研究[J].高电压技术,2015,41(8):2562-2568. 被引量：50
10李晓晨,江贺,任志磊.面向软件仓库挖掘的数据驱动特征提取方法[J].计算机科学,2015,42(9):159-164. 被引量：4

引证文献3

1张佳琦,张金艺,楼亮亮.基于分组特征赋权的动态视角图像特征融合[J].电子测量技术,2021,44(4):144-148. 被引量：1
2李建林,李雅欣,陈光,吕超,武亦文,徐亮,马速良.退役动力电池健康状态特征提取及评估方法综述[J].中国电机工程学报,2022,42(4):1332-1346. 被引量：17
3李梅,朱明宇.基于蚁群算法的无线通信网络安全漏洞检测方法[J].计算机测量与控制,2022,30(10):51-56. 被引量：6

二级引证文献24

1李笑竹,陈来军,杜锡力,梅生伟.考虑退役动力电池衰减特性的集中式共享储能分级协调控制策略[J].太阳能,2022(5):87-95. 被引量：2
2李笑竹,陈来军,杜锡力,王再闯,梅生伟.考虑退役动力电池衰减特性的新能源场站群共享储能长期规划配置[J].太阳能学报,2022,43(5):499-509. 被引量：13
3颜宁,钟瑶,李相俊,武中立.基于风险防御的退役动力电池递进式分选方法研究[J].太阳能学报,2022,43(5):525-532.
4陈睿彬,陆玲霞,包哲静,于淼.电池储能系统参与用户侧削峰填谷的鲁棒优化调度策略[J].电力建设,2022,43(10):66-76. 被引量：17
5张珂瑞,王维庆.基于EKF-PF算法的退役动力锂电池SOC估计[J].现代电子技术,2023,46(5):145-150. 被引量：1
6梁杨,周永军,蒋淑霞,袁晓文,张淞.基于改进GWO-SVR的锂电池SOH估计[J].电子测量技术,2023,46(7):13-18. 被引量：5
7李练兵,朱乐,景睿雄,王兰超,韩琪琪.基于DESSA-DESN和NCA的锂离子电池剩余寿命预测[J].储能科学与技术,2023,12(10):3191-3202.
8罗涌恒,姜飞,孙梦琪,郭光,曾子豪.基于前景理论和参考值变换的分布式能源站健康状态矢量动态评价[J].电网技术,2023,47(11):4438-4447. 被引量：4
9田小芳.基于人工蜂群算法的计算机网络DDoS攻击检测方法[J].计算机测量与控制,2023,31(12):28-33. 被引量：2
10杨梅芳.基于大数据挖掘的无线通信网络拥堵预警方法[J].信息与电脑,2023,35(19):178-180.

1《金融理论探索》编辑部.《金融理论探索》编辑部关于虚假网站的严正声明[J].金融理论探索,2020(3):59-59.
2昝涛,王辉,刘智豪,王民,高相胜.基于多输入层卷积神经网络的滚动轴承故障诊断模型[J].振动与冲击,2020,39(12):142-149. 被引量：39
3魏旭,成卫青.基于特征融合和机器学习的恶意网页识别研究[J].南京邮电大学学报（自然科学版）,2019,39(5):95-104. 被引量：4
4郑涛,张仕斌,李雪杨,邵婷婷.基于Bell态的量子隐私比较协议[J].计算机工程与设计,2020,41(3):628-631.
5陈本刚,宋礼鹏.网页内容链接层次语义树的恶意网页检测方法[J].计算机工程与应用,2020,56(11):90-97. 被引量：2
6Shumeng Wu,He Wang,Li Li,Meixia Guo,Zhichong Qi,Qingyou Zhang,Yanmei Zhou.Intercalated MXene-based layered composites:Preparation and application[J].Chinese Chemical Letters,2020,31(4):961-968. 被引量：2
7冯威,诸跃进,肖金球,段杰,周惟.面向室内装饰的现代家居设计图像风格迁移研究[J].计算机应用与软件,2020,37(7):170-175. 被引量：4
8WANG Yuqing,TAO Li,CHEN Ru,LI Hao,SU Hui,ZHANG Nana,LIU Qinghua,WANG Shuangyin.Atomically Dispersed Fe on Nanosheet-linked, Defect-rich, Highly N-Doped 3D Porous Carbon for Efficient Oxygen Reduction[J].Chemical Research in Chinese Universities,2020,36(3):453-458.
9孙丽丽,李延鹏,蒋耀林.基于交叉Gram矩阵的离散周期系统模型降阶[J].计算机仿真,2020,37(6):268-272. 被引量：2
10Yuxuan Lu,Chung-Li Dong,Yu-Cheng Huang,Yuqin Zou,Yanbo Liu,Yingying Li,Nana Zhang,Wei Chen,Ling Zhou,Hongzhen Lin,Shuangyin Wang.Hierarchically nanostructured Ni O-Co3O4 with rich interface defects for the electro-oxidation of 5-hydroxymethylfurfural[J].Science China Chemistry,2020,63(7):980-986. 被引量：3

计算机工程与设计

2020年第7期

浏览历史

内容加载中请稍等...

基于多层卷积模型的恶意URL特征自动提取被引量：3

参考文献5

二级参考文献99

共引文献79

同被引文献82

引证文献3

二级引证文献24

相关作者

相关机构

相关主题

浏览历史

基于多层卷积模型的恶意URL特征自动提取 被引量：3

参考文献5

二级参考文献99

共引文献79

同被引文献82

引证文献3

二级引证文献24

相关作者

相关机构

相关主题

浏览历史

基于多层卷积模型的恶意URL特征自动提取被引量：3