期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

基于欠采样和多层集成学习的恶意网页识别

Malicious web page recognition based on undersampling and multi-layer ensemble learning

下载PDF

导出

摘要现实中恶意网页与良性网页比重严重失衡,传统的机器学习分类模型不能很好的应用,为此提出一种基于欠采样和多层集成学习的恶意网页检测模型。通过欠采样达到局部数据平衡;通过第一层基于权重和阈值的集成学习确保模型的准确度;通过第二层基于投票的集成学习保证全局信息的完整性。实验结果表明,所提模型在不平衡数据集上的恶意网页识别性能优于传统机器学习模型。 According to the serious imbalance between malicious web pages and benign web pages in reality,the traditional machine learning classification model can not be well applied.To solve the problem,a malicious web page detection model based on undersampling and multi-layer ensemble learning was proposed.Local data balance was achieved by undersampling.The accuracy of the model was ensured through the first layer of integrated learning based on weights and thresholds.The integrity of global information was ensured through the second layer of voting based integrated learning.Experimental results show that the proposed model outperforms the traditional machine learning model in identifying malicious web pages on unbalanced data sets.

作者王法玉于晓文陈洪涛 WANG Fa-yu;YU Xiao-wen;CHEN Hong-tao(National Engineering Laboratory of Computer Virus Prevention and Control Technology,Tianjin University of Technology,Tianjin 300384,China)

机构地区天津理工大学计算机病毒防治技术国家工程实验室

出处《计算机工程与设计》北大核心 2024年第3期669-675,共7页 Computer Engineering and Design

基金国家自然科学基金项目(61571328)。

关键词恶意网页识别不平衡数据多层分类器欠采样机器学习集成学习检测效果 malicious web page identification unbalanced data multilayer classifier under sampling machine learning integrated learning detection effect

分类号 TP393 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献8

1麻瓯勃,刘雪娇,唐旭栋,周宇轩,胡亦承.基于半监督学习的恶意URL检测方法[J].计算机系统应用,2020(11):11-20. 被引量：3
2倪一涛,陈咏佳,林柏钢.基于自动解混淆的恶意网页检测方法[J].信息网络安全,2019(4):37-46. 被引量：4
3吴森焱,罗熹,王伟平,覃岩.融合多种特征的恶意URL检测方法[J].软件学报,2021,32(9):2916-2934. 被引量：5
4林夕,陈孜卓,王中卿.基于不平衡数据与集成学习的属性级情感分类[J].计算机科学,2022,49(S01):144-149. 被引量：2
5王俊红,闫家荣.基于欠采样和代价敏感的不平衡数据分类算法[J].计算机应用,2021,41(1):48-52. 被引量：20
6徐玲玲,迟冬祥.面向不平衡数据集的机器学习分类策略[J].计算机工程与应用,2020,56(24):12-27. 被引量：58
7贺指陈.基于集成学习和代价敏感的类别不平衡数据分类算法[J].信息记录材料,2022,23(1):18-22. 被引量：1
8张士坤.基于多层分类器的恶意网页检测技术研究[J].现代计算机,2020,26(18):64-68. 被引量：3

二级参考文献41

1林舒杨,李翠华,江弋,林琛,邹权.不平衡数据的降采样方法研究[J].计算机研究与发展,2011,48(S3):47-53. 被引量：31
2蒋盛益,谢照青,余雯.基于代价敏感的朴素贝叶斯不平衡数据分类研究[J].计算机研究与发展,2011,48(S1):387-390. 被引量：21
3梁吉业,高嘉伟,常瑜.半监督学习研究进展[J].山西大学学报（自然科学版）,2009,32(4):528-534. 被引量：32
4杨扬,李善平.基于实例重要性的SVM解不平衡数据分类[J].模式识别与人工智能,2009,22(6):913-918. 被引量：14
5赵妍妍,秦兵,刘挺.文本情感分析[J].软件学报,2010,21(8):1834-1848. 被引量：528
6王伟,薛安荣,刘峰.改进的SVM解决背景知识数据中的类不平衡[J].计算机应用研究,2011,28(8):2902-2904. 被引量：6
7张永,李卓然,刘小丹.基于主动学习SMOTE的非均衡数据分类[J].计算机应用与软件,2012,29(3):91-93. 被引量：23
8王志昊,王中卿,李寿山,李培峰.不平衡情感分类中的特征选择方法研究[J].中文信息学报,2013,27(4):113-118. 被引量：6
9周志华.基于分歧的半监督学习[J].自动化学报,2013,39(11):1871-1878. 被引量：83
10顾晓清,王洪元,倪彤光,丁辉.基于贝叶斯和支持向量机的钓鱼网站检测方法[J].计算机工程与应用,2015,51(4):87-90. 被引量：13

共引文献86

1瞿俊,何源.基于控制流混淆抵御算法的Android应用程序逆向分析研究[J].信息网络安全,2020(S01):71-74. 被引量：1
2张艺豪,盛丹红,李丽芳,翟丹丹.基于加权随机森林的信用卡欺诈检测应用与研究[J].电脑编程技巧与维护,2021(4):111-112. 被引量：2
3李高翔,叶宇中,黄福鸿,卓采标,潘国良,陈金林,陈德兴,吴雁琛.贷款类诈骗网站识别方法研究[J].广东通信技术,2021,41(6):72-76. 被引量：1
4张蕾.基于卡方差异性和t-SNE的定性数据分类研究[J].电子测量技术,2021,44(5):100-106.
5孙柳.基于多种群协同进化算法的数据并行聚类算法[J].智能计算机与应用,2021,11(6):144-147.
6阮顺领,金裕,李发本,顾清华,王丹娜.基于人工鱼群神经网络进化的露天矿卡车优化调度研究[J].矿业研究与开发,2021,41(8):154-160. 被引量：8
7杨昊天,黎敏,万齐康,邓雄狮,顾乾晖.基于多段处理的软件缺陷预测[J].工业控制计算机,2021,34(8):118-119.
8邓明阳,郭应时,刘通.基于分层重组的不平衡数据采样方法研究[J].重庆理工大学学报（自然科学）,2021,35(8):122-128. 被引量：3
9彭文良,吴红虹.基于Python语言的高敏数据动态抓取方法研究[J].蚌埠学院学报,2021,10(5):61-65. 被引量：4
10王文博,曾小梅,赵引川,张云云,刘达.基于SMOTE-XGBoost的变压器缺陷预测[J].华北电力大学学报（自然科学版）,2021,48(5):54-60. 被引量：9

1杨翀,李旭东,吕良福,张靖悦,袁恒杰,张毅.基于机器学习预测动脉瘤性蛛网膜下腔出血预后模型的临床研究与应用[J].中国医院药学杂志,2024,44(3):257-262.
2郑怡昕,王重仁.基于Optuna框架的L_(p)范数约束下多核支持向量机在违约风险预测中的应用[J].现代电子技术,2024,47(6):147-153.
3蔡博,张海清,李代伟,向筱铭,于曦,邓钧予.基于增量加权的不平衡漂移数据流分类算法[J].计算机应用研究,2024,41(3):854-860.
4刘威,熊伟,刘强.基于SMOTE的神经外科患者输血机器学习预测模型建立[J].医药前沿,2024,14(7):143-146.
5崔宁波,王婷,董晋.“双碳”目标下东北黑土区耕地利用生态效率时空格局与演变趋势[J].水土保持研究,2024,31(1):335-344.
6周华平,李美光.基于图像风格对抗和二重类别优化的夜间图像语义分割[J].湖北民族大学学报（自然科学版）,2024,42(1):69-74.
7刘伟韬,李蓓蓓,杜衍辉,韩梦珂,赵吉园.基于改进的SSA-BP神经网络的矿井突水水源识别模型研究[J].工矿自动化,2024,50(2):98-105.
8张冉.环境公益侵权诉讼中的举证责任与分配规则[J].中南民族大学学报（人文社会科学版）,2024,44(3):173-180. 被引量：1
9王南南,王煜.检察监督在依法推进假释适用中的路径探索[J].中国检察官,2024(1):37-40.

计算机工程与设计

2024年第3期

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...

;

使用帮助返回顶部