期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于集成学习算法的恶意软件感染二分类预测 被引量:3
1
作者 张银杰 揣锦华 翟晓惠 《计算机技术与发展》 2021年第5期15-20,共6页
对随机森林和LightGBM两种集成学习算法在恶意软件感染二分类预测中的应用进行了研究。针对恶意软件感染预测数据集,通过预处理修正异常值,选择合适的编码方式处理数据集中不同类型的数据;进行特征工程处理,包括原始特征的构建并对部分... 对随机森林和LightGBM两种集成学习算法在恶意软件感染二分类预测中的应用进行了研究。针对恶意软件感染预测数据集,通过预处理修正异常值,选择合适的编码方式处理数据集中不同类型的数据;进行特征工程处理,包括原始特征的构建并对部分特征进行拆分,构建时间戳特征以补充缺失的时间信息;使用基于Bagging集成的随机森林算法得到特征重要性分数,并按照从高到低的顺序排列以发现对预测恶意软件感染影响较大的因素;根据重要性分数划分出含有不同特征的数据集,分别选择随机森林和基于Boosting集成的LightGBM算法建立预测模型,根据随机森林的AUC值变化评估出最合适的特征集以实现降维过程;选择传统决策树与集成学习算法比较五折交叉验证结果。实验结果表明:集成学习算法在预测过程中能够确定合适的特征数量,且预测性能明显高于传统决策树算法。 展开更多
关键词 集成学习 恶意软件感染 二分类预测 随机森林 LightGBM 特征工程
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部