期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于集成学习算法的恶意软件感染二分类预测
被引量:
3
1
作者
张银杰
揣锦华
翟晓惠
《计算机技术与发展》
2021年第5期15-20,共6页
对随机森林和LightGBM两种集成学习算法在恶意软件感染二分类预测中的应用进行了研究。针对恶意软件感染预测数据集,通过预处理修正异常值,选择合适的编码方式处理数据集中不同类型的数据;进行特征工程处理,包括原始特征的构建并对部分...
对随机森林和LightGBM两种集成学习算法在恶意软件感染二分类预测中的应用进行了研究。针对恶意软件感染预测数据集,通过预处理修正异常值,选择合适的编码方式处理数据集中不同类型的数据;进行特征工程处理,包括原始特征的构建并对部分特征进行拆分,构建时间戳特征以补充缺失的时间信息;使用基于Bagging集成的随机森林算法得到特征重要性分数,并按照从高到低的顺序排列以发现对预测恶意软件感染影响较大的因素;根据重要性分数划分出含有不同特征的数据集,分别选择随机森林和基于Boosting集成的LightGBM算法建立预测模型,根据随机森林的AUC值变化评估出最合适的特征集以实现降维过程;选择传统决策树与集成学习算法比较五折交叉验证结果。实验结果表明:集成学习算法在预测过程中能够确定合适的特征数量,且预测性能明显高于传统决策树算法。
展开更多
关键词
集成学习
恶意软件感染
二分类预测
随机森林
LightGBM
特征工程
下载PDF
职称材料
题名
基于集成学习算法的恶意软件感染二分类预测
被引量:
3
1
作者
张银杰
揣锦华
翟晓惠
机构
长安大学信息工程学院
出处
《计算机技术与发展》
2021年第5期15-20,共6页
基金
国家重点研发计划“综合交通运输与智能交通”专项(2018YFB1600200)。
文摘
对随机森林和LightGBM两种集成学习算法在恶意软件感染二分类预测中的应用进行了研究。针对恶意软件感染预测数据集,通过预处理修正异常值,选择合适的编码方式处理数据集中不同类型的数据;进行特征工程处理,包括原始特征的构建并对部分特征进行拆分,构建时间戳特征以补充缺失的时间信息;使用基于Bagging集成的随机森林算法得到特征重要性分数,并按照从高到低的顺序排列以发现对预测恶意软件感染影响较大的因素;根据重要性分数划分出含有不同特征的数据集,分别选择随机森林和基于Boosting集成的LightGBM算法建立预测模型,根据随机森林的AUC值变化评估出最合适的特征集以实现降维过程;选择传统决策树与集成学习算法比较五折交叉验证结果。实验结果表明:集成学习算法在预测过程中能够确定合适的特征数量,且预测性能明显高于传统决策树算法。
关键词
集成学习
恶意软件感染
二分类预测
随机森林
LightGBM
特征工程
Keywords
integrated learning
malware infection
binary prediction
random forest
LightGBM
feature engineering
分类号
TP311.5 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于集成学习算法的恶意软件感染二分类预测
张银杰
揣锦华
翟晓惠
《计算机技术与发展》
2021
3
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部