期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于分层欠采样和Bi-GRU的恶意行为检测模型
被引量:
2
1
作者
周娅
李赛
《计算机工程与设计》
北大核心
2022年第2期413-419,共7页
为解决类不平衡和样本重叠问题,提出一种基于分层欠采样和Bi-GRU的恶意行为检测模型(SSU-BG)。数据预处理及特征模型的构建;基于欧氏距离算法统计出高频样本的最高密度点及类内平均距离,根据样本分布特点将高频类样本依次划分为稀疏区...
为解决类不平衡和样本重叠问题,提出一种基于分层欠采样和Bi-GRU的恶意行为检测模型(SSU-BG)。数据预处理及特征模型的构建;基于欧氏距离算法统计出高频样本的最高密度点及类内平均距离,根据样本分布特点将高频类样本依次划分为稀疏区、稀疏区边界区及稠密区3个区域,根据抽取出样本标签数在稠密区内划分出不同层次圆环,计算每个类的不均衡度,计算其均值作为整个样本的采样比例,按照此时的采样比例在稀疏区边界区的圆环域和稠密区进行分层随机欠采样;将文本向量输入训练好的Bi-GRU模型中。实验结果表明,该模型改善了整体检测效果,提高了恶意评论检测率。
展开更多
关键词
恶意评论
类不平衡
分层欠采样
Bi-GRU网络
SSU-BG算法
下载PDF
职称材料
不平衡数据集下基于自适应加权Bagging-GBDT算法的磁盘故障预测模型
被引量:
8
2
作者
李新鹏
高欣
+6 位作者
何杨
阎博
孙汉旭
李军良
徐建航
刘震宇
庞博
《微电子学与计算机》
北大核心
2020年第3期14-19,共6页
针对磁盘数据集中正负样本数目严重不平衡导致基于机器学习的分类算法易出现故障预测准确率低的问题,本文提出一种基于自适应加权Bagging-GBDT算法的磁盘故障预测模型.首先,提出基于聚类的分层欠采样方法对健康磁盘样本进行多次抽样,解...
针对磁盘数据集中正负样本数目严重不平衡导致基于机器学习的分类算法易出现故障预测准确率低的问题,本文提出一种基于自适应加权Bagging-GBDT算法的磁盘故障预测模型.首先,提出基于聚类的分层欠采样方法对健康磁盘样本进行多次抽样,解决随机欠采样方法易丢弃潜在有用样本的问题;其次,将每次采样后样本与全部故障磁盘样本组合得到多个样本子集,通过训练这些子集建立多个预测精度较高的GBDT子分类模型;最后,根据待测点邻域样本类别自适应确定各子模型权重,据此通过加权硬投票集成最终的磁盘故障预测模型.在8组KEEL不平衡数据集上实验结果表明,与现有典型不平衡学习算法相比,少数类的召回率平均提升了9.46%;同时在磁盘公开数据集和某调度系统磁盘数据上对比验证了该方法在故障预测率上的先进性.
展开更多
关键词
磁盘故障预测
不平衡数据集
分层欠采样
Bagging-GBDT
自适应加权
下载PDF
职称材料
题名
基于分层欠采样和Bi-GRU的恶意行为检测模型
被引量:
2
1
作者
周娅
李赛
机构
桂林电子科技大学计算机与信息安全学院
出处
《计算机工程与设计》
北大核心
2022年第2期413-419,共7页
基金
国家自然科学基金项目(61662015)
广西科技厅科技开发重点基金项目(桂科攻1598019)
NSFC-广东联合基金重点基金项目(U1501252)。
文摘
为解决类不平衡和样本重叠问题,提出一种基于分层欠采样和Bi-GRU的恶意行为检测模型(SSU-BG)。数据预处理及特征模型的构建;基于欧氏距离算法统计出高频样本的最高密度点及类内平均距离,根据样本分布特点将高频类样本依次划分为稀疏区、稀疏区边界区及稠密区3个区域,根据抽取出样本标签数在稠密区内划分出不同层次圆环,计算每个类的不均衡度,计算其均值作为整个样本的采样比例,按照此时的采样比例在稀疏区边界区的圆环域和稠密区进行分层随机欠采样;将文本向量输入训练好的Bi-GRU模型中。实验结果表明,该模型改善了整体检测效果,提高了恶意评论检测率。
关键词
恶意评论
类不平衡
分层欠采样
Bi-GRU网络
SSU-BG算法
Keywords
toxic comments
class imbalance
hierarchical undersampling
Bi-GRU network
SSU-BG algorithm
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
不平衡数据集下基于自适应加权Bagging-GBDT算法的磁盘故障预测模型
被引量:
8
2
作者
李新鹏
高欣
何杨
阎博
孙汉旭
李军良
徐建航
刘震宇
庞博
机构
国家电网有限公司
北京邮电大学自动化学院
国网冀北电力有限公司
南瑞集团(国网电力科学研究院)有限公司
国网冀北电力有限公司承德供电公司
出处
《微电子学与计算机》
北大核心
2020年第3期14-19,共6页
基金
国家电网公司总部科技项目-调度控制系统测试验证与一体化运维关键技术研究与应用(DZ71-18-010)。
文摘
针对磁盘数据集中正负样本数目严重不平衡导致基于机器学习的分类算法易出现故障预测准确率低的问题,本文提出一种基于自适应加权Bagging-GBDT算法的磁盘故障预测模型.首先,提出基于聚类的分层欠采样方法对健康磁盘样本进行多次抽样,解决随机欠采样方法易丢弃潜在有用样本的问题;其次,将每次采样后样本与全部故障磁盘样本组合得到多个样本子集,通过训练这些子集建立多个预测精度较高的GBDT子分类模型;最后,根据待测点邻域样本类别自适应确定各子模型权重,据此通过加权硬投票集成最终的磁盘故障预测模型.在8组KEEL不平衡数据集上实验结果表明,与现有典型不平衡学习算法相比,少数类的召回率平均提升了9.46%;同时在磁盘公开数据集和某调度系统磁盘数据上对比验证了该方法在故障预测率上的先进性.
关键词
磁盘故障预测
不平衡数据集
分层欠采样
Bagging-GBDT
自适应加权
Keywords
prediction of disk failure
imbalanced dataset
hierarchical under-sampling
Bagging-GBDT
adaptive weighted
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于分层欠采样和Bi-GRU的恶意行为检测模型
周娅
李赛
《计算机工程与设计》
北大核心
2022
2
下载PDF
职称材料
2
不平衡数据集下基于自适应加权Bagging-GBDT算法的磁盘故障预测模型
李新鹏
高欣
何杨
阎博
孙汉旭
李军良
徐建航
刘震宇
庞博
《微电子学与计算机》
北大核心
2020
8
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部