期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
面向不平衡数据集融合Canopy和K-means的SMOTE改进算法 被引量:8
1
作者 郭朝有 许喆 +1 位作者 马砚堃 曹蒙蒙 《科学技术与工程》 北大核心 2020年第22期9069-9074,共6页
针对SMOTE算法和随机森林可较好解决不平衡数据集的分类问题但对少数类样本分类效果还有待提高的问题,融合Canopy和K-means两种聚类算法,设计了C-K-SMOTE改进算法。先后利用Canopy算法进行快速近似聚类,再利用K-means算法进行精准聚类,... 针对SMOTE算法和随机森林可较好解决不平衡数据集的分类问题但对少数类样本分类效果还有待提高的问题,融合Canopy和K-means两种聚类算法,设计了C-K-SMOTE改进算法。先后利用Canopy算法进行快速近似聚类,再利用K-means算法进行精准聚类,得到精准聚类簇,最后利用SMOTE算法增加少数类样本数量,使数据趋于平衡。选取公开数据集KEEL(knowledge extraction on evolutionary learning)数据库中的不平衡数据集,结合随机森林分类模型进行了实验验证,实验表明C-K-SMOTE算法可有效平衡不平衡数据集。 展开更多
关键词 Canopy算法 K-MEANS算法 SMOTE算法 C-K-SMOTE算法 随机森林 不平衡数据集 分类问题
下载PDF
基于随机森林的船用柴油机故障诊断方法研究 被引量:6
2
作者 马砚堃 郭朝有 许喆 《舰船电子工程》 2020年第11期128-131,共4页
论文介绍了船用柴油机故障诊断的重要性,为了在原有的传统诊断方法上进行改进,文章引进了数据挖掘的概念。在基于Spark平台的计算框架内,采用Spark系统集成的随机森林函数库对柴油机的运行数据进行了数据分析。考虑到数据量的有限,论文... 论文介绍了船用柴油机故障诊断的重要性,为了在原有的传统诊断方法上进行改进,文章引进了数据挖掘的概念。在基于Spark平台的计算框架内,采用Spark系统集成的随机森林函数库对柴油机的运行数据进行了数据分析。考虑到数据量的有限,论文采取了伪分布式布局,在Spark单机模式下完成了数据挖掘任务。实验结果表明,随机森林模型对船用柴油机参数异常的分类准确率很高,能够基本完成对船用柴油机故障的诊断。同时,对随机森林算法在该数据集上的参数设置进行了优选。 展开更多
关键词 Spark平台 随机森林 柴油机 故障诊断
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部