-
题名基于聚类融合欠采样的不平衡分类方法
被引量:2
- 1
-
-
作者
叶枫
江永省
-
机构
浙江工业大学管理学院
-
出处
《计算机应用与软件》
北大核心
2020年第1期292-297,共6页
-
文摘
不平衡分类在现实生活中有着广泛应用,提高不平衡数据的分类精度一直是相关领域中的热门课题。针对已有欠采样方法容易保留多数类噪声样本的问题,提出一种基于聚类融合欠采样的改进欠采样方法。结合聚类融合与孤立森林(Isolation Forest,iForest)方法,筛选、删除异常指数高的多数类噪声样本,有效提高模型中的样本质量,增强欠采样算法的抗噪声能力。在7个UCI和KEEL不平衡数据集上的实验结果表明,该算法在处理不平衡分类问题时,AUC值和F1值均有一定程度的提升。将算法应用在蛋白质定位预测,提升了预测效果。
-
关键词
不平衡分类
聚类融合
欠采样
噪声
-
Keywords
Imbalanced classification
Clustering ensemble
Under-sampling Noise
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-