摘要
本文提出一种面向不平衡分类算法,旨在提高分类效率并且降低时间消耗量。针对不平衡数据的分类与管理,首先,采用K-means来聚类数据集;之后,依据不平衡数据量来计算少数类数据所占据的区域,通过每个簇的权重大小进行采样处理,以克服类间不平衡的情况;最后,完成对簇结构的欠采样处理,以平衡整个数据集。通过欠采样与过采样处理技术,最终实现对不平衡数据集的分类算法。
出处
《电子技术与软件工程》
2021年第13期160-161,共2页
ELECTRONIC TECHNOLOGY & SOFTWARE ENGINEERING