-
题名基于犹豫模糊决策树的非均衡数据分类
被引量:15
- 1
-
-
作者
张旭
周新志
赵成萍
邵伦
-
机构
四川大学电子信息学院
-
出处
《计算机工程》
CAS
CSCD
北大核心
2019年第8期75-79,91,共6页
-
基金
国家重点基础研究发展计划(2013CB328903-2)
-
文摘
为优化针对非均衡数据的分类效果,结合犹豫模糊集理论与决策树算法,提出一种改进的模糊决策树算法。通过SMOTE算法对非均衡数据进行过采样处理,使用K-means聚类方法获得各属性的聚类中心点,利用2种不同的隶属度函数对数据集进行模糊化处理。在此基础上,根据隶属度函数和犹豫模糊集的信息能量求得各属性的犹豫模糊信息增益,选取最大值替代Fuzzy ID3算法中的模糊信息增益作为属性的分裂准则,构建一个用于非均衡数据分类的犹豫模糊决策树模型。实验结果表明,基于犹豫模糊决策树的分类器在AUC评价指标上相对于C4.5、KNN、随机森林等传统分类算法平均提高了12.6 %。
-
关键词
非均衡数据
犹豫模糊集
犹豫模糊决策树
K-MEANS聚类
FUZZY
ID3算法
-
Keywords
unbalanced data
hesitant fuzzy sets
Hesitant Fuzzy Decision Tree(HFDT)
K-means clustering
Fuzzy ID3 algorithm
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-