基于分集群的欠采样数据分类方法
摘要
针对非平衡数据集的分类问题,本文提出在欠采样法的基础上使用分类集群的改进方法,以提高非平衡数据集中对少数类的分类的正确率。通过实验表明,该方法可行有效。
出处
《科技信息》
2012年第7期201-201,210,共2页
Science & Technology Information
参考文献3
-
1Chawla N,Bowyer k,Hall L,et al.SMOTE:Synthetic Minority Over-samplingTechnique.Journal of Artificilal Intelligence Research,2002,16:321-357.
-
2陈思,郭躬德,陈黎飞.基于聚类融合的不平衡数据分类方法[J].模式识别与人工智能,2010,23(6):772-780. 被引量:28
-
3Tomek,I.Two Modifications of CNN.IEEE Transactions on Systems Man andCommunications SMC-6(1976):769-772.
二级参考文献27
-
1Kotsiantis S,Kanellopoulos D,Pintelas P.Handling Imbalanced Datasets:A Review.GESTS International Trans on Computer Science and Engineering,2006,30(1):25-36.
-
2Burez J,van den Poel D.Handling Class Imbalance in Customer Churn Prediction.Expert Systems with Applications,2009,36(3):4626-4636.
-
3Chawla N V,Bowyer K W,Hall L O,et al.SMOTE:Synthetic Minority Over-Sampling Technique.Journal of Artificial Intelligence Research,2002,16(1):321-357.
-
4Han Hui,Wang Wenyuan,Mao Binghuan.Borderline-SMOTE:A New Over-Sampling Method in Imbalanced Data Sets Learning // Proc of the International Conference on Intelligent Computing.Hefei,China,2005:878-887.
-
5Guo Hongyu,Viktor H L.Learning from Imbalanced Data Sets with Boosting and Data Generation:the DataBoost-IM Approach.ACM SIGKDD Explorations Newsletter,2004,6(1):30-39.
-
6Chawla N V,Lazarevic A,Hall L O,et al.SMOTEBoost:Improving Prediction of the Minority Class in Boosting // Proc of the 7th European Conference on Principles and Practice of Knowledge Discovery in Databases.Dubrovnik,Croatia,2003:107-119.
-
7Garcìa S,Herrera F.Evolutionary Undersampling for Classification with Imbalanced Datasets:Proposals and Taxonomy.Evolutionary Computation,2009,17(3):275-306.
-
8Joshi M V,Kumar V,Agarwal R.Evaluating Boosting Algorithms to Classify Rare Classes:Comparison and Improvements // Proc of the 1st IEEE International Conference on Data Mining.San Jose,USA,2001:257-264.
-
9Cieslak D A,Chawla N V.Learning Decision Trees for Unbalanced Data // Proc of the European Conference on Machine Learning and Knowledge Discovery in Databases.Antwerp,Belgium,2008:241-256.
-
10Fernández A,del Jesus M J,Herrera F.Hierarchical Fuzzy Rule Based Classification Systems with Genetic Rule Selection for Imbalanced Data-Sets.International Journal of Approximate Reasoning,2009,50(3):561-577.
共引文献27
-
1王晓娟.一种改进的SMOTE过采样方法[J].福建电脑,2011,27(6):145-146.
-
2王晓娟,郭躬德.不平衡数据采样方法的对比学习[J].微计算机信息,2011,27(12):155-157. 被引量:4
-
3王超学,潘正茂,董丽丽,马春森,张星.基于改进SMOTE的非平衡数据集分类研究[J].计算机工程与应用,2013,49(2):184-187. 被引量:19
-
4楼晓俊,孙雨轩,刘海涛.聚类边界过采样不平衡数据分类方法[J].浙江大学学报(工学版),2013,47(6):944-950. 被引量:31
-
5骆自超,金隼,邱雪峰.考虑类内不平衡的谱聚类过抽样方法[J].计算机工程与应用,2014,50(11):120-125. 被引量:3
-
6黄剑文,严宇平.基于聚类集成的用户负荷模式识别[J].计算机应用与软件,2014,31(12):237-241. 被引量:4
-
7霍玉丹,谷琼,蔡之华,袁磊.基于遗传算法改进的少数类样本合成过采样技术的非平衡数据集分类算法[J].计算机应用,2015,35(1):121-124. 被引量:19
-
8王超学,张涛,马春森.面向不平衡数据集的改进型SMOTE算法[J].计算机科学与探索,2014,8(6):727-734. 被引量:25
-
9赵鑫.网络与密码安全在计算机数据挖掘类软件中的要求分析[J].数字技术与应用,2015,33(3):188-188. 被引量:1
-
10杜红乐,张燕.不均衡数据混合取样分类算法[J].燕山大学学报,2015,39(2):158-164. 被引量:6
-
1毛顿.计算机病毒分析与对策[J].现代通信技术,1997(4):66-71.
-
2刘建国,黄厚宽.使用分类和聚类提高搜索引擎的可用性[J].铁路计算机应用,2006,15(3):44-46. 被引量:1
-
3崔炳俭,陈德生,董卫红,黄跃青,王全周,潘新民.UPS应急电源在气象部门的使用及维护[J].气象与环境科学,2009,32(4):84-87. 被引量:5
-
4黄庆炬,吴珊.基于相对支持度的关联规则和序列模式分析[J].软件导刊,2007,6(7):3-4.
-
5石祥滨,刘晓娜,刘芳.一种双阈值红外行人分割方法[J].计算机工程,2012,38(12):5-8. 被引量:5
-
6赵龙才,李强子,黄慧萍.基于高分辨率影像的平原地区农村居民点自动化提取方法研究[J].遥感技术与应用,2016,31(4):784-792. 被引量:3
-
7蒲汛,于显平,卢显良.改进Pareto蚁群算法的多QoS组播路由策略[J].小型微型计算机系统,2012,33(12):2575-2579. 被引量:2
-
8刘燕驰,高学东,国宏伟,武森.应用分类方法进行聚类评价[J].计算机应用研究,2011,28(10):3637-3639. 被引量:1
-
9王永平.文物信息获取系统关键技术分析[J].计算机技术与发展,2010,20(7):219-222.
-
10张捍东,李金炜.基于性别识别的分类CHMM语音识别[J].计算机工程与应用,2007,43(21):187-189. 被引量:4