一种加权的MCLP分类模型及其在不平衡数据集上的应用
摘要
在数据挖掘的分类问题中,经常出现数据集内类别不平衡现象。大部分分类方法对于不平衡数据集内的小类数据,分类精度并不理想。文章分析了多目标线性规划分类方法(简称MCLP)在不平衡数据集上的表现;然后从模型角度,提出了面向不平衡数据集的加权MCLP分类模型。从理论上分析了加权MCLP分类模型的有效性,并从实证角度,与其他方法进行了比较。
出处
《统计与决策》
CSSCI
北大核心
2011年第21期18-21,共4页
Statistics & Decision
基金
首都经济贸易大学校级重点项目(2011XJZ013)
参考文献10
-
1P E Hart. The Condensed Nearest Neighbor Rule[J].IEEE Transactions on Information Theory, 1968, (14).
-
2D L Wilson. Asymptotic Properties of Nearest Neighbor Rules Using Edited Data [J].IEEE Transactions on Systems, Man, and Communications, 1972,(3).
-
3I Tomek. Two Modifications of CNN [J].IEEE Transactions on Systems Man and Communications, SMC-6,1976.
-
4M Kubat, S Matwin.Addressing the Curse of Imbalanced Training Sets: One-Sided Selection[A].Proceedings of the Fourteenth International Conference on Machine Learning [C].San Francisco: Morgan Kaufmann, 1997.
-
5N V Chawla, K W Bowyer, L O Hall, et al. SMOTE: Synthetic Minority over-sampling Technique [J]. Journal of Artificial Intelligence Research, 2002,(16).
-
6C Phua, D Alahakoon, V Lee. Minority Report in Fraud Detection: Classification of Skewed Data [J]. IGKDD Explorations, 2004,6(1).
-
7G H Nguyen, A Bouzerdoum, S L Phung. A Supervised Learning Approach for Imbalanced Data Sets [A]. Proceedings of Nineteenth International Conference on Pattern Recognition[C].IEEE Computer Society, 2008.
-
8G E Batista, R C Prati, M C Monard. A Study of the Behavior of Several Methods for Balancing Machine Learning Training Data [J]. SIGKDD Explorations, 2004,6( 1 ).
-
9Y Shi, M Wise, M Luo, et al. Data Mining in Credit Card Portfolio Management: A Multiple Criteria Decision Making Approach[A].M Koksalan, S Zionts.Multiple Criteria Decision Making in the New Millennium [M].Berlin: Springer, 2001.
-
10Y Shi, Y Peng, W X Xu, X Tang. Data Mining via Multiple Criteria Linear Programming: Applications in Credit Card Portfolio Management [J]. Information Technology and Decision Making,2002,1( 1 ).
-
1刘维会,贺国平.一种调整分类超平面偏移的方法—平均距离比MDR法[J].佳木斯大学学报(自然科学版),2010,28(1):132-135.
-
2朱梅红,石勇,李爱华,张东玲.三种分类算法偏差-方差结构的比较:MCLP,LDA和C5.0[J].中国科学院研究生院学报,2009,26(4):443-450. 被引量:1
-
3王一丁,杨虹.基于多目标线性规划的人脸识别方法[J].北方工业大学学报,2009,21(1):17-21.
-
4白鹤松.基于多目标线性规划的决策模型研究[J].哈尔滨理工大学学报,2008,13(6):57-59. 被引量:5
-
5沙献玉.试论人口生产与物质资料生产的平衡[J].河南师大学报(社会科学版),1982,22(2):29-32.
-
6李建平,徐伟宣,石勇.数据挖掘技术中的线性方法[J].中国管理科学,2002,10(z1):82-84.
-
7李洁.七大指标看社会和谐度[J].党政干部文摘,2006(10):16-17.
-
8许小东.组织发展干预分类模型述评[J].应用心理学,1996,2(2):49-55.
-
9唐昌建,刘濮鲲.介质分界面上电磁波传播特性的一个理论问题研究[J].大学物理,1994,13(12):6-8. 被引量:1
-
10王兆艳.保持正交性的多小波预滤波器[J].济宁学院学报,2008,29(3):8-10.