基于核函数拟合的非平衡数据分类方法被引量：1

A FITTED KERNEL FUNCTION BASED CLASSIFICATION METHOD FOR IMBALANCED DATASET

下载PDF

导出

摘要在数据分类算法的实际应用中,经常会遇到数据不平衡的问题(即正负样本的数目相差极大)。标准的分类算法在处理这一问题时,往往很难达到令人满意的性能。提出一种新的方法,通过对正负样本分别进行核函数拟合,根据拟合好的核函数对未知样本进行预测。在UCI标准数据集的仿真实验结果表明,该方法能有效地处理非平衡数据问题。 The data imbalance problem,where the difference between numbers of positive samples and negative samples are much great,frequently occurs in practical application of data classification algorithms.Standard classification algorithm is hard to perform satisfactorily when dealing with this.In this paper,the author propose a new method,which fits the positive samples and negative samples respectively with kernel functions and predicts the unknown samples according to the fitted kernel function.Simulation experiment results made on UCI standard data sets shown that the proposed method can effectively deal with the imbalanced data problems.

作者马胜祥马建庆杨明

机构地区复旦大学计算机与信息技术系

出处《计算机应用与软件》 CSCD 2010年第4期177-179,共3页 Computer Applications and Software

关键词非平衡数据核函数拟合 Imbalanced data Kernel function Fitting

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献5

1Kubat M,Matwin S.Addressing the curse of imbalanced training sets:One-sided selection[C]//Proceddings of the Fourteenth International Conference on Machine Learning,Nashville,1997:179-186.
2Chawla N,Bowyer K,Hall L.Smote:synthetic minority over-sampling technique[C]//International Conference on Knowledge Based Computer Systems,2000.
3Nugroho A,Kuroyanagi S,Iwata A.A solution for imbalanced training sets problem by combnet-ii and its application on fog forecasting.IEICE Transactionon Information and Systems,2002,E85-D:1165-1174.
4Kaizhu Huang,Haiqin Yang,Irwin King.Correspondence Imbalanced Learning with a Biased Minimax Probability Machine[J].IEEE Transactions on Systems,Man,and Cybernetics.2006,36(4):913.
5Asuncion A,Newman D J.UCI Machine Learning Repository.Irvine,CA:University of California,School of Information and Computer Science,2007.http://www.ics.uci.edu/-mlearn/MLRepository.html.

同被引文献4

1王平,王文剑.基于时序核函数的支持向量回归机[J].计算机辅助工程,2006,15(3):35-38. 被引量：3
2袁前飞,蔡从中,肖汉光,刘兴华,孔春阳.基于支持向量机的乳腺癌预后状态预测和疗效评估[J].北京生物医学工程,2007,26(4):372-376. 被引量：4
3臧丹丹,崔颖,师建国,王文勇,王瑞安,闫庆国.中国西部地区乳腺癌诊断年龄的抽样分析及中美对比研究[J].现代肿瘤医学,2010,18(3):571-573. 被引量：26
4崔炳德.支持向量机分类器遥感图像分类研究[J].计算机工程与应用,2011,47(27):189-191. 被引量：12

引证文献1

1贺立强,王玉娟,林和平.基于支持向量机的乳腺癌化疗预后状态预测[J].微型机与应用,2015,34(23):48-50.

1林智勇.数据不平衡及其他对SVM分类器的影响—实验研究[J].广东技术师范学院学报,2008,29(6):15-19. 被引量：1
2王浩.基于随机森林的网络攻击检测方法[J].软件,2016,37(11):60-63. 被引量：4
3李勇.一种基于投票的不平衡数据分类集成算法[J].科学技术与工程,2014,22(21):275-279. 被引量：3
4李元菊.数据不平衡分类研究综述[J].现代计算机,2016,22(3):30-33. 被引量：6
5钱苏丽,何建敏,王纯麟.基于改进支持向量机的电信客户流失预测模型[J].管理科学,2007,20(1):54-58. 被引量：25
6曹蓉,杨明.一种基于PSVM的多类分类方法[J].计算机工程与应用,2008,44(21):123-125.
7周瑜,顾宏.面向不平衡数据的逻辑回归偏标记学习算法[J].大连理工大学学报,2017,57(2):184-188. 被引量：4
8鞠哲,曹隽喆,顾宏.用于不平衡数据分类的模糊支持向量机算法[J].大连理工大学学报,2016,56(5):525-531. 被引量：15
9刘三民,孙知信.基于支持向量数据描述的P2P流量识别[J].吉林大学学报（工学版）,2012,42(4):947-951.
10杨明,尹军梅,吉根林.不平衡数据分类方法综述[J].南京师范大学学报（工程技术版）,2008,8(4):7-12. 被引量：28

计算机应用与软件

2010年第4期

浏览历史

内容加载中请稍等...

基于核函数拟合的非平衡数据分类方法被引量：1

参考文献5

同被引文献4

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于核函数拟合的非平衡数据分类方法 被引量：1

参考文献5

同被引文献4

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于核函数拟合的非平衡数据分类方法被引量：1