改进的SVM解决背景知识数据中的类不平衡被引量：6

Handling class imbalance problem in context knowledge dataset based on improved SVM

下载PDF

导出

摘要针对背景知识数据集中存在的类不平衡对分类器的影响,根据背景知识数据集样本量小、数据维数高的特性分析了目前各种方法在解决背景知识数据中的类不平衡问题时的缺陷,提出了一种基于分类后处理的改进SVM算法。改进算法引入权重参数调整SVM的分类决策函数,提高少类样本对分类器的贡献,使分类平面向多类样本倾斜,从而解决类不平衡对SVM造成的影响。在MAROB数据集上的实验表明,改进算法对少类的预测效果要优于传统的机器学习算法。 Focusing on the drawback that the performance of standard classifiers is often severely hindered in practice due to the imbalanced distribution of class in the context knowledge dataset,this paper analyzed the current methods＇ problem in resolving the class imbalance problem in the context knowledge dataset according to its small sample and high dimension features.Then,proposed an improved SVM algorithm.The proposed SVM used a weight parameter to adjust the decision function and improved the small sample class＇s contribution to the classification,and made the plane to move towards to the larger sample class.Thus,in this way,it handled the problem caused by the class imbalance.The experiment result based on MAROB dataset shows that the proposed algorithm is better than the standard classifiers to handle the class imbalance problem in the context knowledge dataset.

作者王伟薛安荣刘峰

机构地区江苏大学计算机科学与通信工程学院

出处《计算机应用研究》 CSCD 北大核心 2011年第8期2902-2904,2908,共4页 Application Research of Computers

基金国家自然科学基金资助项目(60773049) 江苏大学高级人才启动基金资助项目(09JDG041)

关键词类不平衡支持向量机背景知识恐怖行为方式预测 MAROB class imbalance SVM context knowledge terrorism behavior prediction MAROB

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献7

1SU Peng, MAO Wen-ji, ZENG D, et al. Handling class imbalance problem in cultural modeling[ C ]//Proc of IEEE International Confe- rence on Intelligence and Security Informaties. New York: IEEE Press,2009 : 251-256.
2李晓晨,毛文吉,曾大军,苏鹏,王飞跃.Performance Evaluation of Machine Learning Methods in Cultural Modeling[J].Journal of Computer Science & Technology,2009,24(6):1010-1017. 被引量：3
3翟云,杨炳儒,曲武.不平衡类数据挖掘研究综述[J].计算机科学,2010,37(10):27-32. 被引量：37
4JEATRAKUL P, WONG K W, FUNG C C. Misclassification analysis for the class imbalance problem [ C ]//Proc of World Automation Congress. New York: IEEE Press, 2010:1-6.
5BATUWITA R, PALADE V. Efficient resampling methods for training support vector machines with imbalanced datasets[ C]//Proc of International Joint Conference on Neural Networks. Barcelona: IEEE Press, 2010:1-8.
6郑恩辉,李平,宋执环.不平衡数据知识挖掘:类分布对支持向量机分类的影响[J].信息与控制,2005,34(6):703-708. 被引量：17
7THAI-NGHE N, GANTNER Z, SCHMIDT-THIEME L. Cost-sensitive learning methods for imbalanced data[ C]//Proc of International Joint Conference on Neural Networks. Barcelona: IEEE Press,2010: 1-8.

二级参考文献99

1张琦,吴斌,王柏.非平衡数据训练方法概述[J].计算机科学,2005,32(10):181-186. 被引量：10
2韩慧,王路,温明,王文渊.不均衡数据集学习中基于初分类的过抽样算法[J].计算机应用,2006,26(8):1894-1897. 被引量：11
3Subrahmanian V S. Computer science: Cultural modeling in real time. Science, 2007, 317(5844): 1509-1510.
4Subrahmanian V S, Albanese M, Martinez M V, Nau D, Reforgiato D, Simari G I, Sliva A, Wilkenfeld J, Udrea O. CARA: A cultural-reasoning architecture. IEEE Intelligent Systems, 2007, 22(2): 12-16.
5Khuller S, Martinez V, Nau D, Simari G, Sliva A, Subrahmanian V S. Finding most probable worlds of logic programs. In Proc. the First International Conference on Scalable Uncertainty Management, Washington DC, USA, October 10-12, 2007, pp.45-59.
6Martinez V, Simari G I, Sliva A, Subrahmanian V S. CONVEX: Context vectors as a paradigm for learning group behaviors based on similarity. IEEE Intelligent Systems, 2007, 23(4): 51-57.
7Wang F Y. Is culture computable? IEEE Intelligent Systems,2009, 24(2): 2-3.
8Wang F Y, Carley K M, Zeng D, Mao W. Social computing: From social informatics to social intelligence. IEEE Intelliqent Systems, 2007, 22(2): 79-83.
9Wang F Y. Toward a paradigm shift in social computing: The ACP approach. IEEE Intelligent Systems, 2007, 22(5): 65-67.
10Zeng D, Wang F Y, Carley K M. Social computing. IEEE Intelligent Systems, 2007, 22(5): 20-22.

共引文献54

1王金艳,冯建武,刘万里.一种不平衡支持向量机的校正方法[J].计算机应用,2007,27(12):2896-2898.
2刘万里,刘三阳,薛贞霞.一种分离超平面的确定方法[J].中北大学学报（自然科学版）,2007,28(6):546-551. 被引量：1
3高嘉伟,梁吉业.非平衡数据集分类问题研究进展[J].计算机科学,2008,35(4):10-13. 被引量：16
4刘万里,刘三阳,薛贞霞.不平衡支持向量机的平衡方法[J].模式识别与人工智能,2008,21(2):136-141. 被引量：15
5王金艳.不平衡数据的分离超平面偏置的调整方法[J].洛阳师范学院学报,2008,27(2):42-44.
6刘万里,刘三阳.SVM中不平衡数据的分离超平面的校正方法[J].计算机工程与应用,2008,44(19):169-171. 被引量：3
7刘万里,刘三阳,王金艳.不平衡支持向量机的调整方法[J].计算机科学,2009,36(3):148-149. 被引量：5
8祝晓燕,常宏飞,张金会.基于遗传算法的不均衡样本在支持向量机中的研究[J].机械工程师,2012(5):11-13.
9王中卿,李寿山,朱巧明,李培峰,周国栋.基于不平衡数据的中文情感分类[J].中文信息学报,2012,26(3):33-37. 被引量：11
10于化龙,高尚,赵靖,秦斌.基于过采样技术和随机森林的不平衡微阵列数据分类方法研究[J].计算机科学,2012,39(5):190-194. 被引量：9

同被引文献39

1肖智,王明恺,谢林林.基于支持向量机的大学生助学贷款个人信用评价[J].清华大学学报（自然科学版）,2006,46(z1):1120-1124. 被引量：20
2林舒杨,李翠华,江弋,林琛,邹权.不平衡数据的降采样方法研究[J].计算机研究与发展,2011,48(S3):47-53. 被引量：31
3蒋盛益,谢照青,余雯.基于代价敏感的朴素贝叶斯不平衡数据分类研究[J].计算机研究与发展,2011,48(S1):387-390. 被引量：21
4王卫群,朱晓民.变速器故障诊断中信号分析理论探讨——阶层跟踪分析与包络谱分析技术之比较[J].制造业自动化,2006,28(5):77-78. 被引量：7
5杨扬,李善平.基于实例重要性的SVM解不平衡数据分类[J].模式识别与人工智能,2009,22(6):913-918. 被引量：14
6向晖,杨胜刚.个人信用评分关键技术研究的新进展[J].财经理论与实践,2011,32(4):20-24. 被引量：22
7张立,孟相如,温祥西.基于自适应质心距投影HSVMs的网络故障识别[J].计算机应用研究,2011,28(11):4282-4284. 被引量：2
8张永,李卓然,刘小丹.基于主动学习SMOTE的非均衡数据分类[J].计算机应用与软件,2012,29(3):91-93. 被引量：23
9陶新民,郝思媛,张冬雪,徐鹏.不均衡数据分类算法的综述[J].重庆邮电大学学报（自然科学版）,2013,25(1):101-110. 被引量：66
10袁兴梅,杨明,杨杨.一种面向不平衡数据的结构化SVM集成分类器[J].模式识别与人工智能,2013,26(3):315-320. 被引量：22

引证文献6

1周晓锋,史海波,尚文利,高明山.面向不平衡样本集的变速器故障分类判别算法研究[J].小型微型计算机系统,2013,34(7):1708-1712.
2朱安安.基于过采样SVM的不平衡数据信用评价模型[J].软件导刊,2018,17(10):64-67. 被引量：7
3刘东启,陈志坚,徐银,李飞腾.面向不平衡数据分类的复合SVM算法研究[J].计算机应用研究,2018,35(4):1023-1027. 被引量：23
4徐玲玲,迟冬祥.面向不平衡数据集的机器学习分类策略[J].计算机工程与应用,2020,56(24):12-27. 被引量：60
5徐玲玲,迟冬祥(指导),黄彦乾,曹钧烨.不平衡数据分类的改进k-GSMOTE方法[J].上海电机学院学报,2022,25(2):88-94. 被引量：1
6李静,刘姜,倪枫,李笑语.HSMOTE-AdaBoost:改进混合边界重采样集成分类算法[J].智能计算机与应用,2023,13(7):7-14.

二级引证文献89

1姜作利.修改CIF术语能防止上当受骗吗?[J].对外经贸实务,2000(5):22-24.
2杨亭榆,傅成华.基于信息融合和CS-SVM的学生综合能力评估方法的研究[J].四川理工学院学报（自然科学版）,2018,31(1):41-46.
3朱安安.基于过采样SVM的不平衡数据信用评价模型[J].软件导刊,2018,17(10):64-67. 被引量：7
4温雪岩,赵丽影,徐克生,陆光.改进的MDSMOTE与FC-SVM在不平衡数据集分类中的应用[J].哈尔滨理工大学学报,2018,23(4):87-94. 被引量：1
5胡友呈,许洪斌,黄琳,刘洒,杨长辉.基于区域特征的成熟柑橘及枝叶的分割识别[J].现代制造工程,2019(5):70-76. 被引量：3
6魏建安,黄海松,康佩栋.针对不平衡数据的PSO-DEC-IFSVM分类算法[J].数据采集与处理,2019,34(4):723-735. 被引量：2
7彭勤,高士,彭佳红.基于SVM的豆类作物病害识别研究[J].电脑知识与技术,2019,15(8X):210-211. 被引量：3
8任佳丽,王文晶.基于差分孪生卷积神经网络的大规模不平衡数据分类算法[J].计算机应用与软件,2019,36(11):267-274. 被引量：5
9周国华,过林吉,殷新春.多任务学习的不平衡SVM+算法[J].计算机应用研究,2019,36(11):3348-3351. 被引量：1
10魏鑫,张雪英,李凤莲,胡风云,贾文辉,王超.面向非平衡数据集分类的改进模糊支持向量机[J].计算机工程与设计,2019,40(11):3124-3129. 被引量：9

1李忠伟,张健沛,杨静.基于支持向量机的增量学习算法研究[J].哈尔滨工程大学学报,2005,26(5):643-646. 被引量：10
2薛安荣,毛文渊,王孟頔,陈泉浈.基于贝叶斯方法和变化表的恐怖行为预测算法[J].计算机科学,2016,43(12):130-134. 被引量：8
3富宇,石金叶.基于语义的文本资源分类[J].计算机系统应用,2016,25(8):246-249. 被引量：1
4陈泽恩.基于k近邻和最小二乘支持向量机的Android恶意行为识别[J].吉林大学学报（理学版）,2015,53(4):720-724. 被引量：7
5武艺,文先华.利用ENVI软件处理遥感影像[J].科技信息,2011(16). 被引量：5
6石爱业,徐立中,杨先一,黄凤辰.基于知识和遥感图像的神经网络水质反演模型[J].中国图象图形学报,2006,11(4):521-528. 被引量：11
7欧阳柏成.网络大数据下的冗余数据分类优化算法研究[J].微电子学与计算机,2015,32(1):128-130. 被引量：2
8黄恩兴.遥感影像分类结果的不确定性研究[J].中国农学通报,2010,26(5):322-325. 被引量：7
9韩毅,周晏.基于SVM的Web文本分类[J].科技信息,2009(17):23-25. 被引量：2
10马江林,赵忠明,孟瑜,彭玲.海量遥感分类图连通域标记方法[J].计算机工程,2008,34(1):262-264. 被引量：8

计算机应用研究

2011年第8期

浏览历史

内容加载中请稍等...

改进的SVM解决背景知识数据中的类不平衡被引量：6

参考文献7

二级参考文献99

共引文献54

同被引文献39

引证文献6

二级引证文献89

相关作者

相关机构

相关主题

浏览历史

改进的SVM解决背景知识数据中的类不平衡 被引量：6

参考文献7

二级参考文献99

共引文献54

同被引文献39

引证文献6

二级引证文献89

相关作者

相关机构

相关主题

浏览历史

改进的SVM解决背景知识数据中的类不平衡被引量：6