适于大规模数据集的块增量学习算法：BISVM 被引量：3

BISVM:block-based incremental training algorithm of SVM for very large dataset

下载PDF

导出

摘要对支持向量机的大规模训练问题进行了深入研究,提出一种类似SMO的块增量算法。该算法利用increase和decrease两个过程依次对每个输入数据块进行学习,避免了传统支持向量机学习算法在大规模数据集情况下急剧增大的计算开销。理论分析表明新算法能够收敛到近似最优解。基于KDD数据集的实验结果表明,该算法能够获得接近线性的训练速率,且泛化性能和支持向量数目与LIBSVM方法的结果接近。 This paper made a deep study on the training problems of SVM on very large data set, proposed a novel block-based incremental algorithm for solving the problem, namely BISVM, which worked like SMO. The new algorithm utilizes the increase and the decrease procedures to learn inputting data blocks one by one so that the rapidly-increased computation costs for large datasets could be avoided. Theoretical analyses show that BISVM converges to the solution of support vector machines. Experimental results on KDD dataset indicate that training time of BISVM is approximate liner to the scale of problem, while receives the comparable generalization performance as that of LIBSVM.

作者王磊孙世新李杰杨浩淼

机构地区电子科技大学计算机科学与工程学院电子科技大学电子工程学院

出处《计算机应用研究》 CSCD 北大核心 2008年第1期98-100,113,共4页 Application Research of Computers

基金四川省青年软件创新基金资助项目(2005AA0827)

关键词支持向量机块增量算法大规模训练 support vector machines（SVM） block-based incremental algorithm large-scale training

分类号 TP18 [自动化与计算机技术—控制理论与控制工程] TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献8

1Vapnik V N 张学工.统计学习理论的本质[M].北京:清华大学出版社,2000..
2PLATT J C.Fast training of support vector machines using sequential minimal optimization[C]//SCHOLKOPF B,BURGES C,SMOLA A.Advances in kernel methods:support vector machines.Cambridge:MIT Press,1998.
3CAO L J,KEERTHI S S,ONG C J,et al.Parallel sequential minimal optimization for the training of support vector machines[J].IEEE Trans on Neural Network,2006,17(4):1039-1049.
4KEERTHI S S,SHEVADE S K,BHATTACHARYYA C,et al.Im-provements to Platt's SMO algorithm for SVM classifyier design[J].Neural Computation,2001,13(3):637-649.
5LIN C J.Asymptotic convergence of an SMO algorithm without any assumptions[J].IEEE Trans on Neural Networks,2002,13(1):248-250.
6KEERTHI S S,GILBERT E G.Convergence of a generalized SMO algorithm for SVM classifier design[J].Machine Learning,2002,46(1/3):351-360.
7KDD cup 1999 data[EB/OL].(1999).http://kdd.ics.uci.edu/databases/ kddcup99/kddcup99.html UTH.
8TSANG I W,KWOK J T,CHEUNG P M.Core vector machines:fast SVM training on very large data sets[J].Journal of Machine Learning Research,2005,6:363-392.

共引文献173

1黄文强.基于支持向量机的航空旅客NOSHOW预测模型[J].计算机工程,2005,31(B07):52-53. 被引量：5
2李东晖,杜树新,吴铁军.基于壳向量的线性支持向量机快速增量学习算法[J].浙江大学学报（工学版）,2006,40(2):202-206. 被引量：16
3琚旭,王浩,姚宏亮.基于同心超球面分割的支持向量预抽取方法[J].计算机工程与应用,2006,42(31):55-56. 被引量：3
4白裔峰,肖建,于龙,黄景春.基于结构风险最小化的加权偏最小二乘法[J].计算机应用,2007,27(4):939-941. 被引量：4
5渐令,龚淑华,王义康.基于支持向量机的高炉铁水硅含量多类别分类[J].浙江大学学报（理学版）,2007,34(3):282-285. 被引量：3
6王强,陈英武,邢立宁.特征选择和支持向量回归参数的联合优化[J].计算机工程与应用,2007,43(14):52-55.
7胡静,王辉,徐小红,高隽.基于同类样本覆盖的BP网络结构设计准则研究[J].系统工程与电子技术,2007,29(4):605-608. 被引量：1
8张杰,滕奇志,王正勇.基于支持向量机的岩石薄片图像分割[J].成都信息工程学院学报,2007,22(2):186-189. 被引量：8
9魏维,李千目,刘凤玉,许满武.视频语义分析两级多模式融合算法[J].中国图象图形学报,2007,12(5):893-898. 被引量：1
10刘胜,李妍妍.自适应GA-SVM参数选择算法研究[J].哈尔滨工程大学学报,2007,28(4):398-402. 被引量：46

同被引文献14

1喻彩丽,吴作伦.三维坐标测量机测量齿轮齿形误差的研究[J].浙江科技学院学报,2001,13(2):5-9. 被引量：1
2钟清流,蔡自兴.基于一类支持向量机的传感器故障诊断[J].计算机工程与应用,2006,42(19):1-3. 被引量：4
3王建华,劳奇成.极坐标法测量渐开线齿形的数据处理与精度分析[J].西安工业学院学报,1996,16(3):189-192. 被引量：9
4王立鼎,娄志峰,王晓东,马勇,张玉玲.超精密渐开线齿形的测量方法[J].光学精密工程,2006,14(6):980-985. 被引量：27
5董新蕊,李剑锋,吴鸿雁,王兆福.凸轮激波滚动活齿传动中心内齿轮齿形分析及仿真[J].机械科学与技术,2007,26(5):537-541. 被引量：3
6KDD99Cupdataset. http://kdd.ics.uci.edu/databases/kddcup99/kddcup99.html . 2010
7Joachims T.Text categorization with support vector machines: Learning with many relevant features. Proceedings of the 10th European Conference on Machine Learning . 1998
8胡良谋,曹克强,徐浩军.基于回归型支持向量机的液压舵机故障诊断[J].系统仿真学报,2007,19(23):5509-5512. 被引量：18
9张兆龙,曾勇,李筱林,肖捷.极坐标法测量渐开线齿形的分析[J].工具技术,1997,31(7):34-37. 被引量：12
10王向阳,于雁春.基于改进K-均值聚类的快速分形图像编码算法[J].计算机科学,2008,35(2):219-222. 被引量：10

引证文献3

1王朝峰,魏修亭,林江海,杜强.基于万能式齿轮测量机的齿形误差求解算法研究[J].机械科学与技术,2009,28(11):1501-1504.
2牟琦,毕孝儒,龚尚福,厍向阳.基于中间分类超平面的SVM入侵检测[J].计算机工程,2011,37(16):117-119. 被引量：3
3Yongqi CHEN,Qijun CHEN.Interval analysis using least squares support vector fuzzy regression[J].控制理论与应用（英文版）,2012,10(4):458-464.

二级引证文献3

1牟琦,陈艺坤,毕孝儒,厍向阳.一种基于快速增量SVM的入侵检测方法[J].计算机工程,2012,38(12):92-94. 被引量：7
2唐朝伟,李超群,燕凯,严鸣.基于LISOMAP的相关向量机入侵检测模型[J].计算机应用,2012,32(9):2606-2608. 被引量：4
3张丽虹.经济普查数据的分析与挖掘[J].现代商贸工业,2015,36(27):229-231.

1田建忠,王威,谢梅芳.基于粒子群算法的支持向量机训练和实现方法[J].武汉理工大学学报（信息与管理工程版）,2007,29(10):85-88. 被引量：6
2陈志平,丁大伟.OCSVM集成模型解决支持向量机的大规模训练问题[J].电脑知识与技术（过刊）,2009,15(1X):450-451.
3崔和,龙玉峰.支持向量机学习算法的研究现状与展望[J].信息与电子工程,2008,6(5):328-332. 被引量：8
4丁蕾,陶亮.改进的用于回归估计的支持向量机学习算法[J].计算机工程与应用,2005,41(19):44-46. 被引量：11
5权光日,洪炳熔,李维刚.基于规则学习的前馈神经网络[J].哈尔滨工业大学学报,1998,30(4):57-61. 被引量：1
6周水生,郑颖,穆新亮.基于Cholesky分解的K2DPCA人脸识别研究[J].系统工程理论与实践,2016,36(2):528-535. 被引量：9
7熊凌,赵明旺.BP算法用于系统辨识的研究[J].武汉科技大学学报,2001,24(2):183-185. 被引量：1
8杜林钰.支持向量机学习算法若干问题的研究[J].网友世界,2014,0(19):153-153.
9柳燕煌,黄立勤.云计算环境的并行支持向量机[J].南阳理工学院学报,2011,3(2):26-29. 被引量：4
10司文杰,杨飞飞.基于大规模训练神经网络的微小故障在线检测[J].计算机科学,2017,44(2):239-243. 被引量：2

计算机应用研究

2008年第1期

浏览历史

内容加载中请稍等...