针对大规模训练集的支持向量机的学习策略被引量：53

A Learning Strategy of SVM Used to Large Training Set

下载PDF

导出

摘要当训练集的规模很大特别是支持向量很多时 ,支持向量机的学习过程需要占用大量的内存 ,寻优速度非常缓慢 ,这给实际应用带来了很大的麻烦 .该文提出了一种针对大规模样本集的学习策略 :首先用一个小规模的样本集训练得到一个初始的分类器 ,然后用这个分类器对大规模训练集进行修剪 ,修剪后得到一个规模很小的约减集 ,再用这个约减集进行训练得到最终的分类器 .实验表明 ,采用这种学习策略不仅大幅降低了学习的代价 ,而且这样获得的分类器的分类精度完全可以与直接通过大规模样本集训练得到的分类器的分类精度相媲美 ,甚至更优 ,同时分类速度也得到大幅提高 . This paper proposes a learning strategy of SVM used to large training set. First authors train an initial classifier with a small training set, then prune the large training set with the initial classifier to obtain a small reduction set. Training with the reduction set, final classifier is obtained. Experiments show that the learning strategy not only reduces the cost greatly but also obtains a classifier that has the same accuracy as(even better than) the classifier obtained by training large set directly. In addition, speed of classification is greatly improved.

作者李红莲王春花袁保宗朱占辉

机构地区北京交通大学信息科学研究所北京三星通信技术研究所河北建设集团有限公司

出处《计算机学报》 EI CSCD 北大核心 2004年第5期715-719,共5页 Chinese Journal of Computers

基金国家自然科学重点基金 (697893 0 1) 国家"九七三"重点基础研究发展规划项目基金 (G19980 3 0 5 0 11)资助

关键词支持向量机学习策略大规模训练集分类器 support vector machines pruning large training set

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献9

1Hearst M.A., Dumais S.T., Osman E., Platt J., Scholkopf B.. Support vector machines. IEEE Intelligent Systems, 1998, 13(4): 18～28
2张学工.关于统计学习理论与支持向量机[J].自动化学报,2000,26(1):32-42. 被引量：2250
3Vapnik V.N.. An overview of statistical learning theory. IEEE Transactions on Neural Networks, 1999, 10(5): 988～999
4Vapnik V.N.. Statistical Learning Theory.2nd ed..New York: Springer-Verlag, 1999
5Müller Klaus-Robert, Mika Sebastian, Rtsch Gunnar, Tsuda Koji, Schlkopf Bernhard. An introduction to kernel-based learning algorithms. IEEE Transactions on Neural Networks, 2001, 12(2): 181～201
6Burges C.J.C.. A tutorial on support vector machines for pattern recognition. Data Mining and Knowledge Discovery, 1998, 2(2): 121～167
7Ke Hai-Xin,Zhang Xue -Gong.Editing support vector machines. In: Proceedings of the International Joint Conference on Neural Networks, Washington, DC, 2001, 2: 1464～1467
8张鸿宾,孙广煜.近邻法参考样本集的最优选择[J].电子学报,2000,28(11):16-21. 被引量：8
9李红莲,王春花,袁保宗.一种改进的支持向量机NN-SVM[J].计算机学报,2003,26(8):1015-1020. 被引量：71

二级参考文献10

1Hearst M A, Dumais S T, Osman E, Platt J, Scholkopf B.Support Vector Machines. IEEE Intelligent Systems, 1998, 13(4) : 18-28.
2Ke Hai-Xin,Zhang Xue-Gong. Editing support vector machines.In: Proceedings of International Joint Conference on Neural Networks, Washington, USA, 2001, 2:1464-1467.
3Vapnik V N. An overview of statistical learning theory. IEEE Transactions on Neural Networks, 1999, 10 (5): 988-999.
4Vapnik V N. Statistical Learning Theory. 2nd ed. New York:Springer-Verlag : 1999.
5Klaus-Robert Mailer, Sebastian Mika, Gunnar Raetsch, Koji Tsuda, and Bernhard Schoelkopf. An introduction to kernel-based learning algorithms. IEEE Transactions on Neural Networks, 2001, 12 (2): 181-201.
6Burges C J C. A tutorial on support vector machines for pattern recognition. Data Mining and Knowledge Discovery, 1998, 2(2): 121-167.
7Chang C L，IEEE Trans Computers，1974年，23卷，11期，1179页
8卢增祥,李衍达.交互支持向量机学习算法及其应用[J].清华大学学报（自然科学版）,1999,39(7):93-97. 被引量：40
9张学工.关于统计学习理论与支持向量机[J].自动化学报,2000,26(1):32-42. 被引量：2250
10张鸿宾,孙广煜.近邻法参考样本集的最优选择[J].电子学报,2000,28(11):16-21. 被引量：8

共引文献2317

1白岗岗,侯精明,史玉品,韩浩,郭凯华,李丙尧,付德宇.基于支持向量机的葫芦河流域径流变化的多因素贡献率分析[J].水土保持研究,2020,27(2):112-117. 被引量：2
2曾赟.第四种法学知识新形态——数据法学的研究定位[J].法制与社会发展,2023,29(1):41-59. 被引量：7
3乔丹,刘刚,杨执钧,钟韬,白雪.基于迁移学习的船舶目标识别[J].计算机应用研究,2020,37(S01):324-325. 被引量：1
4孟琮棠,赵银娣,向阳.基于卷积神经网络的遥感图像变化检测[J].现代测绘,2019,0(5):1-5. 被引量：3
5田海军,门洪,郎世伟.基于LS-SVM的电厂过热汽温仿真研究[J].微计算机信息,2007,23(10):270-272. 被引量：2
6张磊,夏士雄,牛强.基于SVM二叉决策树方法的矿井提升机故障诊断[J].微计算机信息,2008,24(10):198-199. 被引量：4
7瞿伟廉,谭冬梅.基于小波分析和支持向量机的结构损伤识别[J].武汉理工大学学报,2008,30(2):80-82. 被引量：3
8郑树剑,刘冀伟,何积铨,韩旭.基于支持向量机的混凝土结构中钢筋腐蚀的判别[J].电子器件,2007,30(5):1935-1938.
9殷彬,方思行.脾虚证诊断的数学模型[J].暨南大学学报（自然科学与医学版）,2006,27(3):363-367. 被引量：4
10王宇,丁萍,吴峻.基于SVM的光纤陀螺标度因数建模研究[J].舰船电子工程,2008,28(5):78-80. 被引量：1

同被引文献443

1李凤保,李凌.无线传感器网络技术综述[J].仪器仪表学报,2005,26(z2):559-561. 被引量：69
2李晨光,李亚敏,孟腊梅.基于遗传规划的树皮纹理图像识别[J].农机化研究,2012,34(2):185-188. 被引量：2
3冯登国,张阳,张玉清.信息安全风险评估综述[J].通信学报,2004,25(7):10-18. 被引量：307
4余世航,陈岱民.YAG激光焊接不锈钢薄板焊接工艺参数优化[J].长春大学学报,2013,23(2):134-138. 被引量：5
5李景彬,陈兵旗,邵鲁浩,田绪顺,坎杂.基于BP神经网络的脱绒棉种品种识别(英文)[J].农业工程学报,2012,28(S2):265-269. 被引量：10
6王小平,王大承.基于BP神经网络的20CrMo钢激光强化工艺参数优化控制[J].红外与激光工程,2004,33(3):269-273. 被引量：11
7刘向东,陈兆乾.一种快速支持向量机分类算法的研究[J].计算机研究与发展,2004,41(8):1327-1332. 被引量：13
8安金龙,王正欧.预抽取支持向量机的支持向量[J].计算机工程,2004,30(10):10-11. 被引量：10
9李德毅,刘常昱,杜鹢,韩旭.不确定性人工智能[J].软件学报,2004,15(11):1583-1594. 被引量：391
10尉询楷,陆波,汪诚,路建明,李应红.支持向量机在航空发动机故障诊断中的应用[J].航空动力学报,2004,19(6):844-848. 被引量：29

引证文献53

1胡正平.基于模糊K近邻决策的柔性SVM分类算法[J].仪器仪表学报,2005,26(z2):384-386. 被引量：2
2李学勇,高国红,孙甲霞.基于互信息和K-means聚类的信息安全风险评估[J].河南师范大学学报（自然科学版）,2011,39(2):152-155.
3郑春颖.一种改进的SVM算法[J].航空计算技术,2005,35(2):6-8. 被引量：5
4潘晨,闫相国,郑崇勋,杨勇.用于彩色图像分割的支持向量机的快速训练[J].模式识别与人工智能,2005,18(4):392-398. 被引量：5
5林杨,刘贵全,杨立身.异常检测中的改进SVM方法[J].信息安全与通信保密,2006,28(12):139-141.
6孟海涛,刘鹏.一种改进的SVM支持向量分类方法[J].现代电子技术,2007,30(1):150-152. 被引量：2
7刘鹏,孟海涛,陈笑蓉.一种提高SVM分类速度和泛化性的新方法[J].贵州大学学报（自然科学版）,2007,24(1):50-53. 被引量：1
8胡正平,张晔.结构风险最小化近邻分析解决大规模训练集支持向量机学习问题[J].信号处理,2007,23(2):161-164. 被引量：3
9方景龙,陈铄,潘志庚,梁荣华.复杂分类问题支持向量机的简化[J].电子学报,2007,35(5):858-861. 被引量：9
10林杨,刘贵全,杨立身.基于改进SVM方法的入侵检测[J].计算机工程,2007,33(14):151-153. 被引量：8

二级引证文献235

1李学勇,高国红,孙甲霞.基于互信息和K-means聚类的信息安全风险评估[J].河南师范大学学报（自然科学版）,2011,39(2):152-155.
2孟海涛,刘鹏.一种改进的SVM支持向量分类方法[J].现代电子技术,2007,30(1):150-152. 被引量：2
3刘鹏,孟海涛,陈笑蓉.一种提高SVM分类速度和泛化性的新方法[J].贵州大学学报（自然科学版）,2007,24(1):50-53. 被引量：1
4李鹏,王晓龙,刘远超,王宝勋.一种基于混合策略的失衡数据集分类方法[J].电子学报,2007,35(11):2161-2165. 被引量：16
5杨大全,王斓樾.利用服务器日志优化搜索引擎[J].沈阳工业大学学报,2008,30(1):94-97.
6郑全第,朱发顺,郑春颖.AdaBoost-SVMDT及其在HRRP识别中的应用[J].弹箭与制导学报,2008,28(3):305-308.
7黄文明,邓珍荣,计冬华.基于支持向量机的红细胞彩色图像分割算法[J].广西科学院学报,2008,24(4):287-290. 被引量：1
8黄建灯,陈庆全.基于支持向量机的红细胞彩色图像分割[J].计算机系统应用,2009,18(1):35-38. 被引量：4
9刘健,薛蒙.基于K最近邻决策的支持向量机分类算法及仿真[J].舰船电子工程,2009,29(3):88-91. 被引量：10
10周奇.对支持向量机几种常用核函数和参数选择的比较研究[J].福建电脑,2009,25(6):42-43. 被引量：8

1刘年义,魏跃进.SVM的快速分类及其算法[J].焦作师范高等专科学校学报,2009,25(4):75-77.
2薛贞霞,刘三阳,齐小刚.基于壳向量和中心向量的支持向量机[J].数据采集与处理,2009,24(3):328-334. 被引量：3
3徐启华,耿帅,师军.基于大规模训练集SVM的发动机故障诊断[J].航空动力学报,2011,26(12):2841-2848. 被引量：7
4郑春颖.一种改进的SVM算法[J].航空计算技术,2005,35(2):6-8. 被引量：5
5张友能,王德兵,汪伟.Parzen窗核密度估计的模式分类隐私保护方法[J].淮南师范学院学报,2014,16(5):93-96.
6原永滨,杨静,张健沛,于旭.Parzen窗核密度估计的大规模数据模式分类隐私保护方法[J].科技导报,2014,32(36):104-109. 被引量：1
7陈凤娟.基于支持向量机的分类预测算法研究[J].计算机与网络,2009,35(19):64-67. 被引量：1
8李恒锐,万杨亮,周继华.UCM算法及其在电子政务网页分类系统中的应用[J].计算机应用与软件,2013,30(1):213-215.
9徐启华,师军,耿帅.应用快速多分类SVM的航空发动机故障诊断方法[J].推进技术,2012,33(6):961-967. 被引量：18
10王宇,毛玉欣.一种基于卫向量的简化支持向量机模型[J].大连理工大学学报,2008,48(3):446-450. 被引量：1

计算机学报

2004年第5期

浏览历史

内容加载中请稍等...

针对大规模训练集的支持向量机的学习策略被引量：53

参考文献9

二级参考文献10

共引文献2317

同被引文献443

引证文献53

二级引证文献235

相关作者

相关机构

相关主题

浏览历史

针对大规模训练集的支持向量机的学习策略 被引量：53

参考文献9

二级参考文献10

共引文献2317

同被引文献443

引证文献53

二级引证文献235

相关作者

相关机构

相关主题

浏览历史

针对大规模训练集的支持向量机的学习策略被引量：53