随机傅里叶特征空间中高斯核支持向量机模型选择被引量：10

Model Selection for Gaussian Kernel Support Vector Machines in Random Fourier Feature Space

下载PDF

导出

摘要模型选择是支持向量机(support vector machines,SVMs)学习的关键问题.标准支持向量机学习本质上是求解一个凸二次优化问题,求解的时间复杂度为数据规模的立方级,而经典的模型选择方法往往需要多次训练支持向量机,这种模型选择方法对于中等规模的支持向量机学习计算代价已较高,更难以扩展到大规模支持向量机学习.基于高斯核函数的随机傅里叶特征近似,提出一种新的、高效的核支持向量机模型选择方法.首先,利用随机傅里叶特征映射,将无限维隐式特征空间嵌入到一个相对低维的显式随机特征空间,并推导在2个不同的特征空间中分别训练支持向量机所得到的模型的误差上界;然后,以模型误差上界为理论保证,提出随机特征空间中核支持向量机的模型选择方法,应用随机特征空间中的线性支持向量机来逼近核支持向量机,计算模型选择准则的近似值,从而评价所对应的核支持向量机的相对优劣;最后,在标杆数据集上验证所提出方法的可行性和高效性.实验结果表明,所提出的模型选择方法与标准交叉验证方法的测试精度基本相当,但可显著地提高核支持向量机模型选择效率. Model selection is very critical to support vector machines （SVMs）. Standard SVMs typically suffer from cubic time complexity in data size since they solve the convex quadratic programming problems. However, it usually needs to train hundreds/thousands of SVMs for model selection, which is prohibitively time-consuming for medium-scale datasets and very difficult to scale up to large-sca kernel, a nove e problems. In this paper, and efficient approach to random Fourier feature mapping is used to explicit random feature space. An error bo by using random Fourier features to approximate Gaussian model selection of kernel SVMs is proposed. Firstly, the embed the infinite-dimensional implicit feature space into an und between the accurate model obtained by training kernel SVM and the approximate one returned by the linear SVM in the random feature space is derived. Then, in the random feature space, a model selection approach to kernel SVM is presented. Under the guarantee of the model error upper bound, by applying the linear SVMs in the random feature space to approximate the corresponding kernel SVMs, the approximate model selection criterion can be efficiently calculated and used to assess the relative goodness of the corresponding kernel SVMs. Finally, comparison experiments on benchmark datasets for cross validation model selection show the proposed approach can significantly improve the efficiency of model selection for kernel SVMs while guaranteeing test accuracy.

作者冯昌廖士中

机构地区天津大学计算机科学与技术学院

出处《计算机研究与发展》 EI CSCD 北大核心 2016年第9期1971-1978,共8页 Journal of Computer Research and Development

基金国家自然科学基金项目(61170019)~~

关键词模型选择支持向量机随机傅里叶特征高斯核交叉验证 model selection support vector machines （SVMs） random Fourier features Gaussiankernel cross validation

分类号 TP181 [自动化与计算机技术—控制理论与控制工程] TP301 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献25

1Vapnik V N. Statistical I.earning Theory [M]. New York: John Wiley I Sons, 1998.
2Sch61kopf B, Smola A J. Learning with Kernels: Support Vector Machines, Regularization, Optimization,and Beyond [M]. Cambridge, MA: MIT Press, 2002.
3Chapelle O, Vapnik V. Model selection for support vector machines [C] //Advances in Neural In{ormation Processing Systems 12. Cambridge, MA: MIT Press, 2000:230-236.
4Guyon I, Saffari A, Dror G, et al. Model selection: Beyond the Bayesian/frequentist divide [J]. Journal o{ Machine Learning Research, 2010, 11:61-87.
5Duan K, Keerthi S S, Poo A N. Evaluation of simple performance measures for tuning SVM hyperparameters [J]. Neurocomputing, 2003, 51:41-59.
6Chapelle O, Vapnik V N, Bousquet O, et ai. Choosing multiple parameters for support vector machines [J]. Machine Learning, 2002, 46(1/2/3): 131-159.
7Vapnik V N, Chapelle O. Bounds on error expectation for support vector machines [J]. Neural Computation, 2000, 12 (9) : 2013-2036.
8Platt J C. Fast Training of support vector machines using sequential minimal optimization [C] //Advances in Kernel Methods: Support Vector Learning. Cambridge, MA: MIT Press, 1999:185-208.
9Zhang T. Solving large scale linear prediction problems using stochastic gradient descent algorithms [C] //Proc of the 21st Int Conf on Machine I.earning. New York: ACM, 2004: 919-926.
10Joachims T. Training linear SVMs in linear time [C] //Proc of the 12th ACM SIGKDD Int Conf on Knowledge Discovery and Data Mining. New York: ACM, 2006:217-226.

二级参考文献44

1Vapnik V. The Nature of Statistical Learning Theory [M]. Berlin: Springer, 2000.
2Guyon I, Saffari A, Dror G. Model selection: Beyond the Bayesian/frequent divide[J]. Journal of Machine Learning Research, 2010, 11: 61-87.
3Duan K, Keerthi S, Poo A. Evaluation of simple performance measures for tuning SVM hyperparameters [J]. Neurocomputing, 2003, 51: 41-59.
4Huang C, Wang C. A GA-hased feature selection and parameters optimization for support vector machines [J]. Expert Systems with Applications, 2006, 31(2):231-240.
5Friedrichs F, Igel C. Evolutionary tuning of multiple SVM parameters [J]. Neuroeomputing, 2005, 64:107-117.
6Vapnik V, Chapelle O. Bounds on error expectation for support vector machines [J]. Neural Computation, 2000, 12 (9) : 2013-2036.
7Chapelle O, Vapnik V, Bousquet O. Choosing multiple parameters for support vector machines [J]. Machine Learning, 2002, 46(1): 131-159.
8Xu Z, Dai M, Meng D. Fast and effcient strategies for model selection of Gaussian support vector machine [J]. IEEE Trans on Systems, Man, and Cybernetics, Part B: Cybernetics, 2009, 39(5) : 1292-1307.
9Jia Lei, Liao Shizhong, Ding Lizhong. Learning with uncertain kernel matrix set[J]. Journal of Computer Seienee and Technology, 2010, 25(4): 709-727.
10Papadimitriou C, Raghavan P, Tamaki H. Latent semantic indexing: A probabilistic analysis [J]. Journal of Computer and System Sciences, 2000, 61(2): 217-235.

共引文献13

1王川,毛文涛,张俊娜,赵金伟.基于黎曼度量的最小二乘支持向量机模型选择[J].河南师范大学学报（自然科学版）,2013,41(3):147-151.
2王梅,廖士中.正则化路径上三步式SVM贝叶斯组合[J].计算机研究与发展,2013,50(9):1855-1864. 被引量：1
3廖士中,王梅,赵志辉.正定矩阵支持向量机正则化路径算法[J].计算机研究与发展,2013,50(11):2253-2261. 被引量：7
4刘勇,江沙里,廖士中.基于近似高斯核显式描述的大规模SVM求解[J].计算机研究与发展,2014,51(10):2171-2177. 被引量：5
5王梅,曾昭虎,孙莺萁,杨二龙,宋考平.基于输入K-近邻的正则化路径上SVR贝叶斯组合[J].山东大学学报（工学版）,2016,46(6):8-14.
6韩志卓,廖士中.高斯核选择的线性性质检测方法[J].模式识别与人工智能,2017,30(9):815-821.
7王梅,王莎莎,孙莺萁,宋考平,田枫,廖士中.SVRRP_(MCC):一种支持向量回归机的正则化路径近似算法[J].计算机科学,2017,44(12):42-47. 被引量：1
8冯昌,廖士中.大规模核方法的随机假设空间方法[J].计算机科学与探索,2018,12(5):785-793. 被引量：6
9张闯,廖士中.并行效率敏感的大规模SVM数据分块数选择[J].数据采集与处理,2018,33(6):1068-1076. 被引量：1
10王梅,李董,薛成龙.基于CUR矩阵分解的多核学习正则化路径近似算法[J].数据采集与处理,2020,35(3):381-391. 被引量：1

同被引文献16

1段丹青,陈松乔,杨卫平,王加阳.使用粗糙集和支持向量机检测入侵[J].小型微型计算机系统,2008,29(4):627-630. 被引量：15
2李权,周兴社.基于KPCA的多变量时间序列数据异常检测方法研究[J].计算机测量与控制,2011,19(4):822-825. 被引量：14
3丁立中,廖士中.基于正则化路径的支持向量机近似模型选择[J].计算机研究与发展,2012,49(6):1248-1255. 被引量：10
4丁立中,贾磊,廖士中.支持向量学习的多参数同时调节[J].软件学报,2014,25(9):2149-2159. 被引量：1
5谢娟英,谢维信.基于特征子集区分度与支持向量机的特征选择算法[J].计算机学报,2014,37(8):1704-1718. 被引量：64
6刘勇,江沙里,廖士中.基于近似高斯核显式描述的大规模SVM求解[J].计算机研究与发展,2014,51(10):2171-2177. 被引量：5
7冯凯,卢建刚,陈金水.基于最小二乘支持向量机的MIMO线性参数变化模型辨识及预测控制[J].化工学报,2015,66(1):197-205. 被引量：8
8王鲜芳,王岁花,杜昊泽,王平.基于模糊粗糙集和支持向量机的化工过程故障诊断[J].控制与决策,2015,30(2):353-356. 被引量：24
9黄华娟,丁世飞,史忠植.光滑CHKS孪生支持向量回归机[J].计算机研究与发展,2015,52(3):561-568. 被引量：4
10李涛,刘学臣,张帅,王恺,杨愚鲁.基于混合编程模型的支持向量机训练并行化[J].计算机研究与发展,2015,52(5):1098-1108. 被引量：2

引证文献10

1高世伟,赵力.一种基于支持向量机的软测量建模方法[J].自动化仪表,2017,38(7):42-45. 被引量：5
2郝伟,刘忠宝.基于最大散度差的保序分类算法[J].西安石油大学学报（自然科学版）,2017,32(4):123-126.
3韩志卓,廖士中.高斯核选择的线性性质检测方法[J].模式识别与人工智能,2017,30(9):815-821.
4冯昌,廖士中.大规模核方法的随机假设空间方法[J].计算机科学与探索,2018,12(5):785-793. 被引量：6
5张闯,廖士中.并行效率敏感的大规模SVM数据分块数选择[J].数据采集与处理,2018,33(6):1068-1076. 被引量：1
6张骁,廖士中.基于局部后悔的在线核选择[J].计算机学报,2019,42(1):61-72. 被引量：1
7黄华娟,韦修喜.基于自适应调节极大熵的孪生支持向量回归机[J].南京大学学报（自然科学版）,2019,55(6):1030-1039. 被引量：2
8黄华娟,韦修喜,周永权.基于模糊核聚类粒化的粒度支持向量机[J].智能系统学报,2019,14(6):1271-1277. 被引量：2
9廖芸,张骁,廖士中.统一框架下在线核选择的竞争性分析[J].计算机科学与探索,2020,14(7):1126-1132.
10武玉坤,李伟,陈沅涛.卷积自编码器融合核近似技术的异常检测模型[J].计算机测量与控制,2022,30(3):259-265.

二级引证文献17

1王捷.关于裂谷盆地油气勘探的思考[J].勘探家（石油与天然气）,2000,5(1):64-67. 被引量：2
2黄裕.基于多视角缺失补全算法的数据挖掘研究[J].计算技术与自动化,2018,37(2):67-72. 被引量：1
3赵征,袁洪,宋选锋.基于MI-LSSVM的NO_x生成量动态软测量模型[J].自动化仪表,2018,39(12):31-34. 被引量：7
4丁尚文,王纯贤.基于支持向量机的酗酒脑电信号分类研究[J].自动化仪表,2019,40(11):95-98.
5朱湘临,顾雯炜,王博.基于贝叶斯推断的多层软测量建模在丁醇发酵中的应用[J].软件导刊,2020,19(4):183-188.
6廖芸,张骁,廖士中.统一框架下在线核选择的竞争性分析[J].计算机科学与探索,2020,14(7):1126-1132.
7沈浩,王士同.基于多核学习的风格正则化最小二乘支持向量机[J].计算机科学与探索,2020,14(9):1532-1544. 被引量：1
8陶灵平,苏守正,朱守金,杨波.光纤多方量子通信信道参数自适应调整方法[J].兰州工业学院学报,2020,27(5):47-51. 被引量：1
9马毓敏,王士同.最大化AUC的正例未标注分类及其增量算法[J].计算机科学与探索,2020,14(11):1879-1887. 被引量：1
10顾俊发,许明阳,马方圆,林治宇,纪成,王璟德,孙巍.基于MIC的支持向量回归及其在化工过程中的应用[J].化工学报,2021,72(3):1480-1486. 被引量：6

1崔向东,崔婧楠.基于卷积神经网络的部分遮挡人脸表情识别[J].常州信息职业技术学院学报,2017,16(1):12-14. 被引量：3
2王良民,张建明,詹永照,宋顺林.人脸检测研究现状和发展[J].江苏大学学报（自然科学版）,2003,24(3):75-79. 被引量：13
3钱震.多媒体教学系统检测方法与标准的制订[J].甘肃科技纵横,2009,38(1):30-31.
4王蕾.浅谈高职院校信息技术课程教学[J].黑龙江科技信息,2009(28):163-163. 被引量：1
5杨聪,王文永,蔡宏亮,张拓.基于手机浏览器开放平台的移动学习研究[J].中国信息技术教育,2011(13):111-113. 被引量：1
6卢官明,何嘉利,闫静杰,李海波.一种用于人脸表情识别的卷积神经网络[J].南京邮电大学学报（自然科学版）,2016,36(1):16-22. 被引量：49
7徐少平,刘小平,李春泉,胡凌燕,杨晓辉.基于区域特征分析的快速FCM图像分割改进算法[J].模式识别与人工智能,2012,25(6):987-995. 被引量：18
8毕晓君,李博.基于单目标拟合度的高维多目标可视化[J].吉林大学学报（工学版）,2013,43(6):1658-1665.
9冯昌,李子达,廖士中.一种大规模支持向量机的高效求解算法[J].计算机科学,2015,42(9):195-198. 被引量：1
10马安香,张长胜,张斌,张晓红.基于深度置信网络的云应用负载预测方法[J].东北大学学报（自然科学版）,2017,38(2):209-213. 被引量：2

计算机研究与发展

2016年第9期

浏览历史

内容加载中请稍等...

随机傅里叶特征空间中高斯核支持向量机模型选择被引量：10

参考文献25

二级参考文献44

共引文献13

同被引文献16

引证文献10

二级引证文献17

相关作者

相关机构

相关主题

浏览历史

随机傅里叶特征空间中高斯核支持向量机模型选择 被引量：10

参考文献25

二级参考文献44

共引文献13

同被引文献16

引证文献10

二级引证文献17

相关作者

相关机构

相关主题

浏览历史

随机傅里叶特征空间中高斯核支持向量机模型选择被引量：10