基于PAC-Bayes边界理论的SVM模型选择方法被引量：2

Method of SVM model selection based on PAC-Bayes bound theory

下载PDF

导出

摘要 PAC-Bayes边界理论融合了贝叶斯定理和随机分类器的结构风险最小化原理,它作为一个理论框架,能有效评价机器学习算法的泛化性能。针对支持向量机(SVM)模型选择问题,通过分析PAC-Bayes边界理论框架及其在SVM上的应用,将PAC-Bayes边界理论与基于交叉验证的网格搜索法相结合,提出一种基于PAC-Bayes边界的SVM模型选择方法(PBB-GS),实现快速优选SVM的惩罚系数和核函数参数。UCI数据集的实验结果表明该方法优选出的参数能使SVM具有较高的泛化性能,并具有简便快速、参数选择准确的优点,能有效改善SVM模型选择问题。 PAC-Bayes risk bound integrating theories of Bayesian paradigm and structure risk minimization for stochastic classifiers has been considered as a framework for effective evaluating the generalization capability of machine learning algorithms. Aiming at the problem of model selection of SVM, this paper analyzes the theoretical framework of PAC-Bayes bound and its application to SVM, and combines the PAC-Bayes bound with grid search method based on cross validation.A method of model selection based on PAC-Bayes bound（PBB-GS）is put forward to select the best penalty parameter and kernel parameter rapidly. From the experimental results of the UCI datasets, it draws the conclusion that the parameters selected by PBB-GS can make SVM achieve better generalization performance, and this method is simple, fast and accurate, which can improve the model selection of SVM effectively.

作者汤莉赵政宫秀军

机构地区天津财经大学理工学院信息科学与技术系天津大学计算机科学与技术学院天津市认知计算与应用重点实验室

出处《计算机工程与应用》 CSCD 北大核心 2015年第6期27-32,共6页 Computer Engineering and Applications

基金国家自然科学基金(No.61170177) 国家重点基础研究发展规划(973)(No.2013CB32930X) 天津大学创新基金天津财经大学科研项目(No.Q1114)

关键词概率近似正确性学习(PAC)-贝叶斯边界支持向量机模型选择泛化性能 Probably Approximately Correct learning（PAC）-Bayes bound Support Vector Machine（SVM） model selection generalization capability

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献19

1Vapnik V.The nature of statistical learning theory[M].Berlin:Springer,2000.
2Valiant L.A theory of the learnable[J].Communications of the ACM,1984,27(11):1134-1142.
3Mcallester D A.Some PAC-Bayesian theorems[J].Machine Learning,1999,37(3):355-363.
4Langford J.Tutorial on practical prediction theory for classification[J].Journal of Machine Learning Research,2005,6:273-306.
5Seeger M.PAC-Bayesian generalisation error bounds for Gaussian process classification[J].Journal of Machine Learning Research,2003,3(2):233-269.
6Herbrich R,Graepel T.A PAC-Bayesian margin bound for linear classifiers[J].IEEE Transactions on Information Theory,2002,48(12):3140-3150.
7Ambroladze A,Parrado-Hern E,Shawe-Taylor J.Tighter PAC-Bayes bounds[C]//Advances in Neural Information Processing Systems 19.Cambridge:MIT Press,2007:9-16.
8Laviolette F,Marchand M.PAC-Bayes risk bounds for sample-compressed Gibbs classifiers[C]//Proc of the 22nd International Conference on Machine Learning.New York:ACM Press,2005:481-488.
9Laviolette F,Marchand M.PAC-Bayes risk bounds for stochastic averages and majority votes of sample-compressed classifiers[J].Journal of Machine Learning Research,2007,8:1461-1487.
10Seldin Y,Tishby N.PAC-Bayesian generalization bound for density estimation with application to co-clustering[C]//Proc of 12th International Conference on Artificial Intelligence and Statistics.Cambridge:MIT Press,2009:472-479.

同被引文献13

1王晓丹,郑春颖,吴崇明,张宏达.一种新的SVM对等增量学习算法[J].计算机应用,2006,26(10):2440-2443. 被引量：21
2韩京宇,徐立臻,董逸生.数据质量研究综述[J].计算机科学,2008,35(2):1-5. 被引量：102
3宗威,吴锋.大数据时代下数据质量的挑战[J].西安交通大学学报（社会科学版）,2013,33(5):38-43. 被引量：140
4杨栋枢,杨德胜.基于熵权和层次分析法的数据质量评估研究[J].现代电子技术,2013,36(22):39-42. 被引量：16
5严浩,裘杭萍,刁兴春,周星.基于改进层次分析的数据质量综合评估[J].计算机应用,2014,34(A01):287-290. 被引量：12
6周伟达,张莉,焦李成.支撑矢量机推广能力分析[J].电子学报,2001,29(5):590-594. 被引量：56
7萧嵘,王继成,孙正兴,张福炎.一种SVM增量学习算法α-ISVM[J].软件学报,2001,12(12):1818-1824. 被引量：85
8韩京宇,陈可佳.基于模拟退火的在线Web文档内容数据质量评估[J].计算机应用,2014,34(8):2311-2316. 被引量：1
9韩京宇,陈可佳.基于事实抽取的Web文档内容数据质量评估[J].计算机科学,2014,41(11):247-251. 被引量：5
10汤莉,宫秀军,何丽.PAC-Bayes理论及应用研究综述[J].计算机科学与探索,2015,9(1):1-13. 被引量：3

引证文献2

1汤莉,何丽.基于PAC-Bayes理论的Web文档数据质量评估方法[J].计算机工程与科学,2017,39(3):572-579. 被引量：2
2何丽,韩克平,刘颖.自适应的SVM增量算法[J].计算机科学与探索,2019,13(4):647-656. 被引量：6

二级引证文献8

1史振杰,董兆伟,孙立辉,武晓婧.基于灰狼算法SVR的烧结矿FeO含量预测[J].河北省科学院学报,2019,36(4):1-6. 被引量：9
2孙晓虎,李洪均.语音情感识别综述[J].计算机工程与应用,2020,56(11):1-9. 被引量：15
3周艳红.基于大数据的数据质量评估方法研究[J].现代信息科技,2020,4(8):86-89. 被引量：2
4刘伟.基于Storm 的XLPE电力电缆在线实时诊断方法研究[J].中国设备工程,2020(18):115-116. 被引量：1
5曹杰,顾斌杰,熊伟丽,潘丰.增量式约简最小二乘孪生支持向量回归机[J].计算机科学与探索,2021,15(3):553-563. 被引量：6
6葛从兵,严吉皞,陈剑.水库安全管理文档质量评估系统设计与实现[J].软件导刊,2022,21(5):130-134. 被引量：1
7李昊,王士同.VC维期望上界最小化的最小二乘支持向量机[J].计算机科学与探索,2023,17(7):1599-1608.
8袁天霖,田斌,朱刚,刘佳杰,周龙伟.基于数据挖掘与预警的电气设备运输状态识别技术研究[J].电子设计工程,2024,32(7):144-148.

1郭华平,袁俊红,张帆,邬长安,范明.一种新的组合分类器学习方法[J].计算机科学,2014,41(7):283-289. 被引量：2
2陈绍炜,柳光峰,冶帅.基于核极限学习机的模拟电路故障诊断研究[J].西北工业大学学报,2015,33(2):290-294. 被引量：17
3程琨.电信级以太网技术分析[J].科技风,2014(12):34-34.
4齐玉斌.对硬盘PBB表进行修复的探讨[J].微型机与应用,1996,15(9):45-46.
5朱祥乐,陆继森.电信级以太网应用浅析[J].电信快报（网络与通信）,2009(12):23-26.
6梁涛年,陈建军,赵斌,王蕊照.区间参数分数阶时滞系统鲁棒稳定域[J].电子科技大学学报,2013,42(6):944-950.
7王忠民,曹栋.基于蚁群算法的行为识别特征优选方法[J].西安邮电大学学报,2014,19(1):73-77. 被引量：21
8李洁,吴正茂.电信级以太网中PBT技术与应用研究[J].网络电信,2008,10(10):63-65.
9马剑峨,李晖.电信级以太网现状及未来发展趋势[J].现代电信科技,2009,39(9):8-13.
10颜会娟,秦杰.基于非线性SVM模型的木马检测方法[J].计算机工程,2011,37(8):121-123. 被引量：5

计算机工程与应用

2015年第6期

浏览历史

内容加载中请稍等...

基于PAC-Bayes边界理论的SVM模型选择方法被引量：2

参考文献19

同被引文献13

引证文献2

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

基于PAC-Bayes边界理论的SVM模型选择方法 被引量：2

参考文献19

同被引文献13

引证文献2

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

基于PAC-Bayes边界理论的SVM模型选择方法被引量：2