期刊文献+

基于边界样本选择的支持向量机加速算法 被引量:5

SVM accelerated training algorithm based on border sample selection
下载PDF
导出
摘要 针对支持向量机(Support Vector Machine,SVM)处理大规模数据集的学习时间长、泛化能力下降等问题,提出基于边界样本选择的支持向量机加速算法。首先,进行无监督的K均值聚类;然后,在各个聚簇内依照簇的混合度、支持度因素应用K近邻算法剔除非边界样本,获得最终的类别边界区域样本,参与SVM模型训练。在标准数据集上的实验结果表明,算法在保持传统支持向量机的分类泛化能力的同时,显著降低了模型训练时间。 Support Vector Machine(SVM)is a powerful instrument for solving pattern classification problem,but it is notsuitable for large-scale data,due to the drawbacks of slow training speed,large computational cost and low generalization.An accurate support vector machine algorithm is proposed,which uses training samples lying close to the separationboundary.First of all,K-means clustering is performed to the initial training data,and then the boundary samples are selectedin each cluster by K-nearest neighbor algorithm,two cluster factors,the degree of mixing and support,are definedto determine the boundary width.These boundary samples are then used in the training of the SVM classifier.The experimentson some benchmark datasets show that the proposed method not only makes computational complexities decreased,but also makes classification power of traditional SVM invariant.
作者 胡小生 钟勇 HU Xiaosheng;ZHONG Yong(College of Electronic and Information Engineering, Foshan University, Foshan, Guangdong 528000, China)
出处 《计算机工程与应用》 CSCD 北大核心 2017年第3期169-173,共5页 Computer Engineering and Applications
基金 2014年国家星火计划项目(No.2014GA780031) 广东省自然科学基金(No.2015A030313638) 广东高校优秀青年创新人才培养计划资助项目(No.2013LYM_0097 No.2014KQNCX184) 佛山科学技术学院校级科研项目
关键词 支持向量机 大规模分类 边界样本 聚类 Support Vector Machine(SVM) large-scale classification boundary samples clustering
  • 相关文献

参考文献7

二级参考文献89

共引文献34

同被引文献26

引证文献5

二级引证文献14

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部