基于边界样本选择的支持向量机加速算法被引量：5

SVM accelerated training algorithm based on border sample selection

下载PDF

导出

摘要针对支持向量机(Support Vector Machine,SVM)处理大规模数据集的学习时间长、泛化能力下降等问题,提出基于边界样本选择的支持向量机加速算法。首先,进行无监督的K均值聚类;然后,在各个聚簇内依照簇的混合度、支持度因素应用K近邻算法剔除非边界样本,获得最终的类别边界区域样本,参与SVM模型训练。在标准数据集上的实验结果表明,算法在保持传统支持向量机的分类泛化能力的同时,显著降低了模型训练时间。 Support Vector Machine(SVM)is a powerful instrument for solving pattern classification problem,but it is notsuitable for large-scale data,due to the drawbacks of slow training speed,large computational cost and low generalization.An accurate support vector machine algorithm is proposed,which uses training samples lying close to the separationboundary.First of all,K-means clustering is performed to the initial training data,and then the boundary samples are selectedin each cluster by K-nearest neighbor algorithm,two cluster factors,the degree of mixing and support,are definedto determine the boundary width.These boundary samples are then used in the training of the SVM classifier.The experimentson some benchmark datasets show that the proposed method not only makes computational complexities decreased,but also makes classification power of traditional SVM invariant.

作者胡小生钟勇 HU Xiaosheng;ZHONG Yong(College of Electronic and Information Engineering, Foshan University, Foshan, Guangdong 528000, China)

机构地区佛山科学技术学院电子与信息工程学院

出处《计算机工程与应用》 CSCD 北大核心 2017年第3期169-173,共5页 Computer Engineering and Applications

基金 2014年国家星火计划项目(No.2014GA780031) 广东省自然科学基金(No.2015A030313638) 广东高校优秀青年创新人才培养计划资助项目(No.2013LYM_0097 No.2014KQNCX184) 佛山科学技术学院校级科研项目

关键词支持向量机大规模分类边界样本聚类 Support Vector Machine(SVM) large-scale classification boundary samples clustering

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献7

1王宪亮,吴志刚,杨金超,周若华,颜永红.基于SVM一对一分类的语种识别方法[J].清华大学学报（自然科学版）,2013,53(6):808-812. 被引量：10
2李琳,伍少梅,唐宁九.基于中心加权的局部核向量机算法[J].电子科技大学学报,2014,43(4):612-617. 被引量：2
3朱方,顾军华,杨欣伟,杨瑞霞.一种新的支持向量机大规模训练样本集缩减策略[J].计算机应用,2009,29(10):2736-2740. 被引量：11
4包文颖,胡清华,王长忠.基于多粒度数据压缩的支持向量机[J].南京大学学报（自然科学版）,2013,49(5):637-643. 被引量：6
5韩德强,韩崇昭,杨艺.基于k-最近邻的支持向量预选取方法[J].控制与决策,2009,24(4):494-498. 被引量：11
6张斌,唐朝晖,朱红求,桂卫华.一种新型的支持向量机约简方法及其应用[J].系统仿真学报,2012,24(2):344-347. 被引量：2
7张宇,王文剑,郭虎升.基于粒分布的支持向量机加速训练方法[J].南京大学学报（自然科学版）,2013,49(5):644-649. 被引量：4

二级参考文献89

1曾文华,马健.支持向量机增量学习的算法与应用[J].计算机集成制造系统-CIMS,2003,9(z1):144-148. 被引量：27
2廖士中,贾磊.一类新的球面核函数的构造[J].计算机研究与发展,2007,44(z2):398-402. 被引量：4
3安金龙,王正欧.预抽取支持向量机的支持向量[J].计算机工程,2004,30(10):10-11. 被引量：10
4汪西莉,焦李成.一种基于马氏距离的支持向量快速提取算法[J].西安电子科技大学学报,2004,31(4):639-643. 被引量：21
5刘向东,骆斌,陈兆乾.支持向量机最优模型选择的研究[J].计算机研究与发展,2005,42(4):576-581. 被引量：48
6郑宇杰,杨静宇,吴小俊,於东军.基于独立成分分析和模糊支持向量机的人脸识别方法[J].系统仿真学报,2005,17(7):1768-1770. 被引量：13
7袁平,毛志忠,王福利.基于多支持向量机的软测量模型[J].系统仿真学报,2006,18(6):1458-1461. 被引量：18
8崔晨旸,石教英,王东辉.几何特征映射下的3维模型相似性匹配研究[J].中国图象图形学报,2006,11(5):661-666. 被引量：2
9曹淑娟,刘小茂,张钧,刘振丙.基于类中心思想的去边缘模糊支持向量机[J].计算机工程与应用,2006,42(22):146-149. 被引量：8
10肖小玲,李腊元,张翔.提高支持向量机训练速度的CM-SVM方法[J].计算机工程与设计,2006,27(22):4183-4184. 被引量：6

共引文献34

1李仁兵,李艾华,王声才,白向峰.支持向量预选的凸壳顶点法[J].控制与决策,2010,25(12):1848-1852. 被引量：1
2张战成,王士同,邓赵红,Chung Fu-lai.支持向量机的一种快速分类算法[J].电子与信息学报,2011,33(9):2181-2186. 被引量：15
3饶刚,刘琼荪.基于Fisher鉴别分析的支持向量机训练样本缩减策略[J].计算机工程与应用,2012,48(3):156-157. 被引量：2
4蒲骏逸,雷秀仁.核向量机与支持向量机相结合的二阶段快速学习方法[J].计算机应用,2012,32(2):419-424.
5夏书银,王越,曾晶.核空间结合样本中心角度的大规模支持向量机[J].计算机工程与设计,2012,33(2):586-590.
6张战成,王士同,邓赵红,钟富礼.一种支持向量机的快速分类算法[J].控制与决策,2012,27(3):459-463. 被引量：8
7曹鹏,李博,栗伟,赵大哲.结合X-means聚类的自适应随机子空间组合分类算法[J].计算机应用,2013,33(2):550-553. 被引量：5
8贺元元,张雪英,刘晓峰.多类分类预选取的SVM在语音识别中的应用[J].计算机工程与应用,2013,49(7):115-118. 被引量：2
9温祥西,孟相如,马志强.基于双重支持向量机的网络故障诊断[J].控制与决策,2013,28(4):506-510. 被引量：9
10孙永猛,丁建丽,瞿娟.软硬分类方法结合提取新疆北部地区MODIS积雪信息[J].自然灾害学报,2013,22(3):76-83. 被引量：3

同被引文献26

1蒋盛益,谢照青,余雯.基于代价敏感的朴素贝叶斯不平衡数据分类研究[J].计算机研究与发展,2011,48(S1):387-390. 被引量：21
2陆海峰,谭瑞民,瞿文龙.减小死区影响的准单极性PWM调制方法[J].清华大学学报（自然科学版）,2005,45(10):1297-1300. 被引量：25
3常晓军.智能车速度控制系统设计与实现[J].电子产品世界,2009,16(7):72-74. 被引量：2
4王茜,杨正宽.一种基于加权KNN的大数据集下离群检测算法[J].计算机科学,2011,38(10):177-180. 被引量：11
5张学工.关于统计学习理论与支持向量机[J].自动化学报,2000,26(1):32-42. 被引量：2256
6周玉,朱安福,周林,钱旭.一种神经网络分类器样本数据选择方法[J].华中科技大学学报（自然科学版）,2012,40(6):39-43. 被引量：18
7曹莹,苗启广,刘家辰,高琳.具有Fisher一致性的代价敏感Boosting算法[J].软件学报,2013,24(11):2584-2596. 被引量：11
8王真真,张雪英,刘晓峰.稀疏LSSVM及其在语音识别中的应用[J].计算机工程与设计,2014,35(4):1303-1307. 被引量：2
9李勇,刘战东,张海军.不平衡数据的集成分类算法综述[J].计算机应用研究,2014,31(5):1287-1291. 被引量：72
10刘艳,钟萍,陈静,宋晓华,何云.用于处理不平衡样本的改进近似支持向量机新算法[J].计算机应用,2014,34(6):1618-1621. 被引量：6

引证文献5

1万中英,王明文,左家莉,刘长红.一种新的样本选择算法及其在文本分类中的应用[J].江西师范大学学报（自然科学版）,2019,43(1):76-83. 被引量：4
2徐倩,张东,黄典,刘庆华.基于电磁传感器的路径识别系统的设计与实现[J].计算机与数字工程,2019,47(2):320-324.
3向奕雪,陈斌,罗勇.基于改进LSSVM的短波收信天线智能诊断研究[J].计算机与数字工程,2019,47(6):1331-1337. 被引量：2
4杨浩,王宇,张中原.基于K最近邻样本平均距离的代价敏感算法的集成[J].计算机应用,2019,39(7):1883-1887. 被引量：6
5顾依依,谈询滔,袁玉波.基于凸边界的学习样本抽取方法[J].计算机应用,2019,39(8):2281-2287. 被引量：2

二级引证文献14

1杨明生,张春光,杨晓东.醒脑通腑液治疗急性期脑出血30例观察[J].实用中医药杂志,2000,16(2):6-6.
2代奇迹,林呈辉,徐长宝,龙秋风,赵超,吕乾勇,王冕.超高输电塔变形监测技术中智能天线的应用研究[J].粘接,2019,40(11):185-189.
3方秋莲,王培锦,隋阳,郑涵颖,吕春玥,王艳彤.朴素Bayes分类器文本特征向量的参数优化[J].吉林大学学报（理学版）,2019,57(6):1479-1484. 被引量：4
4于艳丽,江开忠,王珂,盛静文.改进K均值聚类的不平衡数据欠采样算法[J].软件导刊,2020,19(6):205-209. 被引量：3
5孟鑫淼.基于大数据挖掘技术的文本分类研究[J].现代电子技术,2020,43(17):126-129. 被引量：5
6谢敏,刘秋明,肖贺,刘述民.基于机器学习的非接触式水位计校准算法研究[J].水利信息化,2020(5):37-40. 被引量：2
7周玉,任钦差,牛会宾.训练样本数据选择方法研究综述[J].计算机科学,2020,47(S02):402-408. 被引量：10
8王伟,李琰.基于GIS的短时交通客流智能协调控制系统设计[J].计算机测量与控制,2021,29(1):154-158.
9曹婷婷,张忠林.代价敏感的KPCA-Stacking不均衡数据分类算法[J].计算机工程与科学,2021,43(3):525-533. 被引量：4
10杨洁,李国腾,曾耀平.基于机器学习的认知雷达资源管理[J].无线互联科技,2021,18(10):124-127.

1刘绍毓,周杰,李弼程,席耀一,唐浩浩.基于多分类SVM-KNN的实体关系抽取方法[J].数据采集与处理,2015,30(1):202-210. 被引量：20
2杨金福,宋敏,李明爱.一种新的基于距离加权的模板约简K近邻算法[J].电子与信息学报,2011,33(10):2378-2383. 被引量：12
3黄颖,李伟,刘发升.双隶属度模糊支持向量机算法[J].计算机应用,2007,27(11):2821-2823. 被引量：2
4卢山,高峰,史广奎.并联型混合动力汽车的仿真研究[J].机电工程技术,2005,34(5):59-61. 被引量：3
5邹丽,蒋芸,陈娜,沈健,胡学伟,李志磊.基于决策树对支持向量机的医学图像分类新方法[J].计算机工程与应用,2016,52(21):76-80. 被引量：9
6兰远东,高蕾.基于图的半监督学习的距离度量改进[J].智能计算机与应用,2014,4(2):32-35. 被引量：1
7臧光明,黄晨杰,王亚美,方建明,余靖毅.视频火灾多判据识别技术及其应用[J].计算机应用与软件,2013,30(2):65-67. 被引量：8
8高保庆,傅秀芬,孟利,吕杰.一个基于MVC的通用Client/Server应用开发框架[J].计算机技术与发展,2008,18(7):126-128. 被引量：3
9阮逸润,老松杨,肖延东,王竣德,白亮.Identifying Influence of Nodes in Complex Networks with Coreness Centrality:Decreasing the Impact of Densely Local Connection[J].Chinese Physics Letters,2016,33(2):149-152. 被引量：4
10孟君,杨大利.说话人辨认中通用背景模型训练时长研究[J].北京信息科技大学学报（自然科学版）,2013,28(3):87-91. 被引量：4

计算机工程与应用

2017年第3期

浏览历史

内容加载中请稍等...

基于边界样本选择的支持向量机加速算法被引量：5

参考文献7

二级参考文献89

共引文献34

同被引文献26

引证文献5

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

基于边界样本选择的支持向量机加速算法 被引量：5

参考文献7

二级参考文献89

共引文献34

同被引文献26

引证文献5

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

基于边界样本选择的支持向量机加速算法被引量：5