基于密度聚类的支持向量机分类算法被引量：10

Novel Support Vector Machine Classifier Based on Density Clustering

下载PDF

导出

摘要为了解决支持向量机的分类仅应用于较小样本集的问题,提出了一种密度聚类与支持向量机相结合的分类算法.在密度聚类中,当一个样本点不存在拟密度可达的样本点,则其显著特征即表现为该簇的边缘点,将该点加入约简集合,直至选出样本集合中的所有边缘对象,然后再利用约简集合寻找支持向量.实验表明,采用该算法,分类的准确率可从基于无监督聚类的支持向量机算法的86.81%提升至95.43%,核函数计算量由原数量级109下降到106以下,采取限制密度聚类中的核心点ε-邻域内的反例百分比的方法,可以增加约简样本的个数,可将分类准确率提高5%～8%左右. To solve the problem that support vector machine （SVM） can only classify the small samples set, a new algorithm which applied SVM to density clustering is proposed. For density clustering, when an object p is not an approximate density-reachable object, the feature of this object will show itself as the edge object of this cluster, then, saving this object to the new reduced samples set until the end of procedure of extracting samples. SVM can use these reduced samples to train the classifier. Experimental results indicate that comparing with the SVM＇s unsupervised clustering, the accuracy is increased from 86.81% to 95.43%, the order of magnitude of kernel computation of SVM is decreased from 10^9 to 10^6, and the accuracy is improved by about 5%-8%, and the number of reduced samples can be increased by using the method that limits the percentage of counterexamoles in kernel object ε-adjacent area.

作者武方方赵银亮蒋泽飞

机构地区西安交通大学新型计算机研究所

出处《西安交通大学学报》 EI CAS CSCD 北大核心 2005年第12期1319-1322,1348,共5页 Journal of Xi'an Jiaotong University

基金国家自然科学基金资助项目(60173066)

关键词支持向量机密度聚类 ε-邻域 support vector machine density clustering ε--area

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献6

1Vapnik V. The nature of statistical learning theory[M]. New York: Springer-Verlag, 1995.
2张学工.关于统计学习理论与支持向量机[J].自动化学报,2000,26(1):32-42. 被引量：2257
3Burges C J C. A tutorial on support vector machines for pattern recognition[J]. Data Mining and Knowledge Discovery, 1998, 2(2): 955-974.
4Bernhard S, Sung K K. Comparing support vector machines with Gaussian kernels to radical basis function classifiers[J]. IEEE Transaction on Signal Processing, 1997, 45(11): 2 758-2 765.
5Edgar O, Robert F, Federico G. Training support vector machines: an application to face detection[A]. IEEE Conference on Computer Vision and Pattern Recognition, San Juan, Puerto Rico, 1997.
6李晓黎,刘继敏,史忠植.基于支持向量机与无监督聚类相结合的中文网页分类器[J].计算机学报,2001,24(1):62-68. 被引量：108

二级参考文献2

1卢增祥,李衍达.交互支持向量机学习算法及其应用[J].清华大学学报（自然科学版）,1999,39(7):93-97. 被引量：40
2李晓黎,史忠植.用数据采掘方法获取汉语词性标注规则[J].计算机研究与发展,2000,37(12):1409-1414. 被引量：10

共引文献2352

1白岗岗,侯精明,史玉品,韩浩,郭凯华,李丙尧,付德宇.基于支持向量机的葫芦河流域径流变化的多因素贡献率分析[J].水土保持研究,2020,27(2):112-117. 被引量：2
2曾赟.第四种法学知识新形态——数据法学的研究定位[J].法制与社会发展,2023,29(1):41-59. 被引量：8
3乔丹,刘刚,杨执钧,钟韬,白雪.基于迁移学习的船舶目标识别[J].计算机应用研究,2020,37(S01):324-325. 被引量：1
4孟琮棠,赵银娣,向阳.基于卷积神经网络的遥感图像变化检测[J].现代测绘,2019,0(5):1-5. 被引量：3
5田海军,门洪,郎世伟.基于LS-SVM的电厂过热汽温仿真研究[J].微计算机信息,2007,23(10):270-272. 被引量：2
6张磊,夏士雄,牛强.基于SVM二叉决策树方法的矿井提升机故障诊断[J].微计算机信息,2008,24(10):198-199. 被引量：4
7瞿伟廉,谭冬梅.基于小波分析和支持向量机的结构损伤识别[J].武汉理工大学学报,2008,30(2):80-82. 被引量：3
8郑树剑,刘冀伟,何积铨,韩旭.基于支持向量机的混凝土结构中钢筋腐蚀的判别[J].电子器件,2007,30(5):1935-1938.
9殷彬,方思行.脾虚证诊断的数学模型[J].暨南大学学报（自然科学与医学版）,2006,27(3):363-367. 被引量：4
10王宇,丁萍,吴峻.基于SVM的光纤陀螺标度因数建模研究[J].舰船电子工程,2008,28(5):78-80. 被引量：1

同被引文献102

1祁亨年.支持向量机及其应用研究综述[J].计算机工程,2004,30(10):6-9. 被引量：183
2李青,焦李成,周伟达.基于向量投影的支撑向量预选取[J].计算机学报,2005,28(2):145-152. 被引量：37
3王劲波,翁伟,许华荣.数据挖掘中基于密度的聚类分析算法[J].统计与决策,2005,21(10X):139-141. 被引量：2
4李忠伟,张健沛,杨静.基于支持向量机的增量学习算法研究[J].哈尔滨工程大学学报,2005,26(5):643-646. 被引量：10
5孔波,刘小茂,张钧.基于中心距离比值的增量支持向量机[J].计算机应用,2006,26(6):1434-1436. 被引量：16
6蔡卫菊,张颖超.基于核的模糊聚类算法[J].计算机工程与应用,2006,42(18):173-175. 被引量：5
7吕佳,熊忠阳.基于核的可能性聚类算法[J].计算机工程与设计,2006,27(13):2466-2468. 被引量：8
8祁立,刘玉树.基于聚类粒度的模糊支持向量机[J].哈尔滨工程大学学报,2006,27(B07):411-414. 被引量：1
9张翔,肖小玲,徐光祐.模糊支持向量机中隶属度的确定与分析[J].中国图象图形学报,2006,11(8):1188-1192. 被引量：38
10张海龙,王莲芝.自动文本分类特征选择方法研究[J].计算机工程与设计,2006,27(20):3840-3841. 被引量：45

引证文献10

1刘雪燕,李明,张亚芬.基于PCA和多约简SVM的多级说话人辨识[J].计算机应用,2008,28(1):127-130. 被引量：4
2祁立,刘玉树.基于两阶段聚类的模糊支持向量机[J].计算机工程,2008,34(1):4-6. 被引量：5
3叶菲,罗景青.基于搜索机制密度聚类的支持向量预选取算法[J].计算机工程,2008,34(19):206-208.
4张恒,邹开其,崔杰,张敏.一种改进的基于密度聚类模糊支持向量机[J].计算机工程,2009,35(5):194-196. 被引量：6
5骆瑞玲,李明.基于MRSVM的说话人辨识方法[J].计算机工程与设计,2009,30(19):4483-4486.
6刘雪燕,夏汉铸,袁宝玲.基于新的MRSVM说话人辨识方法[J].计算机工程与应用,2010,46(5):136-139.
7赵飞军,贺兴时,王娟.一种改进的基于密度聚类的支持向量机[J].佳木斯大学学报（自然科学版）,2010,28(4):587-589.
8顾亚祥,丁世飞.支持向量机研究进展[J].计算机科学,2011,38(2):14-17. 被引量：118
9姜芳,李国和,岳翔.基于语义的文档特征提取研究方法[J].计算机科学,2016,43(2):254-258. 被引量：10
10李兵,田元,赵明华,李剑波.基于层次聚类的支持向量机分类算法[J].电子技术与软件工程,2018(19):186-187. 被引量：1

二级引证文献144

1丁胜锋.一种改进的双支持向量机[J].辽宁石油化工大学学报,2012,32(4):76-79. 被引量：4
2李艳平,徐雅斌,陈俊伊.搜索服务中基于云计算的垃圾网页识别研究[J].华中科技大学学报（自然科学版）,2012,40(S1):249-253.
3路萍.基于支持向量机的瓦斯抽放监控系统故障诊断[J].自动化与仪器仪表,2016(7):50-51. 被引量：1
4张银霞,邓文新.基于支持向量机的局域线性嵌入算法在图像检索中的应用[J].齐齐哈尔大学学报（自然科学版）,2009,25(4):14-17. 被引量：1
5邢玉娟,谭萍,李明.一种新的说话人识别序列特征提取方法[J].兰州理工大学学报,2009,35(4):98-102. 被引量：4
6李大湘,彭进业,卜起荣.用FSVM-MIL算法实现图像检索[J].光电工程,2009,36(9):98-103.
7施其权,李小明,肖辞源.一类新型快速模糊支持向量机[J].计算机技术与发展,2010,20(2):103-105. 被引量：7
8胡学坤,李金霞,宋淑娜,高尚.基于粗糙集与模糊支持向量机的模式分类方法研究[J].科技通报,2010,26(2):249-252. 被引量：11
9付蓉,石美红.基于自适应LBP和SVM的织物疵点检测算法[J].计算机应用,2010,30(6):1597-1601. 被引量：12
10赵飞军,贺兴时,王娟.一种改进的基于密度聚类的支持向量机[J].佳木斯大学学报（自然科学版）,2010,28(4):587-589.

1韦相.基于密度的改进BIRCH聚类算法[J].计算机工程与应用,2013,49(10):201-205. 被引量：16
2张枫,邱保志.基于网格的高效DBSCAN算法[J].计算机工程与应用,2007,43(17):167-169. 被引量：8
3周红芳,王鹏.DBSCAN算法中参数自适应确定方法的研究[J].西安理工大学学报,2012,28(3):289-292. 被引量：41
4孟海东,宋飞燕,郝永宽.基于密度与划分方法的聚类算法设计与实现[J].计算机工程与应用,2007,43(27):171-174. 被引量：4
5潘冬明,黄德才.基于相对密度的不确定数据聚类算法[J].计算机科学,2015,42(B11):72-74. 被引量：9
6薛丽香,邱保志.基于密度可达的多密度聚类算法[J].计算机工程,2009,35(17):66-68. 被引量：7
7贺玉芝,倪巍伟,张勇.基于密度可达的聚类隐私保护模型[J].东南大学学报（自然科学版）,2012,42(5):825-831.
8孟海东,王淑玲,郝永宽.动态增量聚类的设计与实现[J].计算机工程与应用,2009,45(24):130-132. 被引量：7
9刘卫宁,曾婵娟,孙棣华.基于DBSCAN算法的营运车辆超速点聚类分析[J].计算机工程,2009,35(5):268-270. 被引量：12
10卫兵,郭玉堂,宋杰,张磊.具备高存储密度的新型NAND设备管理方案[J].计算机应用,2014,34(8):2434-2437. 被引量：1

西安交通大学学报

2005年第12期

浏览历史

内容加载中请稍等...

基于密度聚类的支持向量机分类算法被引量：10

参考文献6

二级参考文献2

共引文献2352

同被引文献102

引证文献10

二级引证文献144

相关作者

相关机构

相关主题

浏览历史

基于密度聚类的支持向量机分类算法 被引量：10

参考文献6

二级参考文献2

共引文献2352

同被引文献102

引证文献10

二级引证文献144

相关作者

相关机构

相关主题

浏览历史

基于密度聚类的支持向量机分类算法被引量：10