用聚类-分类模式解决聚类问题被引量：6

Clustering Based on Clustering-Classification Model

下载PDF

导出

摘要分类和聚类都是常用的数据挖掘方法,分类的优点是准确率较高,但需要带有类别标注的训练集;聚类不需要训练集,但准确率较低。提出一种聚类-分类模式来解决聚类问题,首先通过聚类方法自动形成训练集,然后在训练集的基础上进行分类操作。实验数据表明,提出的聚类-分类模式能够有效提高聚类的准确率。 Classification and clustering are both commonly used data mining methods. The advantage of classification is that the accuracy is higher ,but the labeled training set is needed. The training set is not needed in clustering but the accuracy is lower. A clustering-classification model is proposed to solve the clustering problem. First ,the training set is formed automatically by clustering, and then the classification proceeds based on the training set. Experiments show that the cluster-classification model can improve the effect of clustering.

作者周志勇袁方刘海博

机构地区河北大学数学与计算机学院

出处《广西师范大学学报（自然科学版）》 CAS 北大核心 2007年第2期127-130,共4页 Journal of Guangxi Normal University:Natural Science Edition

基金河北省科技攻关计划资助项目(05213573) 河北省教育厅科研计划资助项目(2004406)

关键词聚类算法分类算法聚类-分类模式 clustering classification clustering-classification model

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献8

1HAN Jia-wei,KAMBER M.Date mining concepts and techniques[M].Beijing:Higher Education Press,2001.
2牛力.数据挖掘中的统计分析技术应用研究[J].广西师范大学学报（哲学社会科学版）,2002,38(S1):226-229. 被引量：6
3胡本琼,张先迪,庞朝阳.利用图论设计图像压缩中的向量量化聚类算法[J].四川师范大学学报（自然科学版）,2005,28(3):376-378. 被引量：5
4杨昔阳.基于改进RPCL算法的模糊推理系统构建方法[J].郑州大学学报（理学版）,2006,38(4):107-111. 被引量：3
5MITCHELL T M.Machine learning[M].Beijing:China Machine Press,2003.
6孙广玲,唐降龙.基于分层高斯混合模型的半监督学习算法[J].计算机研究与发展,2004,41(1):156-161. 被引量：22
7MITCHELL H B,SCHAEFER P A.A "soft" k-nearest neighbor voting scheme[J].International Journal of Intelligent Systems,2001(16):459-468.
8MACQUEEN J.Some methods for classification and analysis of multivariate observations[C]//CAM L M L,NEYMAN J.Proceedings of the Fifth Berkeley Symposium on Mathematical Statistics and Probability.Berkeley:University of California Press,1967:281-297.

二级参考文献21

1苏毅娟,严小卫.一种改进的频繁集挖掘方法[J].广西师范大学学报（自然科学版）,2001,19(3):22-26. 被引量：10
2邦迪JA 默蒂USR.图论及其应用[M].北京:科学出版社,1984..
3[1]M Weber, M Welling, P Perona. Towards automatic discovery of object categories. IEEE Conf on Computer Vision and Pattern Recognition, Hilton Head Island, 2000
4[2]K P Bennett, A Demiriz. Semi-supervised support vector machines. In: D C M Kearns, S Solla, eds. Advances in Neural Information Processing Systems. Cambridge, MA: MIT Press, 1998. 368～374
5[3]K Nigam, A McCallum, S Thrun .et al.. Text classification from labeled and unlabeled documents using EM. Machine Learning, 1999, 39: 103～134
6[4]W Ying, H Thomas S. Self-supervised learning for object recognition based on kernel discriminant-EM algorithm. The IEEE Int'l Conf on Computer Vision, Vancouver, 2001
7[5]B Sugato. Semi-supervised clustering by seeding. The 19th Int'l Conf on Machine Learning, Sydney, 2002
8[6]Kristin P Bennett, Ayhan Derniriz .et al.. Exploiting unlabeled data in ensemble methods. The 8th ACM SIGKDD Int'l Conf on Knowledge Discovery and Data Mining, Edmonton, 2002
9[7]A P Dempster, N M Laired, D B Rubin. Maximum likelihood from incomplete data via the EM algorithm. Journal of the Royal Statistical Society, 1977, B(39): 1～38
10[8]Nei Kato. A handwritten character recognition system using directional element feature and asymmetric Mahalanobis distance. IEEE Trans on Pattern Analysis and Machine Intelligence, 1999, 21(3): 258～262

共引文献32

1尹清波,王慧强,张汝波,申丽然,李雪耀.半监督在线增量自学习异常检测方法研究[J].计算机研究与发展,2006,43(z2):419-424. 被引量：2
2徐钢,张胜利,张晓丽,崔晨,于丹丹.基于小波变换的双匹配度图像融合算法[J].郑州大学学报（理学版）,2009,41(2):37-39. 被引量：2
3李庆强,魏振钢,孙笑非,马丽晶.基于半监督分类的BGP异常检测[J].计算机应用,2008,28(S2):83-85.
4卢心红,李宏宇,孙波.基于图像的惯性导航信息标记点识别技术[J].重庆师范大学学报（自然科学版）,2007,24(4):58-61. 被引量：1
5杨昔阳.变论域模糊控制器及其应用[J].泉州师范学院学报,2007,25(6):10-14. 被引量：3
6张博锋,白冰,苏金树.基于自训练EM算法的半监督文本分类[J].国防科技大学学报,2007,29(6):65-69. 被引量：17
7陆伟宙,余顺争.基于半监督聚类的Web流量分类[J].计算机科学,2009,36(2):90-94. 被引量：3
8范新,沈闻,丁泉勋,沈洁.基于正例和未标文档的半监督分类研究[J].计算机技术与发展,2009,19(6):58-60.
9潘章明,曲政.基于差分进化算法的高斯混合模型参数估计[J].现代计算机,2009,15(5):29-31. 被引量：2
10石云平.数据挖掘与统计学的关系研究[J].国外电子测量技术,2009,28(6):21-23. 被引量：2

同被引文献53

1滕明君,周志翔,王鹏程,覃婕,王燕燕,史梅容.基于RS/GIS的武汉市九峰城市森林保护区景观结构特征及规划对策[J].长江流域资源与环境,2010,19(1):79-85. 被引量：4
2林春燕,朱东华.一种快速的文本聚类-分类法[J].计算机工程与科学,2004,26(7):74-76. 被引量：3
3陈振洲,李磊,姚正安.基于SVM的特征加权KNN算法[J].中山大学学报（自然科学版）,2005,44(1):17-20. 被引量：51
4张春英,刘保相,郭景峰,刘凤春.基于属性链表的关联规则格的渐进式构造算法[J].计算机工程与设计,2005,26(2):320-322. 被引量：6
5崔胜辉,洪华生,黄云凤,薛雄志.生态安全研究进展[J].生态学报,2005,25(4):861-868. 被引量：237
6常兆丰 ,韩福贵 ,仲生年 ,赵明 ,梁泰 .石羊河下游沙漠化的自然因素和人为因素及其位移[J].干旱区地理,2005,28(2):150-155. 被引量：54
7肖笃宁,李小玉,宋冬梅.石羊河尾闾绿洲的景观变化与生态恢复对策[J].生态学报,2005,25(10):2477-2483. 被引量：36
8王汉芝,刘振全.一种新的确定K-均值算法初始聚类中心的方法[J].天津科技大学学报,2005,20(4):76-79. 被引量：9
9角媛梅,杨有洁,胡文英,速少华.哈尼梯田景观空间格局与美学特征分析[J].地理研究,2006,25(4):624-632. 被引量：52
10豆增发,王英强,王保保.一种基于信息增益的K-NN改进算法[J].电子科技,2006,19(12):52-56. 被引量：5

引证文献6

1秦永彬,李慧慧,许道云.一种基于空间邻接关系的聚类算法及实现[J].广西师范大学学报（自然科学版）,2007,25(4):160-163. 被引量：3
2桑应宾,刘琼荪.一种基于特征加权的K Nearest Neighbor算法[J].海南大学学报（自然科学版）,2008,26(4):352-355. 被引量：6
3张春英,郭景峰.概率决策空间上的SPA可能度格序结构[J].广西师范大学学报（自然科学版）,2008,26(4):45-48.
4桑应宾,刘琼荪.改进的k-nn快速分类算法[J].计算机工程与应用,2009,45(11):145-146. 被引量：8
5汤萃文,张忠明,苏研科,郭明,杨莎莎,王天强,杨啸林.石羊河上游林区景观空间邻接特征及生态安全分析[J].干旱区地理,2013,36(2):311-317. 被引量：8
6甘甜,郑英,蒋云钟,赵红莉,贺君彦,段浩.基于DBSCAN-RF洪水分类的洪水预报应用研究[J].水利水电技术（中英文）,2024,55(3):77-89. 被引量：1

二级引证文献26

1张小宇,梁吉业,曹付元,于慧娟.基于加权连接度的改进K-Modes聚类算法[J].广西师范大学学报（自然科学版）,2008,26(3):189-193. 被引量：3
2马倩,郭景峰,杜京.模式聚类中的线性模式挖掘[J].广西师范大学学报（自然科学版）,2008,26(4):49-52.
3李秀娟.KNN分类算法研究[J].科技信息,2009(31):81-81. 被引量：11
4郑阳洋,刘希玉,邓文臣.道路网络聚类技术在卷烟配送中的研究与应用[J].计算机应用研究,2011,28(1):142-144.
5刘应东,牛惠民.基于K-均值聚类的小样本集KNN分类算法[J].计算机应用与软件,2011,28(5):112-113. 被引量：10
6刘应东,孙秉珍.基于元胞自动机的小样本集分类算法[J].计算机工程,2012,38(7):155-157. 被引量：2
7苟和平,景永霞,冯百明,李勇.基于密度的KNN分类器样本裁剪算法[J].佳木斯大学学报（自然科学版）,2013,31(2):242-244. 被引量：2
8石鑫鑫,胡学钢,林耀进.融合互近邻和可信度的K-近邻分类算法[J].合肥工业大学学报（自然科学版）,2014,37(9):1055-1058. 被引量：6
9汪有奎,杨全生,郭生祥,李进军,王零,袁虹.祁连山北坡森林资源变迁[J].干旱区地理,2014,37(5):966-979. 被引量：15
10谢红,赵洪野.基于卡方距离度量的改进KNN算法[J].应用科技,2015,42(1):10-14. 被引量：17

1徐娟,张超,黄大卫,吴小培,王营冠.基于运动目标分类的监控视频检索系统[J].工业控制计算机,2015,28(7):115-116.
2yoyo.彻底删除收藏夹中的“链接”[J].电脑爱好者,2005(6):72-72.
3郭建伟.分类操作彰显威力![J].电脑知识与技术（经验技巧）,2016,0(9):30-32.
4李杰,王小伟.基于作者主题模型的遥感图像自动类别标注方法[J].计算机应用与软件,2013,30(10):263-265. 被引量：3
5屈军.基于增量的贝叶斯算法在网页文本中的应用[J].赤峰学院学报（自然科学版）,2013,29(13):23-24.
6尹木,肖铮.词性标注与动词细分类研究[J].电脑知识与技术,2009,5(8X):6774-6776. 被引量：1
7张春元.基于CRFs的新闻网页主题内容自动抽取方法[J].广西师范大学学报（自然科学版）,2011,29(1):138-142. 被引量：1
8孙磊,朱立富,许晓鹏.基于增量式贝叶斯分类器的故障诊断研究[J].科技创新导报,2012,9(21):104-104.
9杨晔,彭宏,林嘉宜,陈绍坚.一种有效特征词发现的贝叶斯文本分类方法[J].系统工程,2004,22(9):107-110. 被引量：1
10李玲,李海军,王钲旋,王利民.基于主动学习提升朴素贝叶斯[J].计算机工程与应用,2006,42(19):164-166. 被引量：2

广西师范大学学报（自然科学版）

2007年第2期

浏览历史

内容加载中请稍等...

用聚类-分类模式解决聚类问题被引量：6

参考文献8

二级参考文献21

共引文献32

同被引文献53

引证文献6

二级引证文献26

相关作者

相关机构

相关主题

浏览历史

用聚类-分类模式解决聚类问题 被引量：6

参考文献8

二级参考文献21

共引文献32

同被引文献53

引证文献6

二级引证文献26

相关作者

相关机构

相关主题

浏览历史

用聚类-分类模式解决聚类问题被引量：6