自适应的模糊谱聚类算法在文本聚类中的应用被引量：1

Application of Auto-adaptation Fuzzy Spectral Clustering Algorithm in Text Clustering

下载PDF

导出

摘要传统聚类算法如k-means算法存在对样本空间形状敏感、一个样本点只能严格属于一个聚簇、需要人工指定聚簇数目等不足,这些不足之处都限制了文档聚类质量的提升。现有的模糊谱聚类算法只能解决前两个问题,而对于聚簇数目的自动确定却无能为力,因此本文提出一种自适应模糊谱聚类算法,该算法在模糊谱聚类的基础上引入自适应算法,解决聚类数目需要人工指定的问题。实验表明,将该方法用于文本聚类中可以取得较好的效果。 For traditional spectral clustering algorithms such as k-means algorithm, there exist a lot of deficiencies, for example its sensitivity on the shapes of the sample space, a sample point can only strictly belong to a cluster, need to specify the cluster number by manual work and so on, and these deficiencies limit the document clustering quality improvement. The existing fuzzy spectral clustering algorithm can only solve the first two problems, and the automatic determination of the number of clusters can not be determined. A kind of adaptive fuzzy spectral clustering algorithm was put forwards. The algorithm introduced the adaptive algorithm based on Fuzzy spectral clustering, which can solve the problem that the number of clusters should be specified manually. Experiments show that the proposed method can be used in text clustering and get the excellent effect.

作者牛海燕陈笑蓉

机构地区贵州大学计算机科学与技术学院

出处《贵州大学学报（自然科学版）》 2015年第6期75-78,共4页 Journal of Guizhou University:Natural Sciences

基金国家自然科学基金项目资助(61363066)

关键词谱聚类自适应模糊聚类 spectral clustering auto-adaptation fuzzy clustering

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献7

1蔡晓妍,戴冠中,杨黎斌.谱聚类算法综述[J].计算机科学,2008,35(7):14-18. 被引量：188
2Bezdek J, Ehrlich R, Full W. FCM: The fuzzy c-means clustering algorithm. Comput Geosci[ J ]. Computers & Geosciences, 1984,10(84) :191 -203.
3Zeshui Xu,Junjie Wu.Intuitionistic fuzzy C-means clustering algorithms[J].Journal of Systems Engineering and Electronics,2010,21(4):580-590. 被引量：20
4Von Luxburg U. A Tutorial on Spectral Clustering[J]. Statistics & Computing, 2007, 17(4) :395 -416.
5Bach F R, Jordan M I. Learning Spectral Clustering [ J ]. Ad- vances in Neural Information Processing Systems, 2004, 7 (2):2006.
6Lv L, Yang W, Yang Y, et al. Overlapping community detection algorithms in complex networks based on the fuzzy spectral cluste- ring[ C ]//Software Engineering and Service Science ( ICSESS ) , 2013 4th IEEE International Conference, Beijing: IEEE, 2013 : 816 -819.
7姚清耘,刘功申,李翔.基于向量空间模型的文本聚类算法[J].计算机工程,2008,34(18):39-41. 被引量：50

二级参考文献36

1张洪美,徐泽水,陈琦.直觉模糊集的聚类方法研究[J].控制与决策,2007,22(8):882-888. 被引量：64
2王永成.中文信息处理技术及其基础[M].上海:上海交通大学出版社,1990..
3Jain A, Murty M, Flynn P. Data clustering.. A Review[J]. ACM Computing Surveys, 1999,31 (3) : 264-323.
4Fiedler M. Algebraic connectivity of graphs. Czech, Math. J. , 1973,23: 298-305.
5Malik J,Belongie S,Leung T, et al. Contour and texture analysis for image segmentation In Perceptual Organization for Artificial Vision Systems. Kluwer, 2000.
6Weiss Y. Segmentation using eigenvectors: A unified view//International Conference on Computer Vision 1999.
7Shi J,Malik J. Normalized cuts and image segmentation. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2000,22 (8) : 888-905.
8Wu Z, Leahy R. An optimal graph theoretic approach to data clustering: theory and its application to image segmentation [J]. IEEE Trans on PAMI,1993, 15(11):1101-1113.
9Hagen L, Kahng A 13. New spectral methods for ratio cut partitioning and clustering. IEEE Trans. Computer-Aided Design, 1992,11 (9) : 1074-1085.
10Sarkar S, Soundararajan P. Supervised learning of large perceptual organization: Graph spectral partitioning and learning automata. IEEE Transaction on Pattern Analysis and Machine Intelligence, 2000,22(5) : 504- 525.

共引文献254

1赵晖,林成龙,唐朝京.基于视频三音子的双模态语料自动选取算法[J].计算机工程,2009,35(17):1-3. 被引量：2
2许伟佳.基于向量空间模型的文档聚类研究[J].电脑知识与技术,2009,5(9):7281-7283. 被引量：3
3李燕,张月国,李生红.基于蚁群算法的文本分类和聚类[J].信息安全与通信保密,2009,31(10):57-58. 被引量：2
4吴景岚.一种基于GRASP的文档聚类算法[J].闽江学院学报,2009,30(5):62-65.
5吕楠,罗军勇,刘尧,杨慧洁.基于话题三层结构模型的话题演化分析算法[J].计算机工程,2009,35(23):71-72. 被引量：10
6葛斌,封孝生,汤大权.基于模板的无导词义消歧方法[J].计算机工程与科学,2009,31(12):113-116.
7熊忠阳,暴自强,李智星,张玉芳.结合LSA的中文谱聚类算法研究[J].计算机应用研究,2010,27(3):917-918. 被引量：3
8尹洪英,徐丽群,曹永荣.基于谱聚类算法的城市路网动态分区研究[J].交通信息与安全,2010,28(1):16-19. 被引量：7
9马世霞,刘丹,贾世杰.基于蚁群算法的文本聚类算法[J].计算机工程,2010,36(8):206-207. 被引量：5
10殷宏威,赵伟,杨志伟.蚁群算法在KNN文本分类中的应用[J].长春理工大学学报（自然科学版）,2010,33(1):159-163. 被引量：2

同被引文献5

1孔万增,孙志海,杨灿,戴国骏,孙昌思核.基于本征间隙与正交特征向量的自动谱聚类[J].电子学报,2010,38(8):1880-1885. 被引量：37
2郭凯,李海芳,王会青.一种人工免疫的自适应谱聚类算法[J].小型微型计算机系统,2013,34(4):856-859. 被引量：6
3丁世飞,贾洪杰,史忠植.基于自适应Nystrm采样的大数据谱聚类算法[J].软件学报,2014,25(9):2037-2049. 被引量：26
4牛科,张小琴,贾郭军.基于距离度量学习的集成谱聚类[J].计算机工程,2015,41(1):207-210. 被引量：3
5王英博,马菁,宋晓倩.基于最优投影的半监督谱聚类算法[J].计算机应用研究,2018,35(1):97-100. 被引量：3

引证文献1

1薛丽霞,孙伟,汪荣贵,杨娟,胡敏.基于密度峰值优化的谱聚类算法[J].计算机应用研究,2019,36(7):1948-1950. 被引量：5

二级引证文献5

1李昕,雷迎科.基于密度峰值算法的通信电台个体识别[J].信号处理,2019,35(7):1242-1249. 被引量：2
2胡北辰.基于密度峰值的网络用户信息聚类局部自适应加密研究[J].成都工业学院学报,2020,23(4):43-47. 被引量：1
3李超群,李善梅,马维宇,张程.基于轨迹聚类的空中交通流自动识别方法研究[J].计算机仿真,2021,38(10):73-77. 被引量：4
4张宇姣,黄锐,张福泉,隋栋,张虎.基于菌群优化的近邻传播聚类算法研究[J].计算机科学,2022,49(5):165-169. 被引量：5
5张熳,徐兆瑞,沈项军.一种傅里叶域海量数据高速谱聚类方法[J].北京航空航天大学学报,2022,48(8):1445-1454. 被引量：1

1张胜.数据挖掘中聚类算法的研究[J].软件导刊,2008,7(6):66-67. 被引量：3
2赵晨,钱伟强,张飞雁.浅谈数据挖掘中的聚类算法[J].中国新技术新产品,2009(22):45-45. 被引量：1
3杰子.让鼠标自动“确定”[J].少年电脑世界（低年级）,2002(1):35-35.
4圆形触摸板[J].个人电脑,2003,9(12):201-201.
5冀素琴,石洪波.基于MapReduce的K-means聚类集成[J].计算机工程,2013,39(9):84-87. 被引量：8
6袁方,孟增辉,于戈.对k-means聚类算法的改进[J].计算机工程与应用,2004,40(36):177-178. 被引量：48
7张忠平,王爱杰,柴旭光.简单有效的确定聚类数目算法[J].计算机工程与应用,2009,45(15):166-168. 被引量：23
8郑鹏宇.一种挖掘模糊关联规则的新方法[J].福建电脑,2007,23(3):11-12.
9康永利.登录前第一个网络驱动器的自动确定[J].计算机世界月刊,1995(1):75-76.
10林善平,戈剑.TMC—40可编程调节器自适应模糊算法研究[J].工业控制计算机,1992(4):10-12.

贵州大学学报（自然科学版）

2015年第6期

浏览历史

内容加载中请稍等...

自适应的模糊谱聚类算法在文本聚类中的应用被引量：1

参考文献7

二级参考文献36

共引文献254

同被引文献5

引证文献1

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

自适应的模糊谱聚类算法在文本聚类中的应用 被引量：1

参考文献7

二级参考文献36

共引文献254

同被引文献5

引证文献1

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

自适应的模糊谱聚类算法在文本聚类中的应用被引量：1