基于模糊c均值算法文档聚类问题的研究被引量：1

On Document Clustering Based on Fuzzy C-Mean Algorithm

下载PDF

导出

摘要应用模糊c均值算法对文档进行分类,具有不使用语法知识、不使用词法规则、无监督等特点.采用模糊c均值算法对文档进行聚类,实验结果表明:该方法优于普通的聚类算法,聚类结果能充分体现文本的多样性. The Fuzzy c-mean algorithm for document clustering has the features that exempt from grammar,word-formation heuristics, pre-segmented data and so on. The FCM(fuzzy c-mean algorithm) for document clustering has been discussed in this paper. The algorithm is superior to other general clustering algorithm and can be used in wide diversity of document.

作者胡宁静王靖

机构地区长沙理工大学计算机与通信工程学院

出处《长沙电力学院学报（自然科学版）》 2004年第4期12-14,共3页 JOurnal of Changsha University of electric Power:Natural Science

基金湖南省教育厅科研基金资助项目(03C078)

关键词文本聚类模糊C均值算法模糊聚类 document clustering fuzzy C-mean algorithm fuzzy clustering

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1Lawrence S, Searching the World Wide Web [ J ]. Science, 1998, 280(5360) :98-100.
2Raz Tzvi ,Yaung,Alan T.Application d Clustering Techniques to Information Systems Design[J]. Information and Software Technology, 1995,37(3) :86-92,.
3Raz T, Yaung A. Heuristic Clustering Based on a Measure of Inclusion[ J]. lnt J of Industrial Engineering, 1994,1 ( 1 ) :56-66.
4孙即祥.现代模式识别[M].北京：国防科技大学出版社,2001..
5李家福,陆建江,张亚非.模糊聚类算法在汉语文本聚类中的应用[J].计算机工程,2002,28(4):15-16. 被引量：11

二级参考文献5

1[1]Rie K A,Lillian L Mostly-unsupervised Statistical Segmentation of Japanese[A].Language Technology Joint Conf of Applied Natural Language Processing and the North American Chapter of the Association for Computational LinguiSticS[C],2000-04
2[2]Kolda T G Limited-memoryMatrix Methods with Applications[D]University of Maryland:College Park,Mayland,1997
3[3]Krishnapuram R,Joshi A,YiL A Fuzzy Relative of the k-Medoids Algorithm with Application to Web Document and Snippet Clustering [A] Korea,ProcIEEE Intl ConfFuzzy Systems-FUZZ IEEE 1 999[C],1999-08
4[4]Hathaway R J,Bezdek J C NERF c-Means Non-Euclidean Relational Fuzzy Clustering[J]Pattern Recognition.1 994,27(3):429-437
5[5]Frigui H.Krishnapuram R Clustering by Competitive Agglomeration [J]Pattern Recognition.1 997.30(7):1109-1119

共引文献24

1李峰,刘顺利,熊平,黄福卷.基于改进C-均值聚类算法的空中目标分类[J].现代防御技术,2004,32(6):10-13. 被引量：6
2张茂元,卢正鼎,邹春燕.一种基于语境的中文分词方法研究[J].小型微型计算机系统,2005,26(1):129-133. 被引量：8
3王明春,王正欧.基于粗集与遗传算法相结合的文本模糊聚类方法[J].电子与信息学报,2005,27(4):548-551. 被引量：4
4吴丽芸,王文伟,张平,陈俊.手写混合字符集识别的多特征多级分类器设计[J].计算机应用,2005,25(12):2948-2950. 被引量：3
5刘松,应自炉.基于SVM信息融合方法的人脸表情识别[J].五邑大学学报（自然科学版）,2005,19(4):27-32. 被引量：1
6邵黎,杨余旺.利用优化方法求解线性鉴别方程[J].南京理工大学学报,2005,29(6):745-747. 被引量：1
7刘磊,江桦,贾永强.基于人工神经网络的DVB-S2数字信号调制模式识别[J].微计算机信息,2005,21(12Z):169-171. 被引量：6
8耿新青,王正欧.TGFCM:基于模糊聚类的中文文本挖掘的新方法[J].计算机工程,2006,32(5):7-9.
9徐海波,李瑞,邹炜,潘杨辉.模糊聚类实现岩性自动划分[J].物探化探计算技术,2006,28(4):319-321. 被引量：8
10魏喆,谭建荣,冯毅雄,冯星.基于相似性的产品模块构建方法及其应用[J].计算机辅助设计与图形学学报,2006,18(12):1930-1934. 被引量：5

同被引文献5

1金胜勇,赵凯威.“后数字图书馆时代”解析[J].图书馆杂志,2005,24(5):19-21. 被引量：13
2周军.基于数据挖掘的数字图书馆个性化服务系统的构建[J].图书馆学研究,2007(3):15-17. 被引量：34
3Agrawal R, Imielinski T, Swami A. Mining association rules between sets of it-eros in large database [J]. IEEE Transactions on Knowledge and Data Engineering,1996,8 (6):962-969.
43HANJia.wei,KamberM.Dataminingconceptsandtechniques[M].范明,孟小峰,等译.北京:机械工业出版社,2001:123-125.
5朱晓华.浅析数据挖掘技术在图书馆自动化中的应用[J].图书馆学研究,2002(5):41-42. 被引量：33

引证文献1

1刘志勇.关联规则数据挖掘在图书馆藏书建设中的应用研究[J].电子设计工程,2011,19(21):62-64. 被引量：4

二级引证文献4

1谢旭明.数据挖掘技术在图书馆个性化服务管理中的应用[J].企业导报,2013(15):50-51. 被引量：2
2张燕.关联数据视域下图书馆知识服务的策略[J].图书馆学刊,2013,35(2):98-100. 被引量：4
3毋桂亲.数据挖掘技术在图书馆个性化服务管理中的应用[J].商情,2014(20):320-320.
4郝海涛.关联规则的数据挖掘在图书馆系统中的应用[J].信息通信,2016,29(6):74-76. 被引量：5

1石峰,刘坚.一种解析GCC抽象语法树的方法[J].计算机应用,2004,24(3):115-116. 被引量：8
2李毅,何伟国,李涓子.基于词法规则的语义对象匹配算法[J].计算机工程,2005,31(4):172-174. 被引量：1
3张广梅,李景霞.利用属性文法对程序中的副作用进行检测[J].计算机科学,2012,39(S3):276-279. 被引量：1
4庞新法.如何轻松学好汇编语言[J].价值工程,2014,33(19):193-194. 被引量：1
5庞新法.从英语学习自然过渡到C语言学习[J].价值工程,2014,33(9):186-187.
6刘义,常戈群.Lex在文字替换中的妙用[J].计算机工程,2000,26(6):97-98. 被引量：1
7艾孜孜.吐尔逊,杨雅婷,吐尔洪.吾司曼,周俊林,李晓.维-汉统计机器翻译中维吾尔语预处理研究[J].计算机工程与设计,2014,35(11):4034-4039. 被引量：3
8张弦,原庆能.GPJ_Pascal集成开发坏境——词法分析、语法分析、语义分析和中间代码生成[J].广西工学院学报,2005,16(S3):86-89.
9汪永好.表达式解析器在工作流管理系统中的应用[J].计算机工程与设计,2007,28(12):3020-3022. 被引量：4
10古辉,姚灵灵,童李文.基于产生式的多语言程序理解的算法[J].计算机系统应用,2012,21(2):51-55.

长沙电力学院学报（自然科学版）

2004年第4期

浏览历史

内容加载中请稍等...

基于模糊c均值算法文档聚类问题的研究被引量：1

参考文献5

二级参考文献5

共引文献24

同被引文献5

引证文献1

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于模糊c均值算法文档聚类问题的研究 被引量：1

参考文献5

二级参考文献5

共引文献24

同被引文献5

引证文献1

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于模糊c均值算法文档聚类问题的研究被引量：1