期刊文献+

模糊聚类算法在汉语文本聚类中的应用 被引量:11

Application of Fuzzy Clustering Algorithmin Chinese Document Clustering
下载PDF
导出
摘要 应用一种新的分词算法对汉语文本进行分词,该算法具备不使用词典和语法知识、不使用汉语词法规则、无监督等特点。采用模糊聚类算法对汉语文本进行聚类,该模糊聚类算法优于普通的聚类算法,聚类结果能充分体现汉语文本的多样性和大量性的特点。 This paper uses a new algorithm of segmentating Chinese document, which doesn't rely on a lexicon, grammar, word-formation heuristics or pre-segmented data. Then it applies FCA (Fuzzy Clustering Algorithm) to Chinese document clustering. FCA is superior to other ordinary clustering algorithm and the result can embody the wide diversity and large amount of Chinese document.
出处 《计算机工程》 CAS CSCD 北大核心 2002年第4期15-16,33,共3页 Computer Engineering
基金 国家自然科学基金项目(69975024) 国家自然科学基金重点项目(69931040)
关键词 汉语文本聚类 模糊聚类算法 汉字信息处理 计算机 模糊C-原型算法 Document cluster Word segmentation Fuzzy c-archetype algorithm Non-Euclidean relational data CompetitiveaggIomeration aIgorithm
  • 相关文献

参考文献5

  • 1[1]Rie K A,Lillian L Mostly-unsupervised Statistical Segmentation of Japanese[A].Language Technology Joint Conf of Applied Natural Language Processing and the North American Chapter of the Association for Computational LinguiSticS[C],2000-04
  • 2[2]Kolda T G Limited-memoryMatrix Methods with Applications[D]University of Maryland:College Park,Mayland,1997
  • 3[3]Krishnapuram R,Joshi A,YiL A Fuzzy Relative of the k-Medoids Algorithm with Application to Web Document and Snippet Clustering [A] Korea,ProcIEEE Intl ConfFuzzy Systems-FUZZ IEEE 1 999[C],1999-08
  • 4[4]Hathaway R J,Bezdek J C NERF c-Means Non-Euclidean Relational Fuzzy Clustering[J]Pattern Recognition.1 994,27(3):429-437
  • 5[5]Frigui H.Krishnapuram R Clustering by Competitive Agglomeration [J]Pattern Recognition.1 997.30(7):1109-1119

同被引文献68

引证文献11

二级引证文献55

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部