模糊聚类算法在汉语文本聚类中的应用被引量：11

Application of Fuzzy Clustering Algorithmin Chinese Document Clustering

下载PDF

导出

摘要应用一种新的分词算法对汉语文本进行分词,该算法具备不使用词典和语法知识、不使用汉语词法规则、无监督等特点。采用模糊聚类算法对汉语文本进行聚类,该模糊聚类算法优于普通的聚类算法,聚类结果能充分体现汉语文本的多样性和大量性的特点。 This paper uses a new algorithm of segmentating Chinese document, which doesn't rely on a lexicon, grammar, word-formation heuristics or pre-segmented data. Then it applies FCA (Fuzzy Clustering Algorithm) to Chinese document clustering. FCA is superior to other ordinary clustering algorithm and the result can embody the wide diversity and large amount of Chinese document.

作者李家福陆建江张亚非

机构地区解放军理工大学通信工程学院解放军理工大学理学院

出处《计算机工程》 CAS CSCD 北大核心 2002年第4期15-16,33,共3页 Computer Engineering

基金国家自然科学基金项目(69975024) 国家自然科学基金重点项目(69931040)

关键词汉语文本聚类模糊聚类算法汉字信息处理计算机模糊C-原型算法 Document cluster Word segmentation Fuzzy c-archetype algorithm Non-Euclidean relational data CompetitiveaggIomeration aIgorithm

分类号 TP391.12 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1[1]Rie K A,Lillian L Mostly-unsupervised Statistical Segmentation of Japanese[A].Language Technology Joint Conf of Applied Natural Language Processing and the North American Chapter of the Association for Computational LinguiSticS[C],2000-04
2[2]Kolda T G Limited-memoryMatrix Methods with Applications[D]University of Maryland:College Park,Mayland,1997
3[3]Krishnapuram R,Joshi A,YiL A Fuzzy Relative of the k-Medoids Algorithm with Application to Web Document and Snippet Clustering [A] Korea,ProcIEEE Intl ConfFuzzy Systems-FUZZ IEEE 1 999[C],1999-08
4[4]Hathaway R J,Bezdek J C NERF c-Means Non-Euclidean Relational Fuzzy Clustering[J]Pattern Recognition.1 994,27(3):429-437
5[5]Frigui H.Krishnapuram R Clustering by Competitive Agglomeration [J]Pattern Recognition.1 997.30(7):1109-1119

同被引文献68

1林建敏,谢康林.基于PAT-array和模糊聚类的文本聚类方法[J].计算机工程,2004,30(12):126-127. 被引量：6
2吴健珍,谢剑英.基于模糊聚类和HVS的DWT自适应盲水印算法研究[J].计算机工程与应用,2004,40(17):109-111. 被引量：4
3刘群,张浩,白硕.自然语言处理开放资源平台[J].语言文字应用,2002(4):50-56. 被引量：9
4陈涛,谢阳群.文本分类中的特征降维方法综述[J].情报学报,2005,24(6):690-695. 被引量：79
5何峰.一种基于粗糙集理论的文本分类方法[J].自动化与信息工程,2006,27(3):1-3. 被引量：4
6孟海涛,陈笑蓉.基于模糊相似度的科技文献软聚类算法[J].贵州大学学报（自然科学版）,2007,24(2):175-178. 被引量：9
7冯中慧,鲍军鹏,沈钧毅.一种增量式文本软聚类算法[J].西安交通大学学报,2007,41(4):398-401. 被引量：3
8Lawrence S, Searching the World Wide Web [ J ]. Science, 1998, 280(5360) :98-100.
9Raz Tzvi ,Yaung,Alan T.Application d Clustering Techniques to Information Systems Design[J]. Information and Software Technology, 1995,37(3) :86-92,.
10Raz T, Yaung A. Heuristic Clustering Based on a Measure of Inclusion[ J]. lnt J of Industrial Engineering, 1994,1 ( 1 ) :56-66.

引证文献11

1张茂元,卢正鼎,邹春燕.一种基于语境的中文分词方法研究[J].小型微型计算机系统,2005,26(1):129-133. 被引量：8
2胡宁静,王靖.基于模糊c均值算法文档聚类问题的研究[J].长沙电力学院学报（自然科学版）,2004,19(4):12-14. 被引量：1
3王明春,王正欧.基于粗集与遗传算法相结合的文本模糊聚类方法[J].电子与信息学报,2005,27(4):548-551. 被引量：4
4耿新青,王正欧.TGFCM:基于模糊聚类的中文文本挖掘的新方法[J].计算机工程,2006,32(5):7-9.
5刘超,孙星明,周新民.基于模糊聚类方法的盲文本水印算法研究[J].计算机应用研究,2007,24(2):148-150. 被引量：4
6李若鹏,李翔,林祥,李建华.基于DK算法的互联网热点主动发现研究与实现[J].计算机技术与发展,2008,18(9):1-4. 被引量：10
7高宏宾,杨海振,张小彬.一种改进的文本聚类方法[J].自动化技术与应用,2008,27(9):30-32. 被引量：3
8刘志勇,耿新青.基于模糊聚类的文本挖掘算法[J].计算机工程,2009,35(5):44-45. 被引量：19
9李清峰,周伟林,何静,丁小玲.一种基于模糊聚类的文本挖掘新方法[J].计算机应用研究,2009,26(12):4453-4456. 被引量：1
10王娟,范少萍,郑春厚.基于惩罚性矩阵分解的文本聚类分析[J].情报学报,2012,31(9):998-1008. 被引量：5

二级引证文献55

1张素智,刘放美.基于矩阵约束法的中文分词研究[J].计算机工程,2007,33(15):98-100. 被引量：11
2王明春,唐万生,江琪,刘鑫.基于相对距离的改进粗K-means方法[J].计算机应用,2009,29(4):1102-1105. 被引量：2
3李庆诚,张振华,张金.基于汉字结构的自然型文本水印算法[J].计算机应用研究,2009,26(4):1520-1522. 被引量：11
4石晓敬,韩燮.文本聚类算法的设计与实现[J].计算机工程与设计,2010,31(9):2013-2015. 被引量：5
5律佳,廉立志.基于语境分析的汉语分词器在文本信息过滤系统中的应用[J].郑州轻工业学院学报（自然科学版）,2010,25(3):66-70.
6洪亮亮,罗可.改进的基于遗传算法的粗糙聚类方法[J].计算机工程与应用,2010,46(25):142-145. 被引量：10
7魏莎莎,熊海灵.中文分词中的歧义识别处理策略[J].微计算机信息,2010,26(30):190-192. 被引量：6
8曲颖.基于模糊神经网络的Web文本挖掘系统[J].电脑知识与技术,2010(11):8838-8839.
9奉国和,郑伟.国内中文自动分词技术研究综述[J].图书情报工作,2011,55(2):41-45. 被引量：104
10华斌,张洪波,何晓.FCMBP模糊聚类算法的改进[J].计算机工程,2011,37(2):188-190. 被引量：1

1陈炯,范卓华,张虎.汉语文本聚类及其算法设计[J].山西电子技术,2005(2):29-30. 被引量：3
2卢忠良,王家云,荣融,朱劲松,孙即祥.一种基于模糊聚类的汉语文本自动分类方法[J].计算机应用与软件,2003,20(10):49-50. 被引量：2
3郭成贺.巧用QQ词典格式转换助手DIY词库[J].网友世界,2010(18):30-30.
4石峰,刘坚.一种解析GCC抽象语法树的方法[J].计算机应用,2004,24(3):115-116. 被引量：8
5胡宁静,王靖.基于模糊c均值算法文档聚类问题的研究[J].长沙电力学院学报（自然科学版）,2004,19(4):12-14. 被引量：1
6李毅,何伟国,李涓子.基于词法规则的语义对象匹配算法[J].计算机工程,2005,31(4):172-174. 被引量：1
7邹晓峰,陆建江,储为民,宋自林.挖掘关注的语言值关联规则[J].解放军理工大学学报（自然科学版）,2002,3(3):9-12. 被引量：2
8数字[J].中国信息化,2011(1):9-9.
9苗东霞,阿斯马·伊里哈木.略论维吾尔族学习和使用汉语过程中的问题[J].新疆大学学报（哲学社会科学版）（维吾尔文）,2010(2):54-59.
10张广梅,李景霞.利用属性文法对程序中的副作用进行检测[J].计算机科学,2012,39(S3):276-279. 被引量：1

计算机工程

2002年第4期

浏览历史

内容加载中请稍等...

模糊聚类算法在汉语文本聚类中的应用被引量：11

参考文献5

同被引文献68

引证文献11

二级引证文献55

相关作者

相关机构

相关主题

浏览历史

模糊聚类算法在汉语文本聚类中的应用 被引量：11

参考文献5

同被引文献68

引证文献11

二级引证文献55

相关作者

相关机构

相关主题

浏览历史

模糊聚类算法在汉语文本聚类中的应用被引量：11