期刊文献+

VSM在中文文本聚类中的应用及实证分析 被引量:13

Application and Empirical Research of VSM in Chinese Text Clustering
下载PDF
导出
摘要 文本聚类是W eb文本挖掘的一个重要分支,而文本表示方法是文本聚类的基础。重点讨论了文本表示方法中最常用到的向量空间模型,分析了其优势和不足,并基于一个文本处理实验,对V SM模型从可实现角度给出改进建议。 Text representation is the basis of text clustering that is also a branch of web documents mining. The usual vector space model in text representation is discussed and its disadvantages are analyzed. Based on a text clustering experiment, some advices are presented.
出处 《武汉理工大学学报(信息与管理工程版)》 CAS 2006年第4期56-59,81,共5页 Journal of Wuhan University of Technology:Information & Management Engineering
关键词 文本聚类 向量空间模型 文本表示 text clustering vector space model text representation
  • 相关文献

参考文献7

  • 1Freeman R T,Yin H J.Tree View Self-organisation of Web Content[J].Neurocomputing,2005(63):415-446.
  • 2牟廉明.数据挖掘中聚类方法比较研究[J].内江师范学院学报,2003,18(2):16-20. 被引量:10
  • 3Salton G,Wong A,Yang C S.A Vector Space Model for Automatic Indexing[J].Communications of the ACM,1975 (18):613-620.
  • 4Mao W L,Chu W W.Free-text Medical Document Retrieval via Phrase-based Vector Space Model[A].Proceedings of AMIA Annual Symposium[C].2002.46-51.
  • 5鲁松 白硕 等.文本中词语权重计算方法的改进[A]..2000 International Conference on Multilingual Information Processing[C].,2000.31-36.
  • 6刘斌,黄铁军,程军,高文.一种新的基于统计的自动文本分类方法[J].中文信息学报,2002,16(6):18-24. 被引量:48
  • 7Jiang F,Littman M L.Approximate Dimension Equalization in Vector-based Information Retrieval[A].Proceedings of the Seventeenth International Conference on Machine Learning[C].2000.98-104.

二级参考文献11

共引文献57

同被引文献96

引证文献13

二级引证文献54

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部