期刊文献+

基于主题子空间的文本模糊C均值聚类方法 被引量:2

Fuzzy C-means Text Clustering Based on Topic Sub-space
下载PDF
导出
摘要 模糊C均值聚类作为聚类的一种有效方法在数据挖掘和信息检索等领域得到广泛的应用,初始中心和初始隶属度矩阵的建立是决定模糊C均值聚类效果的关键.本文提出一种基于文本主题空间的模糊C均值聚类算法TS2FCM(Topic Sub-Space based Fuzzy C-Means),通过对能够代表文本主题的关键短语(salient phrase)的提取来建立主题子空间,利用主题子空间中的文本向量来提取初始中心和初始隶属度矩阵.实验表明,TS2FCM取得了较好的聚类效果. As an effective method of clustering, Fuzzy C-Means(FCM) clustering is applied in many areas such as data mining and information retrieval. The key of FCM effect is the establishment of initial centers and subordination degree matrix. This paper proposes a TS2FCM(Topic Sub-Space based Fuzzy C-Means) algorithm which extracts salient phrases to build topic sub- space and then extract initial centers and subordination degree matrix. The experiment indicates that TS2FCM obtains good clustering effect.
出处 《小型微型计算机系统》 CSCD 北大核心 2007年第12期2225-2228,共4页 Journal of Chinese Computer Systems
基金 国家自然科学基金项目(60672056)资助 微软亚洲研究院基金项目(06120809)资助
关键词 TS2FCM 主题子空间 模糊C均值聚类 文本聚类 TS2FCM topic sub-space fuzzy C-Means clustering text clustering
  • 相关文献

参考文献3

二级参考文献3

共引文献66

同被引文献15

引证文献2

二级引证文献6

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部