期刊文献+

基于LSSWM模型的交并式动态扩展聚类算法

Intersection-union Dynamic-extending Clustering Algorithm Based on LSSWM Model
下载PDF
导出
摘要 为获取Web上中文人物的精确信息,特别是同名人的分辨,提出了一种基于LSSWM模型的交并式动态扩展聚类算法。通过构建中心词库,对每篇文档建立基于中心距离、中心段、篇章长度等潜在语义信息的语句-词条矩阵LSSWM,利用交并式动态扩展聚类算法,对相似文档进行聚类。实验表明,该算法在保持人物语义信息的连贯性、突出不同位置语义信息重要性的同时,对文档的聚类有较高的准确性。 In order to find the exact information of Chinese people, especially to differentiate the namesake ,this paper proposes a intersection-union dynamic-extending clustering based on LSSWM Model. By constructing the Central-Words library of people's attributes the paper builds up the sentence-word matrix for each document based on Central distance, central paragraph, the document length and other semantic information. Then clustering the similar documents by intersection-union dynamic-extending clus- tering algorithm. The experimental results show that the algorithm can not only keep the consistency of the semantic information about personality and give prominence to the importance of semantic information of different positions, but also hold high clustering accuracy on documents data.
出处 《广西师范大学学报(自然科学版)》 CAS 北大核心 2007年第2期135-139,共5页 Journal of Guangxi Normal University:Natural Science Edition
基金 甘肃省自然科学基金资助项目(3ZS051-A25-035)
关键词 LSSWM模型 中心词 中心段 交并式过程 LSSWM model central word central segment intersection-union procedure
  • 相关文献

参考文献7

二级参考文献9

共引文献22

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部