期刊文献+

中文专利文本聚类方法研究

下载PDF
导出
摘要 该文提出了一种针对中文专利文本的聚类方法。使用自组织特征映射算法获得初始的聚类中心,并以此作为K-means算法的初始输入,从而得到最终的聚类结果。这样的组合可以在提高聚类准确率的同时,降低运行时间。在聚类之前还对文本进行LSI降维操作,降低了特征向量的维数,使得SOM和K-means两个对维数敏感的算法可以更加有效和快捷。
出处 《海峡科学》 2013年第12期31-33,共3页 Straits Science
基金 福建省科技计划项目<企业专利预警应用的混合聚类关键技术研究>(项目编号:2012H0016)资助
  • 相关文献

参考文献7

二级参考文献11

  • 1Kohonen T. The Self-Organizing Maps[ J]. Proceedings of the IEEE,1990,78 (9) : 1464-1480.
  • 2Kohonen T. Self Organization of a Massive Document Collection[ EB/OL]. http://lib. hut. fi/Diss/2000/isbn9512252600/article7. pdf,2000.
  • 3Kanungo T, Mount DM, Netanyahu NS. An Efficient K-means Clustering Algorithm : Analysis and Implementation [ J ]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2002,24 ( 7 ) :881- 892.
  • 4Ayad H, Kamel M. Topic Discovery from Text Using Aggregation of Different Clustering Methods[ A]. Cohen R, et al. Advances in Artificial Intelligence: The 15th Conference of the Canadian Society for Computational Studies of Intelligence[C]. Calgary, 2002. 161-175.
  • 5Salton G,McGill M J.Introduction to Modem Information Retrieval[M].New York:McGraw Hill Book Co.,1983.
  • 6Dumais S T.Using LSI for Information Retrieval,Information Filtering,and Other Things[C]//Proc.of Talk at Cognitive Technology Workshop.1997:4-5.
  • 7Landauer T K,Foltz P W,Laham D.Introduction to Latent Semantic Analysis[J].Discourse Processes,1998,(25):259-284.
  • 8林鸿飞,姚天顺.基于潜在语义索引的文本浏览机制[J].中文信息学报,2000,14(5):49-56. 被引量:29
  • 9庞剑锋,卜东波,白硕.基于向量空间模型的文本自动分类系统的研究与实现[J].计算机应用研究,2001,18(9):23-26. 被引量:293
  • 10盖杰,王怡,武港山.基于潜在语义分析的信息检索[J].计算机工程,2004,30(2):58-60. 被引量:29

共引文献58

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部