期刊文献+

一种基于向量空间模型的改进文本分类算法 被引量:2

An Improved Text Categorization Based on Vector Space Model
下载PDF
导出
摘要 探讨了基于向量空间模型的文本分类技术,通过规范化向量空间模型术语,论述了向量空间模型中TD-IDF向量化文档的不足;提出基于位置等因素的权重改进算法;借助扩展的潜在语义索引算法KLSC和辅助主题词表来消除模型很难处理一词多义、一义多词的现象;根据用户个性化的服务需求,给出了个性化服务的意见。
作者 牛玲
出处 《情报杂志》 CSSCI 北大核心 2006年第6期63-64,67,共3页 Journal of Intelligence
  • 相关文献

参考文献6

  • 1K Shima,M Todoriki,A Suzuki.SVM-Based Feature Selection of Latent Semantic Features.Pattern Recognition Letters,2004;25(9)
  • 2Fabrizio Sebastian.Machine Learning in Automated Text Categorization.ACM Computing Surveys,2002;34(1)
  • 3Thorsten Joachims.A Probabilistic Analysis of the Rocchio Algorithm With TFIDF for Text Categorization.In Proceedings of the 1997 International Conference on Machine Learning (ICML '97),1997
  • 4Harris Drucker et al.Support Vector Machines for Spam Categorization.IEEE Transaction on Neural Network,1999;10(5)
  • 5叶浩,王明文,曾雪强.基于潜在语义的多类文本分类模型研究[J].清华大学学报(自然科学版),2005,45(S1):1818-1822. 被引量:18
  • 6朱华宇,孙正兴,张福炎.一个基于向量空间模型的中文文本自动分类系统[J].计算机工程,2001,27(2):15-17. 被引量:45

二级参考文献8

  • 1曾雪强,王明文,陈素芬.一种基于潜在语义结构的文本分类模型[J].华南理工大学学报(自然科学版),2004,32(z1):99-102. 被引量:27
  • 2邹涛.基于WWW的信息发现技术研究(博士学位论文)[M].南京:南京大学,1999..
  • 3邹涛,博士学位论文,1999年
  • 4Yang Y,Information Retrieval J,1999年
  • 5Yang Y,INRT J,1998年
  • 6吴立德,大规模中文文本处理,1997年,7页
  • 7陈世福,人工智能与知识工程,1997年,391页
  • 8Yang Y,ACM Transactions on Information Systems,1994年

共引文献61

同被引文献10

引证文献2

二级引证文献10

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部