期刊文献+

基于支持向量机的文本分类 被引量:1

下载PDF
导出
摘要 随着人工智能方法的发展,智能理解语义的自然语言处理方法日趋成熟,而用计算机对大规模文本进行分类挖掘的需求也与日俱增。本文中,我利用分词工具对人工智能领域的部分论文的摘要进行了分词,并根据其刊登的期刊,对其进行预分类,准备训练数据集和测试数据集。我主要用该数据做了以下工作:首先分词,利用词向量模型对论文摘要分词;然后对文本分类,由支持向量机根据期刊对人工智能的子领域的论文分类;最后进行可视化,利用t-分布邻域嵌入算法工具降维处理。通过以上方法,可以看清人工智能领域论文之间的关系,也证实了支持向量机和具备降维可视化作用的t-分布邻域嵌入算法对文档的分类和处理作用。
作者 陈佳希
机构地区 江苏省淮安中学
出处 《电子世界》 2017年第7期64-64,共1页 Electronics World
  • 相关文献

参考文献2

二级参考文献13

  • 1王建会,王洪伟,申展,胡运发.一种实用高效的文本分类算法[J].计算机研究与发展,2005,42(1):85-93. 被引量:20
  • 2李荣陆,王建会,陈晓云,陶晓鹏,胡运发.使用最大熵模型进行中文文本分类[J].计算机研究与发展,2005,42(1):94-101. 被引量:96
  • 3Gennari J H,Musen MA,et al.The evolution of protg:An environment for knowledge-based systems development[].International Journal of Human-Computer Studies.2003
  • 4Bigi B.Using Kullback-Leibler distance for text categoriza-tion[].Procof theth European Confon Informa-tion Retrieval.2003
  • 5Di Nunzio.A bidimensional viewof documents for text cat-egorization[].Procof theth European Confon In-formation Retrieval Research.2004
  • 6Yang Y,Pedersen J O.A comparative study on feature se-lection in text categorization[].Procof theth Int’l Confon Machine Learning.1997
  • 7Hull D A.Improving text retrieval for the routing problem u-sing latent semantic indexing[].Procof SIGIR-th ACMInternational Conference on Research and Development in Information Retrieval.1994
  • 8Masand B,Linoff G,Waltz D.Classifying news stories u-sing memory based reasoning[].th Annual IntACM SIGIR Conference on Research and Development in Infor-mation Retrieval.1992
  • 9Joachims T.Text categorization with support vector ma-chines:Learning with many relevant features[].Pro-ceedings of ECML-th European Conference on Ma-chine Learning.1998
  • 10Salton G,Wong A,Yang CS.A vector space model for automatic indexing[].Communications of the ACM.1975

共引文献392

同被引文献4

引证文献1

二级引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部