期刊文献+

基于半监督学习算法在文本分类中的应用研究

下载PDF
导出
摘要 本文讨论了基于半监督学习的文本分类算法,在实际信息检索中所面临的一些问题和挑战。对基于监督学习算法的基本原理和流程进行讨论,分析了监督学习方法的优点和存在的不足。针对监督学习方法的缺陷,提出了一种半监督学习算法,通过动态聚类的方法扩大训练样本集,运用经典的KNN分类算法进行文本分类,实现文本信息的快速有效分类。
作者 王敬 李淑英
出处 《信息与电脑》 2015年第9期106-107,共2页 Information & Computer
  • 相关文献

参考文献5

二级参考文献19

  • 1尹锋,林亚平.神经网络汉语自动分词技术[J].软件世界,1996(12):85-88. 被引量:1
  • 2尹锋,林亚平.情报神经网络的设计与应用[J].情报学报,1996,15(3):191-198. 被引量:2
  • 3吴立德,大规模中文文本处理,1997年
  • 4揭春雨,中文信息学报,1989年,3卷,1期,1页
  • 5Salton G,Communications ACM,1975年,18卷,613页
  • 6李小明.北大中文网页自动分类竞赛规则[Z].,2003(3)..
  • 7Text retrieval conference, http://trec. nist. gov (Accessed Sep. 20,2004).
  • 8Yang Y, Pedersen J O. A comparative study on feature selection in text categorization. 1997. http ://eiteseer. ist. psu. edu/yang97comparative. html. ( Accessed Sep. 10,2004).
  • 9Franca Debole, Fabrizio Sebastiani. Supervised Term Weighting for Automated Text Categorization. 2003. http ://citeseer. ist. psu. edu/572661. html ( Accessed Sep. 10,2004).
  • 10Yiming Yang, Xin Liu. A re - examination of text categorization methods. Proceedings of ACM SIGIR Conference on Research and Development in Information Retrieval, 1999:42-49.

共引文献72

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部